tgoop.com/scientific_opensource/148
Last Update:
На недавно прошедшем митапе (видео докладов и фото скоро будут) докладчикам поступало много вопросов про пределы возможностей ИИ для разработки ПО.
В связи с этим, хочется упомянуть про интересное направление "моделей мира".
Коллеги из ICT Moscow на днях опубликовали как раз опубликовали обзор про таковые.
Помимо применимость для задач общего назначения - это довольно актуальное направление развития AI4Code.
Так, буквально на днях была выложена открытая Code World Model с 32B параметров - https://github.com/facebookresearch/cwm
В чем тут идея таких моделей в контексте работы с кодом (процитирую тут разбор) - в отличие от привычных LLM, они могут:
- Симулировать выполнение без запуска (даем ей код с аргументами, она предскажет результат)
- Планировать исправления (будет понимать, какие изменения к каким последствиям приведут)
- Работать как дебаггер (может прыгнуть к любой строке и предсказать состояние)
Направление пока скорее исследовательское, но результаты на бенчмарках уже вполне достойные:
"CWM offers strong performance on general coding and math tasks: it reaches pass@1 scores of 65.8 % on SWE-bench Verified (with test-time scaling), 68.6 % on LiveCodeBench, 96.6 % on Math-500, and 76.0 % on AIME 2024"
BY Научный опенсорс
Share with your friend now:
tgoop.com/scientific_opensource/148
