SCIENTIFIC_OPENSOURCE Telegram 148
На недавно прошедшем митапе (видео докладов и фото скоро будут) докладчикам поступало много вопросов про пределы возможностей ИИ для разработки ПО.

В связи с этим, хочется упомянуть про интересное направление "моделей мира".
Коллеги из ICT Moscow на днях опубликовали как раз опубликовали обзор про таковые.

Помимо применимость для задач общего назначения - это довольно актуальное направление развития AI4Code.
Так, буквально на днях была выложена открытая Code World Model с 32B параметров - https://github.com/facebookresearch/cwm

В чем тут идея таких моделей в контексте работы с кодом (процитирую тут разбор) - в отличие от привычных LLM, они могут:
- Симулировать выполнение без запуска (даем ей код с аргументами, она предскажет результат)
- Планировать исправления (будет понимать, какие изменения к каким последствиям приведут)
- Работать как дебаггер (может прыгнуть к любой строке и предсказать состояние)

Направление пока скорее исследовательское, но результаты на бенчмарках уже вполне достойные:
"CWM offers strong performance on general coding and math tasks: it reaches pass@1 scores of 65.8 % on SWE-bench Verified (with test-time scaling), 68.6 % on LiveCodeBench, 96.6 % on Math-500, and 76.0 % on AIME 2024"
🔥94



tgoop.com/scientific_opensource/148
Create:
Last Update:

На недавно прошедшем митапе (видео докладов и фото скоро будут) докладчикам поступало много вопросов про пределы возможностей ИИ для разработки ПО.

В связи с этим, хочется упомянуть про интересное направление "моделей мира".
Коллеги из ICT Moscow на днях опубликовали как раз опубликовали обзор про таковые.

Помимо применимость для задач общего назначения - это довольно актуальное направление развития AI4Code.
Так, буквально на днях была выложена открытая Code World Model с 32B параметров - https://github.com/facebookresearch/cwm

В чем тут идея таких моделей в контексте работы с кодом (процитирую тут разбор) - в отличие от привычных LLM, они могут:
- Симулировать выполнение без запуска (даем ей код с аргументами, она предскажет результат)
- Планировать исправления (будет понимать, какие изменения к каким последствиям приведут)
- Работать как дебаггер (может прыгнуть к любой строке и предсказать состояние)

Направление пока скорее исследовательское, но результаты на бенчмарках уже вполне достойные:
"CWM offers strong performance on general coding and math tasks: it reaches pass@1 scores of 65.8 % on SWE-bench Verified (with test-time scaling), 68.6 % on LiveCodeBench, 96.6 % on Math-500, and 76.0 % on AIME 2024"

BY Научный опенсорс


Share with your friend now:
tgoop.com/scientific_opensource/148

View MORE
Open in Telegram


Telegram News

Date: |

Select “New Channel” It’s easy to create a Telegram channel via desktop app or mobile app (for Android and iOS): When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name. 5Telegram Channel avatar size/dimensions A few years ago, you had to use a special bot to run a poll on Telegram. Now you can easily do that yourself in two clicks. Hit the Menu icon and select “Create Poll.” Write your question and add up to 10 options. Running polls is a powerful strategy for getting feedback from your audience. If you’re considering the possibility of modifying your channel in any way, be sure to ask your subscribers’ opinions first.
from us


Telegram Научный опенсорс
FROM American