TURBOPROJECT Telegram 2215
Пока Anthropic хайповал на своем 30 часовом агенте у партнёра, у него утащили реальный научный приоритет в агентах для долгосрочной работы.

Это все серьёзно, поэтому статью публикует по факту главный научный журнал в мире Nature, где редакторы обычно отвергают статьи вендоров ИИ как плохо проверенные, о мусоре с arxiv и говорить нечего.

В чем тут прорыв? Кажется поймали вариант группы агентов по планированию сложных задач, что как минимум смягчает самый сложный момент для ИИ как стратегическое планирование автономной деятельности. Предлагаемый Modular Agentic Planner (MAP) как минимум проходит разные тесты на планирование стратегии (ToH, PlanBench, StrategyQA)


Идея заключается в том, чтобы уйти от примитивных ToDo списков задач к декомпозиции их вглубь как Work Breakdown Structure (WBS). Сам WBS создаётся итеративно. Actor предлагает действия, Monitor контролирует возможность их и отсутствие ошибок, Predictor моделирует состояние целевой системы после такого действия (последствия), Evaluator оценивает как в PCAM насколько есть соответствие целям последствий действия. Orchestrator уже принимает их и вносит поправки в план. Это все отдельные агенты.

Повторить схему довольно просто и судя по тестам это не хайп, а довольно эффективно

https://www.nature.com/articles/s41467-025-63804-5
15👍8🔥52🤩1😍1🏆1



tgoop.com/turboproject/2215
Create:
Last Update:

Пока Anthropic хайповал на своем 30 часовом агенте у партнёра, у него утащили реальный научный приоритет в агентах для долгосрочной работы.

Это все серьёзно, поэтому статью публикует по факту главный научный журнал в мире Nature, где редакторы обычно отвергают статьи вендоров ИИ как плохо проверенные, о мусоре с arxiv и говорить нечего.

В чем тут прорыв? Кажется поймали вариант группы агентов по планированию сложных задач, что как минимум смягчает самый сложный момент для ИИ как стратегическое планирование автономной деятельности. Предлагаемый Modular Agentic Planner (MAP) как минимум проходит разные тесты на планирование стратегии (ToH, PlanBench, StrategyQA)


Идея заключается в том, чтобы уйти от примитивных ToDo списков задач к декомпозиции их вглубь как Work Breakdown Structure (WBS). Сам WBS создаётся итеративно. Actor предлагает действия, Monitor контролирует возможность их и отсутствие ошибок, Predictor моделирует состояние целевой системы после такого действия (последствия), Evaluator оценивает как в PCAM насколько есть соответствие целям последствий действия. Orchestrator уже принимает их и вносит поправки в план. Это все отдельные агенты.

Повторить схему довольно просто и судя по тестам это не хайп, а довольно эффективно

https://www.nature.com/articles/s41467-025-63804-5

BY AI Projects




Share with your friend now:
tgoop.com/turboproject/2215

View MORE
Open in Telegram


Telegram News

Date: |

How to create a business channel on Telegram? (Tutorial) Telegram Android app: Open the chats list, click the menu icon and select “New Channel.” Administrators In 2018, Telegram’s audience reached 200 million people, with 500,000 new users joining the messenger every day. It was launched for iOS on 14 August 2013 and Android on 20 October 2013. Public channels are public to the internet, regardless of whether or not they are subscribed. A public channel is displayed in search results and has a short address (link).
from us


Telegram AI Projects
FROM American