AI Projects@turboproject P.2215

AI Projects

Пока Anthropic хайповал на своем 30 часовом агенте у партнёра, у него утащили реальный научный приоритет в агентах для долгосрочной работы.

Это все серьёзно, поэтому статью публикует по факту главный научный журнал в мире Nature, где редакторы обычно отвергают статьи вендоров ИИ как плохо проверенные, о мусоре с arxiv и говорить нечего.

В чем тут прорыв? Кажется поймали вариант группы агентов по планированию сложных задач, что как минимум смягчает самый сложный момент для ИИ как стратегическое планирование автономной деятельности. Предлагаемый Modular Agentic Planner (MAP) как минимум проходит разные тесты на планирование стратегии (ToH, PlanBench, StrategyQA)

Идея заключается в том, чтобы уйти от примитивных ToDo списков задач к декомпозиции их вглубь как Work Breakdown Structure (WBS). Сам WBS создаётся итеративно. Actor предлагает действия, Monitor контролирует возможность их и отсутствие ошибок, Predictor моделирует состояние целевой системы после такого действия (последствия), Evaluator оценивает как в PCAM насколько есть соответствие целям последствий действия. Orchestrator уже принимает их и вносит поправки в план. Это все отдельные агенты.

Повторить схему довольно просто и судя по тестам это не хайп, а довольно эффективно

https://www.nature.com/articles/s41467-025-63804-5

Nature

A brain-inspired agentic architecture to improve planning with LLMs

Nature Communications - Multi-step planning is a challenge for LLMs. Here, the authors introduce a brain-inspired Modular Agentic Planner that decomposes planning into specialized LLM modules,...