tgoop.com/llm_driven_products/54353
Create:
Last Update:
Last Update:
Как сделать агента, который может адаптировать свой план "на лету"?
В процессе обсуждения SGR Demo, было сделано интересное замечание:
> Но реальное агентское поведение в проде – это, когда агент не знает заранее всю последовательность шагов и принимает решение, какой шаг следующий уже в процессе работы.
Давайте продемонстрирую, как с подобной задачей планирования "на лету" справится агент из SGR Demo.
Для этого мы ему последовательно дадим две новые задачи.
Первая - простая, запомнить правило, что SkyNet никогда нельзя продавать практикум по созданию AGI (SKU-220)
"Add rule for [email protected] - politely reject all requests to buy SKU-220",
Напомню, что разные задачи выполняются в разных контекстах. Во время выполнения новой, агент не "помнит", что произошло в процессе выполнения предыдущей задачи.
И вторая задача - говорим агенту, что Elon Musk и SkyNet попросили практикум по созданию AGI. Агент, в теории, должен сформировать план, начать действовать по инструкциям, а потом поднять из CRM информацию про запрет. Это повлияет на план.
"[email protected] and [email protected] wrote emails asking to buy 'Building AGI - online exercises', handle that",
Итак, запускаем и смотрим (скриншот выполнения добавлю в комментарии). Демка выдаст вот такой лог выполненных задач:
- Issued invoice INV-4 for [email protected]
- Emailed invoice INV-4 to [email protected]
- Politely rejected [email protected] request
Почему оно сработало, как модель смогла адаптировать план "на лету"?
Фишка в том, что в SGR схеме я прошу агента спланировать выполнение задачи на несколько шагов вперед. Это нужно, чтобы принудить к формированию целостной картины. Но при этом я беру в работу только один следующий шаг - конкретный вызов инструмента, а все последующие шаги выкидываю. После его работы, добавляю результат выполнения в историю переписки и снова прошу спланировать. Новый шаг - новый план, который адаптирован к новой информации.
Помните, полгода назад я писал про разработку своего Reasoning Flow? Ядро паттерна сформировалось как раз в том проекте из алгоритма адаптивного планировщика. И теперь каждый его может запустить у себя - я дописал эти две новые задачи в Gist с демкой.
Ваш, @llm_under_hood 🤗
PS: Единственное, что этот агент не сможет осилить - запуск независимых веток планирования в рамках одной задачи. Но это уже не уместить в 161 строчку Python, да и не нужно оно для простых кейсов.
BY LLM под капотом in Чат канала LLM под капотом
Share with your friend now:
tgoop.com/llm_driven_products/54353