STARTUP_CUSTDEV Telegram 179
Дизайн агентов: инструменты

Агентов от привычного нам чата отличает возможность взаимодействия с внешним миром. Делают они это посредством использования инструментов: что-то загуглить, занести встречу в календарь, отправить имейл. Какие паттерны взаимодействия с ними существуют?

Года два назад OpenAI впервые ввели tool calling – возможность для модели вызывать внешние функции. Вы предоставляете описание, название и параметры функции и LLM понимает, когда ее стоит вызвать.

{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get the current weather for a U.S. city.",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "City and state, e.g. 'New York, NY'.",
"default": "New York, NY"
},
},
"required": ["location"]
}
}
}


Для простых задач такой воркфлоу может подойти, когда вызовов немного и они односложные. Что делать в ситуациях, когда у нас множество функций, а задача становится сложнее?

Plan and Execute – глобальный уровень

Сначала планируем, затем выполняем. Звучит довольно просто: есть два прохода для выполнения задачи. На первом мы разбиваем цель пользователя на подзадачи и составляем to-do лист. На втором проходе мы отдаем подзадачу на выполнение исполнителю. Исполнитель может быть любым: стандартный tool calling, ReAct или что-то другое.

Вы могли видеть такое у курсора. Если ему сказать поменять часть кода, то он сначала сделает to-do список, который постепенно будет выполняться.

ReAct – локальный уровень

Что если подзадачу нельзя выполнить за один вызов LLM и функции? Делаем цикл!

Рассуждения -> Действие -> Наблюдение


Модель входит в цикл, пока не решает остановиться либо же не достигнет лимита шагов. На каждом шаге она размышляет в явном виде (Рассуждение), затем вызывает функцию (Действие) и смотрит на ее результат (Наблюдение). Таким образом модель может совершать сложные цепочки действий, требующие нескольких шагов за раз. Открыть календарь, найти свободную дату и записать вас в кальянную.
👍52🔥2



tgoop.com/startup_custdev/179
Create:
Last Update:

Дизайн агентов: инструменты

Агентов от привычного нам чата отличает возможность взаимодействия с внешним миром. Делают они это посредством использования инструментов: что-то загуглить, занести встречу в календарь, отправить имейл. Какие паттерны взаимодействия с ними существуют?

Года два назад OpenAI впервые ввели tool calling – возможность для модели вызывать внешние функции. Вы предоставляете описание, название и параметры функции и LLM понимает, когда ее стоит вызвать.

{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get the current weather for a U.S. city.",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "City and state, e.g. 'New York, NY'.",
"default": "New York, NY"
},
},
"required": ["location"]
}
}
}


Для простых задач такой воркфлоу может подойти, когда вызовов немного и они односложные. Что делать в ситуациях, когда у нас множество функций, а задача становится сложнее?

Plan and Execute – глобальный уровень

Сначала планируем, затем выполняем. Звучит довольно просто: есть два прохода для выполнения задачи. На первом мы разбиваем цель пользователя на подзадачи и составляем to-do лист. На втором проходе мы отдаем подзадачу на выполнение исполнителю. Исполнитель может быть любым: стандартный tool calling, ReAct или что-то другое.

Вы могли видеть такое у курсора. Если ему сказать поменять часть кода, то он сначала сделает to-do список, который постепенно будет выполняться.

ReAct – локальный уровень

Что если подзадачу нельзя выполнить за один вызов LLM и функции? Делаем цикл!

Рассуждения -> Действие -> Наблюдение


Модель входит в цикл, пока не решает остановиться либо же не достигнет лимита шагов. На каждом шаге она размышляет в явном виде (Рассуждение), затем вызывает функцию (Действие) и смотрит на ее результат (Наблюдение). Таким образом модель может совершать сложные цепочки действий, требующие нескольких шагов за раз. Открыть календарь, найти свободную дату и записать вас в кальянную.

BY Идеальный стартап




Share with your friend now:
tgoop.com/startup_custdev/179

View MORE
Open in Telegram


Telegram News

Date: |

Don’t publish new content at nighttime. Since not all users disable notifications for the night, you risk inadvertently disturbing them. Deputy District Judge Peter Hui sentenced computer technician Ng Man-ho on Thursday, a month after the 27-year-old, who ran a Telegram group called SUCK Channel, was found guilty of seven charges of conspiring to incite others to commit illegal acts during the 2019 extradition bill protests and subsequent months. 1What is Telegram Channels? SUCK Channel Telegram Click “Save” ;
from us


Telegram Идеальный стартап
FROM American