LLM на стероидах: Что такое ReAct и почему он опускает обычный RAG?
Представим, что у нас есть чат-бот, который отвечает на вопросы по загруженной базе документов (RAG чат-бот). Вроде круто, но что если нам нужно, чтобы он не просто в документах копался, а еще и как-то с внешним миром взаимодействовал?
Например, мог: 🟣 Узнать погоду 🟡 Проверить статус заказа по API 🔵 Узнать текущий курс битка, чтобы фиксануть прибыль 📉 🟢 Ну или сделать деп, потом додеп и супер мега ласт додеп 😩
Обычная LLMка либо рассуждает и отвечает на основе текста, либо вызывает какой-то один инструмент, например, RAG. Она не может делать и то, и другое одновременно.
И вот тут на сцену врывается с двух ног ReAct-архитектура (Reason + Act). Такой агент - настоящий гигачад, потому что он умеет чередовать рассуждения с действиями (вызовами функций, или Tools) для взаимодействия с миром.
Агент анализирует запрос пользователя и сам решает, что делать дальше: 🟣 задать уточняющий вопрос 🟡 полезть в базу знаний 🔵 дёрнуть внешний API 🟢 сделать додеп 📈 🟡 или сразу выдать окончательный ответ
Структура ReAct Agent 1️⃣LLM — это ядро и мозг агента. Анализирует запрос, выбирает следующий шаг и генерирует ответ. 2️⃣Thinking — «мышление» агента. На этом этапе он решает: использовать какой-то инструмент (пойти в RAG, вызвать API) или продолжить диалог с пользователем. 3️⃣Tools — список доступных агенту инструментов. Это может быть что угодно: векторная база, внешний API, калькулятор, SQL-база — всё, что нужно для работы.
Как это работает на практике?🐵
Допустим, мы спрашиваем: «Хочу сделать додеп на 100 баксов в слоты, есть какие-нибудь бонусы?» 💀
🟣Агент думает (Reason): «Окей, чел хочет закинуть сотку. Надо проверить его текущий баланс и глянуть, есть ли для него жирные бонусы на деп». 🟡Агент действует (Act): Дёргает внутренний API, чтобы проверить баланс юзера. Баланс: $15. 🔵Агент снова действует (Act): Летит в API казино и проверяет доступные акции. Нашёл: 'Бонус +50% на депозит от $100'. 🟢Агент думает и отвечает (Reason & Act): Собирает всё вместе и выдаёт ответ: «Твой баланс $15. Сейчас есть акция: закидывай от сотки и получишь +50% сверху. Делаем додеп?» После согласия пользователя агент может инициировать транзакцию через API платёжного шлюза.
Итог: ReAct Agent превращает LLMку из обычного генератора текста в полноценного ассистента, который умеет взаимодействовать с внешним миром и реально решать задачи, а не просто болтать. Короче, это база! 🌟
LLM на стероидах: Что такое ReAct и почему он опускает обычный RAG?
Представим, что у нас есть чат-бот, который отвечает на вопросы по загруженной базе документов (RAG чат-бот). Вроде круто, но что если нам нужно, чтобы он не просто в документах копался, а еще и как-то с внешним миром взаимодействовал?
Например, мог: 🟣 Узнать погоду 🟡 Проверить статус заказа по API 🔵 Узнать текущий курс битка, чтобы фиксануть прибыль 📉 🟢 Ну или сделать деп, потом додеп и супер мега ласт додеп 😩
Обычная LLMка либо рассуждает и отвечает на основе текста, либо вызывает какой-то один инструмент, например, RAG. Она не может делать и то, и другое одновременно.
И вот тут на сцену врывается с двух ног ReAct-архитектура (Reason + Act). Такой агент - настоящий гигачад, потому что он умеет чередовать рассуждения с действиями (вызовами функций, или Tools) для взаимодействия с миром.
Агент анализирует запрос пользователя и сам решает, что делать дальше: 🟣 задать уточняющий вопрос 🟡 полезть в базу знаний 🔵 дёрнуть внешний API 🟢 сделать додеп 📈 🟡 или сразу выдать окончательный ответ
Структура ReAct Agent 1️⃣LLM — это ядро и мозг агента. Анализирует запрос, выбирает следующий шаг и генерирует ответ. 2️⃣Thinking — «мышление» агента. На этом этапе он решает: использовать какой-то инструмент (пойти в RAG, вызвать API) или продолжить диалог с пользователем. 3️⃣Tools — список доступных агенту инструментов. Это может быть что угодно: векторная база, внешний API, калькулятор, SQL-база — всё, что нужно для работы.
Как это работает на практике?🐵
Допустим, мы спрашиваем: «Хочу сделать додеп на 100 баксов в слоты, есть какие-нибудь бонусы?» 💀
🟣Агент думает (Reason): «Окей, чел хочет закинуть сотку. Надо проверить его текущий баланс и глянуть, есть ли для него жирные бонусы на деп». 🟡Агент действует (Act): Дёргает внутренний API, чтобы проверить баланс юзера. Баланс: $15. 🔵Агент снова действует (Act): Летит в API казино и проверяет доступные акции. Нашёл: 'Бонус +50% на депозит от $100'. 🟢Агент думает и отвечает (Reason & Act): Собирает всё вместе и выдаёт ответ: «Твой баланс $15. Сейчас есть акция: закидывай от сотки и получишь +50% сверху. Делаем додеп?» После согласия пользователя агент может инициировать транзакцию через API платёжного шлюза.
Итог: ReAct Agent превращает LLMку из обычного генератора текста в полноценного ассистента, который умеет взаимодействовать с внешним миром и реально решать задачи, а не просто болтать. Короче, это база! 🌟
The SUCK Channel on Telegram, with a message saying some content has been removed by the police. Photo: Telegram screenshot. Some Telegram Channels content management tips Although some crypto traders have moved toward screaming as a coping mechanism, several mental health experts call this therapy a pseudoscience. The crypto community finds its way to engage in one or the other way and share its feelings with other fellow members. With the “Bear Market Screaming Therapy Group,” we’ve now transcended language. The main design elements of your Telegram channel include a name, bio (brief description), and avatar. Your bio should be:
from us