Warning: mkdir(): No space left on device in /var/www/tgoop/post.php on line 37

Warning: file_put_contents(aCache/aDaily/post/best_in_development/--): Failed to open stream: No such file or directory in /var/www/tgoop/post.php on line 50
ИИ и роботы в стройке@best_in_development P.2009
BEST_IN_DEVELOPMENT Telegram 2009
#учимся Self-RAG: умный поиск с самоконтролем

Когда вы создаёте чат-бота для поиска по внутренним документам — по базе знаний, кадровой политике, технической документации или нормативке — главное требование — точность ответов. Для проектировщиков — особенно.

Изначально для таких задач была придумана RAG, которая по запросу пользователя ищет релевантные фрагменты в векторной базе, передает их LLM, которая на их основе генерирует ответ.

В 2023 году исследовательская группа из Google и Университета Карнеги-Меллона (CMU) предложила новую архитектуру.

Что такое Self-RAG
Авторы предложили обучить LLM не только генерировать текст, но и самостоятельно управлять процессом поиска (retrieve) и оценивать качество ответа (critic). Для этого — использовать обучающие сигналы в виде специальных токенов, встроенные в последовательность генерации.

Таким образом Self-RAG — это усовершенствованный подход к RAG, где языковая модель сама решает, когда нужен поиск, и оценивает качество своего ответа. Отличия от классического RAG — ниже:

🔵Обычный RAG: один запрос — один поиск — один ответ. Риск галлюцинаций снижен по сравнению просто с ответом от LLM, но все еще есть.

🔵В Self-RAG модель генерирует управляющие токены:
retrieve — нужно больше данных → запускается поиск.
critic — оценка достоверности ответа.

Токены добавляют модели способность «сомневаться». При сомнениях она может приостановить генерацию, запросить новые документы, перепроверить факты, перегенерировать весь ответ или его часть.

📎 Ограничения Self-RAG
Нужно учить на специально размеченных для рефлексии данных, плюс медленнее выдает ответ из-за нескольких итераций поиска.

Зачем это нужно
Снижает галлюцинации, повышает точность и доверие к ответам — особенно важно для корпоративных баз знаний, где критична достоверность. Self-RAG — это шаг на пути к более автономным и рефлексивным ИИ-агентам.

Где посмотреть
🔵Репозиторий Self-RAG от Акари Асаи, которая входила в группу авторов статьи выше.
🔵Еще вариант от langgraph (платформы для создания, управления и развертывания ИИ-агентов).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11👌10👏94



tgoop.com/best_in_development/2009
Create:
Last Update:

#учимся Self-RAG: умный поиск с самоконтролем

Когда вы создаёте чат-бота для поиска по внутренним документам — по базе знаний, кадровой политике, технической документации или нормативке — главное требование — точность ответов. Для проектировщиков — особенно.

Изначально для таких задач была придумана RAG, которая по запросу пользователя ищет релевантные фрагменты в векторной базе, передает их LLM, которая на их основе генерирует ответ.

В 2023 году исследовательская группа из Google и Университета Карнеги-Меллона (CMU) предложила новую архитектуру.

Что такое Self-RAG
Авторы предложили обучить LLM не только генерировать текст, но и самостоятельно управлять процессом поиска (retrieve) и оценивать качество ответа (critic). Для этого — использовать обучающие сигналы в виде специальных токенов, встроенные в последовательность генерации.

Таким образом Self-RAG — это усовершенствованный подход к RAG, где языковая модель сама решает, когда нужен поиск, и оценивает качество своего ответа. Отличия от классического RAG — ниже:

🔵Обычный RAG: один запрос — один поиск — один ответ. Риск галлюцинаций снижен по сравнению просто с ответом от LLM, но все еще есть.

🔵В Self-RAG модель генерирует управляющие токены:
retrieve — нужно больше данных → запускается поиск.
critic — оценка достоверности ответа.

Токены добавляют модели способность «сомневаться». При сомнениях она может приостановить генерацию, запросить новые документы, перепроверить факты, перегенерировать весь ответ или его часть.

📎 Ограничения Self-RAG
Нужно учить на специально размеченных для рефлексии данных, плюс медленнее выдает ответ из-за нескольких итераций поиска.

Зачем это нужно
Снижает галлюцинации, повышает точность и доверие к ответам — особенно важно для корпоративных баз знаний, где критична достоверность. Self-RAG — это шаг на пути к более автономным и рефлексивным ИИ-агентам.

Где посмотреть
🔵Репозиторий Self-RAG от Акари Асаи, которая входила в группу авторов статьи выше.
🔵Еще вариант от langgraph (платформы для создания, управления и развертывания ИИ-агентов).

BY ИИ и роботы в стройке




Share with your friend now:
tgoop.com/best_in_development/2009

View MORE
Open in Telegram


Telegram News

Date: |

Those being doxxed include outgoing Chief Executive Carrie Lam Cheng Yuet-ngor, Chung and police assistant commissioner Joe Chan Tung, who heads police's cyber security and technology crime bureau. There have been several contributions to the group with members posting voice notes of screaming, yelling, groaning, and wailing in different rhythms and pitches. Calling out the “degenerate” community or the crypto obsessives that engage in high-risk trading, Co-founder of NFT renting protocol Rentable World emiliano.eth shared this group on his Twitter. He wrote: “hey degen, are you stressed? Just let it out all out. Voice only tg channel for screaming”. Clear For crypto enthusiasts, there was the “gm” app, a self-described “meme app” which only allowed users to greet each other with “gm,” or “good morning,” a common acronym thrown around on Crypto Twitter and Discord. But the gm app was shut down back in September after a hacker reportedly gained access to user data. To edit your name or bio, click the Menu icon and select “Manage Channel.”
from us


Telegram ИИ и роботы в стройке
FROM American