tgoop.com/best_in_development/1552
Create:
Last Update:
Last Update:
Что такое RAG, и чем она хороша для поиска по нормативке
RAG (Retrieval-Augmented Generation) — технология, которая помогает большим языковым моделям (LLM) давать более точные ответы на запросы пользователей.
Справочно
RAG объединяет две технологии: поиск данных и генерацию ответов. Перед тем, как передавать запрос в LLM, RAG-система его дополняет. Происходит это в три шага:
1. Извлечение (Retriever). Система ищет релевантные данные в базе знаний. Это может быть поиск по ключевым словам, семантический поиск или работа с векторными представлениями текста. Задача извлечения — найти информацию, которая лучше всего подходит к запросу пользователя.
2. Аугментация (Augmentation). Извлечённые данные объединяются с запросом. Система формирует единый текст промпта, в котором объединяет запрос пользователя и найденные данные.
3. Генерация ответа (Generator). Большая языковая модель генерирует ответ. Она анализирует промпт и дополненные данные (контекст), чтобы дать точный ответ.
RAG используется при решении разных задач: от анализа документов и создания интеллектуальных помощников до построения поисковых систем.
Некоторые преимущества RAG перед LLM
Вот на такой RAG работает бот для поиска ответов на вопросы по стройке. Бот выдает релевантную информацию по актуальной российской нормативной базе.
Попробовать можно тут —
@Pdflyx_bot