MACHINELEARNING_BOOKS Telegram 1165
📚 Новая работа исследователей сравнивает два способа подключения LLM к учебным материалам, чтобы их ответы были точнее и полезнее.

Обычные LLM часто дают неверные или устаревшие факты. Решение - Retrieval Augmented Generation (RAG), где модель ищет ответы в курсах и книгах вместо «догадок».

🔹 Метод 1: vector search
- Ищет текстовые фрагменты, похожие по смыслу на вопрос.
- Быстрый, дешёвый, отлично подходит для фактов и коротких запросов.

🔹 Метод 2: graph search
- Строит сеть связанных идей из текста.
- Помогает отвечать на вопросы про широкие темы и делать подробные объяснения.
- Но работает медленнее и требует в 10–20 раз больше ресурсов.

Для эксперимента авторы создали датасет EduScopeQA (3 176 вопросов по истории, литературе, науке и компьютерным наукам). Тестировали даже на изменённых учебниках, чтобы проверить, смогут ли модели избежать устаревших знаний.

📊 Результаты:
- Vector search - лучше для коротких, фактологических вопросов.
- GraphRAG Global - лучший для общих тем и широких вопросов.
- GraphRAG Local - сильнее всего, когда учебники длинные и подробные.

Итог: исследователи собрали routing system, которая отправляет каждый вопрос к оптимальному методу. Это позволяет сохранять точность и не тратить лишние ресурсы на графовый поиск.

📝 Paper: https://arxiv.org/abs/2509.07846v1

#LLM #RAG #Education #VectorSearch #GraphSearch #AIResearch
👍73🔥1



tgoop.com/machinelearning_books/1165
Create:
Last Update:

📚 Новая работа исследователей сравнивает два способа подключения LLM к учебным материалам, чтобы их ответы были точнее и полезнее.

Обычные LLM часто дают неверные или устаревшие факты. Решение - Retrieval Augmented Generation (RAG), где модель ищет ответы в курсах и книгах вместо «догадок».

🔹 Метод 1: vector search
- Ищет текстовые фрагменты, похожие по смыслу на вопрос.
- Быстрый, дешёвый, отлично подходит для фактов и коротких запросов.

🔹 Метод 2: graph search
- Строит сеть связанных идей из текста.
- Помогает отвечать на вопросы про широкие темы и делать подробные объяснения.
- Но работает медленнее и требует в 10–20 раз больше ресурсов.

Для эксперимента авторы создали датасет EduScopeQA (3 176 вопросов по истории, литературе, науке и компьютерным наукам). Тестировали даже на изменённых учебниках, чтобы проверить, смогут ли модели избежать устаревших знаний.

📊 Результаты:
- Vector search - лучше для коротких, фактологических вопросов.
- GraphRAG Global - лучший для общих тем и широких вопросов.
- GraphRAG Local - сильнее всего, когда учебники длинные и подробные.

Итог: исследователи собрали routing system, которая отправляет каждый вопрос к оптимальному методу. Это позволяет сохранять точность и не тратить лишние ресурсы на графовый поиск.

📝 Paper: https://arxiv.org/abs/2509.07846v1

#LLM #RAG #Education #VectorSearch #GraphSearch #AIResearch

BY Машиннное обучение | Наука о данных Библиотека




Share with your friend now:
tgoop.com/machinelearning_books/1165

View MORE
Open in Telegram


Telegram News

Date: |

Done! Now you’re the proud owner of a Telegram channel. The next step is to set up and customize your channel. Choose quality over quantity. Remember that one high-quality post is better than five short publications of questionable value. It’s yet another bloodbath on Satoshi Street. As of press time, Bitcoin (BTC) and the broader cryptocurrency market have corrected another 10 percent amid a massive sell-off. Ethereum (EHT) is down a staggering 15 percent moving close to $1,000, down more than 42 percent on the weekly chart. The creator of the channel becomes its administrator by default. If you need help managing your channel, you can add more administrators from your subscriber base. You can provide each admin with limited or full rights to manage the channel. For example, you can allow an administrator to publish and edit content while withholding the right to add new subscribers. How to Create a Private or Public Channel on Telegram?
from us


Telegram Машиннное обучение | Наука о данных Библиотека
FROM American