AAANALYTICS Telegram 892
Первая LLM, которую мы успешно дообучили в Альфе 🔥

LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.

Мы начали с задачи оценки ответов операторов.

«Дообучение LLM — неизбежный шаг при создании современных, качественных AI-систем. Когда все «низковисящие фрукты» уже собраны, наступает момент, когда модель необходимо дообучать напрямую, чтобы продолжать улучшать её качество. К счастью, существуют легковесные методы, которые позволяют делать это эффективно и без серьёзных затрат на инфраструктуру.

Особенно важно, что даже этих облегчённых подходов оказалось достаточно, чтобы достичь более высокого качества по сравнению с классическими решениями на базе BERT, которые долгое время считались золотым стандартом в задачах классификации.

Это значимый прецедент успешного дообучения LLM в Альфе, который меняет подход: теперь LLM применимы не только для генерации текста, но и для более узких задач, которые раньше решались отдельными моделями, обученными на большом объёме размеченных данных»,

— Александр Сенин, руководитель Центра компетенций Natural Language Processing

На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆

Спойлер: удалось добиться стабильной высокой точности без перехода на внешние решения.

#aaa_hardposting
23🔥157👌1🙈1



tgoop.com/aaanalytics/892
Create:
Last Update:

Первая LLM, которую мы успешно дообучили в Альфе 🔥

LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.

Мы начали с задачи оценки ответов операторов.

«Дообучение LLM — неизбежный шаг при создании современных, качественных AI-систем. Когда все «низковисящие фрукты» уже собраны, наступает момент, когда модель необходимо дообучать напрямую, чтобы продолжать улучшать её качество. К счастью, существуют легковесные методы, которые позволяют делать это эффективно и без серьёзных затрат на инфраструктуру.

Особенно важно, что даже этих облегчённых подходов оказалось достаточно, чтобы достичь более высокого качества по сравнению с классическими решениями на базе BERT, которые долгое время считались золотым стандартом в задачах классификации.

Это значимый прецедент успешного дообучения LLM в Альфе, который меняет подход: теперь LLM применимы не только для генерации текста, но и для более узких задач, которые раньше решались отдельными моделями, обученными на большом объёме размеченных данных»,

— Александр Сенин, руководитель Центра компетенций Natural Language Processing

На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆

Спойлер: удалось добиться стабильной высокой точности без перехода на внешние решения.

#aaa_hardposting

BY Alfa Advanced Analytics










Share with your friend now:
tgoop.com/aaanalytics/892

View MORE
Open in Telegram


Telegram News

Date: |

Hashtags 2How to set up a Telegram channel? (A step-by-step tutorial) Ng Man-ho, a 27-year-old computer technician, was convicted last month of seven counts of incitement charges after he made use of the 100,000-member Chinese-language channel that he runs and manages to post "seditious messages," which had been shut down since August 2020. Telegram users themselves will be able to flag and report potentially false content. Telegram Android app: Open the chats list, click the menu icon and select “New Channel.”
from us


Telegram Alfa Advanced Analytics
FROM American