AAANALYTICS Telegram 890
Первая LLM, которую мы успешно дообучили в Альфе 🔥

LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.

Мы начали с задачи оценки ответов операторов.

«Дообучение LLM — неизбежный шаг при создании современных, качественных AI-систем. Когда все «низковисящие фрукты» уже собраны, наступает момент, когда модель необходимо дообучать напрямую, чтобы продолжать улучшать её качество. К счастью, существуют легковесные методы, которые позволяют делать это эффективно и без серьёзных затрат на инфраструктуру.

Особенно важно, что даже этих облегчённых подходов оказалось достаточно, чтобы достичь более высокого качества по сравнению с классическими решениями на базе BERT, которые долгое время считались золотым стандартом в задачах классификации.

Это значимый прецедент успешного дообучения LLM в Альфе, который меняет подход: теперь LLM применимы не только для генерации текста, но и для более узких задач, которые раньше решались отдельными моделями, обученными на большом объёме размеченных данных»,

— Александр Сенин, руководитель Центра компетенций Natural Language Processing

На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆

Спойлер: удалось добиться стабильной высокой точности без перехода на внешние решения.

#aaa_hardposting
23🔥157👌1🙈1



tgoop.com/aaanalytics/890
Create:
Last Update:

Первая LLM, которую мы успешно дообучили в Альфе 🔥

LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.

Мы начали с задачи оценки ответов операторов.

«Дообучение LLM — неизбежный шаг при создании современных, качественных AI-систем. Когда все «низковисящие фрукты» уже собраны, наступает момент, когда модель необходимо дообучать напрямую, чтобы продолжать улучшать её качество. К счастью, существуют легковесные методы, которые позволяют делать это эффективно и без серьёзных затрат на инфраструктуру.

Особенно важно, что даже этих облегчённых подходов оказалось достаточно, чтобы достичь более высокого качества по сравнению с классическими решениями на базе BERT, которые долгое время считались золотым стандартом в задачах классификации.

Это значимый прецедент успешного дообучения LLM в Альфе, который меняет подход: теперь LLM применимы не только для генерации текста, но и для более узких задач, которые раньше решались отдельными моделями, обученными на большом объёме размеченных данных»,

— Александр Сенин, руководитель Центра компетенций Natural Language Processing

На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆

Спойлер: удалось добиться стабильной высокой точности без перехода на внешние решения.

#aaa_hardposting

BY Alfa Advanced Analytics










Share with your friend now:
tgoop.com/aaanalytics/890

View MORE
Open in Telegram


Telegram News

Date: |

The Standard Channel When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name. You can invite up to 200 people from your contacts to join your channel as the next step. Select the users you want to add and click “Invite.” You can skip this step altogether. Telegram Android app: Open the chats list, click the menu icon and select “New Channel.” The channel also called on people to turn out for illegal assemblies and listed the things that participants should bring along with them, showing prior planning was in the works for riots. The messages also incited people to hurl toxic gas bombs at police and MTR stations, he added.
from us


Telegram Alfa Advanced Analytics
FROM American