AAANALYTICS Telegram 895
Первая LLM, которую мы успешно дообучили в Альфе 🔥

LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.

Мы начали с задачи оценки ответов операторов.

«Дообучение LLM — неизбежный шаг при создании современных, качественных AI-систем. Когда все «низковисящие фрукты» уже собраны, наступает момент, когда модель необходимо дообучать напрямую, чтобы продолжать улучшать её качество. К счастью, существуют легковесные методы, которые позволяют делать это эффективно и без серьёзных затрат на инфраструктуру.

Особенно важно, что даже этих облегчённых подходов оказалось достаточно, чтобы достичь более высокого качества по сравнению с классическими решениями на базе BERT, которые долгое время считались золотым стандартом в задачах классификации.

Это значимый прецедент успешного дообучения LLM в Альфе, который меняет подход: теперь LLM применимы не только для генерации текста, но и для более узких задач, которые раньше решались отдельными моделями, обученными на большом объёме размеченных данных»,

— Александр Сенин, руководитель Центра компетенций Natural Language Processing

На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆

Спойлер: удалось добиться стабильной высокой точности без перехода на внешние решения.

#aaa_hardposting
23🔥157👌1🙈1



tgoop.com/aaanalytics/895
Create:
Last Update:

Первая LLM, которую мы успешно дообучили в Альфе 🔥

LLM не всегда справляются с задачами «из коробки». В ряде случаев им необходимо предоставить данные из базы знаний с помощью RAG-подхода. Однако для более сложных задач этого может быть недостаточно, тогда требуется дообучение модели.

Мы начали с задачи оценки ответов операторов.

«Дообучение LLM — неизбежный шаг при создании современных, качественных AI-систем. Когда все «низковисящие фрукты» уже собраны, наступает момент, когда модель необходимо дообучать напрямую, чтобы продолжать улучшать её качество. К счастью, существуют легковесные методы, которые позволяют делать это эффективно и без серьёзных затрат на инфраструктуру.

Особенно важно, что даже этих облегчённых подходов оказалось достаточно, чтобы достичь более высокого качества по сравнению с классическими решениями на базе BERT, которые долгое время считались золотым стандартом в задачах классификации.

Это значимый прецедент успешного дообучения LLM в Альфе, который меняет подход: теперь LLM применимы не только для генерации текста, но и для более узких задач, которые раньше решались отдельными моделями, обученными на большом объёме размеченных данных»,

— Александр Сенин, руководитель Центра компетенций Natural Language Processing

На карточках рассказываем, какие методы дообучения выбрали, с какими моделями начали и к каким результатам пришли 👆

Спойлер: удалось добиться стабильной высокой точности без перехода на внешние решения.

#aaa_hardposting

BY Alfa Advanced Analytics










Share with your friend now:
tgoop.com/aaanalytics/895

View MORE
Open in Telegram


Telegram News

Date: |

The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. The court said the defendant had also incited people to commit public nuisance, with messages calling on them to take part in rallies and demonstrations including at Hong Kong International Airport, to block roads and to paralyse the public transportation system. Various forms of protest promoted on the messaging platform included general strikes, lunchtime protests and silent sit-ins. How to Create a Private or Public Channel on Telegram? Just at this time, Bitcoin and the broader crypto market have dropped to new 2022 lows. The Bitcoin price has tanked 10 percent dropping to $20,000. On the other hand, the altcoin space is witnessing even more brutal correction. Bitcoin has dropped nearly 60 percent year-to-date and more than 70 percent since its all-time high in November 2021. Public channels are public to the internet, regardless of whether or not they are subscribed. A public channel is displayed in search results and has a short address (link).
from us


Telegram Alfa Advanced Analytics
FROM American