tgoop.com/dsproglib/6161
Last Update:
📌 YandexGPT 5: новое поколение языковых моделей от Яндекса
Компания внедрила методы обучения с подкреплением (DPO и PPO), а также собственную модификацию LogDPO, которая помогает избежать эффекта «разучивания» — ситуации, когда модель забывает уже выученные знания.
🔍 Разработчикам удалось на 25% снизить потребность в вычислительных ресурсах за счет библиотеки YaFSDP, которую Яндекс выложил в опенсорс в 2024 году. А в этом релизе компания впервые с 2022 года выложила в открытый доступ LLM — pretrain-версию YandexGPT 5 Lite. Она доступна без финального этапа обучения, этических фильтров и алаймента.
💡 Для обучения Pro-версии компания впервые применила метод гибридного обучения, добавив в стандартный цикл обучения базовые настройки открытой модели Qwen. Совмещение полного цикла обучения, который состоит из Pretrain, SFT, RL и весов из общедоступной модели позволило сократить затраты на обучение и увеличить его скорость до 20 раз.
🔗Читать статью
BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Share with your friend now:
tgoop.com/dsproglib/6161