Notice: file_put_contents(): Write of 17718 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение@dsproglib P.6161
DSPROGLIB Telegram 6161
📌 YandexGPT 5: новое поколение языковых моделей от Яндекса

Компания внедрила методы обучения с подкреплением (DPO и PPO), а также собственную модификацию LogDPO, которая помогает избежать эффекта «разучивания» — ситуации, когда модель забывает уже выученные знания.

🔍 Разработчикам удалось на 25% снизить потребность в вычислительных ресурсах за счет библиотеки YaFSDP, которую Яндекс выложил в опенсорс в 2024 году. А в этом релизе компания впервые с 2022 года выложила в открытый доступ LLM — pretrain-версию YandexGPT 5 Lite. Она доступна без финального этапа обучения, этических фильтров и алаймента.

💡 Для обучения Pro-версии компания впервые применила метод гибридного обучения, добавив в стандартный цикл обучения базовые настройки открытой модели Qwen. Совмещение полного цикла обучения, который состоит из Pretrain, SFT, RL и весов из общедоступной модели позволило сократить затраты на обучение и увеличить его скорость до 20 раз.

🔗Читать статью
👍7



tgoop.com/dsproglib/6161
Create:
Last Update:

📌 YandexGPT 5: новое поколение языковых моделей от Яндекса

Компания внедрила методы обучения с подкреплением (DPO и PPO), а также собственную модификацию LogDPO, которая помогает избежать эффекта «разучивания» — ситуации, когда модель забывает уже выученные знания.

🔍 Разработчикам удалось на 25% снизить потребность в вычислительных ресурсах за счет библиотеки YaFSDP, которую Яндекс выложил в опенсорс в 2024 году. А в этом релизе компания впервые с 2022 года выложила в открытый доступ LLM — pretrain-версию YandexGPT 5 Lite. Она доступна без финального этапа обучения, этических фильтров и алаймента.

💡 Для обучения Pro-версии компания впервые применила метод гибридного обучения, добавив в стандартный цикл обучения базовые настройки открытой модели Qwen. Совмещение полного цикла обучения, который состоит из Pretrain, SFT, RL и весов из общедоступной модели позволило сократить затраты на обучение и увеличить его скорость до 20 раз.

🔗Читать статью

BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение




Share with your friend now:
tgoop.com/dsproglib/6161

View MORE
Open in Telegram


Telegram News

Date: |

How to Create a Private or Public Channel on Telegram? The public channel had more than 109,000 subscribers, Judge Hui said. Ng had the power to remove or amend the messages in the channel, but he “allowed them to exist.” The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. Telegram channels fall into two types: Telegram message that reads: "Bear Market Screaming Therapy Group. You are only allowed to send screaming voice notes. Everything else = BAN. Text pics, videos, stickers, gif = BAN. Anything other than screaming = BAN. You think you are smart = BAN.
from us


Telegram Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
FROM American