Машинное обучение RU@machinelearning

This media is not supported in your browser

⚡️ Ling-flash-2.0 теперь в открытом доступе! ⚡️

Модель на 100B параметров, но задействовано всего ≈6.1B активных, что делает модель очень экономной в вычислительной нагрузке.

🚀 Чем хороша Ling-flash-2.0
- Обучена на более чем 20 триллионах токенов с до-обучением и RL-этапами.
- Демонстрирует state-of-the-art производительность среди плотных моделей до 40B параметров.
- Особенно хороша в сложном рассуждении, генерации кода и задачах с фронтендом.

⚙️ Архитектура и эффективность
- MoE-архитектура с активированием лишь части параметров (activation ratio 1/32).
- Много технических фишек: продвинутое распределение экспертов, баланс внимания, схема маршрутизации без вспомогательных потерь и др.
- На железе H20 модель генерирует 200+ токенов в секунду - в 3× быстрее по сравнению с плотной моделью 36B.
- Поддерживает контексты до 128K токенов (с YaRN).

https://huggingface.co/inclusionAI/Ling-flash-2.0

@ai_machinelearning_big_data

#moe #llm #ml #ai #opensource

👍4❤2🔥2

www.tgoop.com/machinelearning_ru/2987

1.64K viewsSep 17 at 15:27

tgoop.com/machinelearning_ru/2987

Create: 2025-09-17
Last Update: 2025-10-01 23:34:22

BY Машинное обучение RU

Share with your friend now:
tgoop.com/machinelearning_ru/2987

Telegram News

⚡️ Ling-flash-2.0 теперь в открытом доступе! ⚡️