Machinelearning@ai_machinelearning_big

⚡️ Ling-flash-2.0 теперь в открытом доступе! ⚡️

Модель 100 B параметров, но задействовано всего ≈6.1B активных, что делает модель очень экономной.

🚀 Чем хороша Ling-flash-2.0
- Обучена на более чем 20 триллионах токенов с до-обучением и RL-этапами.
- Демонстрирует state-of-the-art производительность среди плотных моделей до 40B параметров.
- Особенно хороша в сложном рассуждении, генерации кода и задачах с фронтендом.

⚙️ Архитектура и эффективность
- MoE-архитектура с активированием лишь части параметров (activation ratio 1/32).
- Много технических фишек: продвинутое распределение экспертов, баланс внимания, схема маршрутизации без вспомогательных потерь и др.
- На железе H20 модель генерирует 200+ токенов в секунду - в 3× быстрее по сравнению с плотной моделью 36B.
- Поддерживает контексты до 128K токенов (с YaRN).

https://huggingface.co/inclusionAI/Ling-flash-2.0

@ai_machinelearning_big_data

#moe #llm #ml #ai #opensource

👍321❤48👏25🔥21🎉16😁10🤩7🥰5😢5😍5🏆4

www.tgoop.com/ai_machinelearning_big_data/8569

23K viewsSep 17 at 15:23

tgoop.com/ai_machinelearning_big_data/8569

Create: 2025-09-17
Last Update: 2025-09-21 05:24:58

BY Machinelearning

Share with your friend now:
tgoop.com/ai_machinelearning_big_data/8569

Telegram News

⚡️ Ling-flash-2.0 теперь в открытом доступе! ⚡️