MACHINELEARNINDIGEST Telegram 1352
✔️ Ling-1T - новая модель от inclusionAI с 1 триллионом параметров

Главная идея модель: соединить эффективность и масштаб рассуждений в одной архитектуре.

🟠**Ключевые факты**
- Всего параметров: 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура).
- Обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений.

Контекст: 128 000 токенов.
Внутри Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - новые методы обучения для масштабируемых рассуждений.

Ling-1T- позиционируется, как модель с балансом между скоростью и точностью ответов.

Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации.

В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов.

Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными.

https://huggingface.co/inclusionAI/Ling-1T

@ai_machinelearning_big_data

#Ling1T #AI #ML #OpenSource #Reasoning #TrillionScale #FP8
Please open Telegram to view this post
VIEW IN TELEGRAM



tgoop.com/machinelearnindigest/1352
Create:
Last Update:

✔️ Ling-1T - новая модель от inclusionAI с 1 триллионом параметров

Главная идея модель: соединить эффективность и масштаб рассуждений в одной архитектуре.

🟠**Ключевые факты**
- Всего параметров: 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура).
- Обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений.

Контекст: 128 000 токенов.
Внутри Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - новые методы обучения для масштабируемых рассуждений.

Ling-1T- позиционируется, как модель с балансом между скоростью и точностью ответов.

Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации.

В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов.

Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными.

https://huggingface.co/inclusionAI/Ling-1T

@ai_machinelearning_big_data

#Ling1T #AI #ML #OpenSource #Reasoning #TrillionScale #FP8

BY Машинное обучение digest











Share with your friend now:
tgoop.com/machinelearnindigest/1352

View MORE
Open in Telegram


Telegram News

Date: |

The imprisonment came as Telegram said it was "surprised" by claims that privacy commissioner Ada Chung Lai-ling is seeking to block the messaging app due to doxxing content targeting police and politicians. Telegram Channels requirements & features With Bitcoin down 30% in the past week, some crypto traders have taken to Telegram to “voice” their feelings. Ng, who had pleaded not guilty to all charges, had been detained for more than 20 months. His channel was said to have contained around 120 messages and photos that incited others to vandalise pro-government shops and commit criminal damage targeting police stations. ‘Ban’ on Telegram
from us


Telegram Машинное обучение digest
FROM American