MACHINELEARNING_INTERVIEW Telegram 2169
🚀 Ring-mini-2.0 — мощная, но лёгкая модель на 16B-A1B!

💡 Обучена с использованием новой стратегии stable RLVR + RLHF, что дало сбалансированное и надёжное качество на разных задачах.
🧠 По логическому рассуждению обгоняет денс-модели такого же размера.
Скорость — более 300 токенов/сек (в 7 раз быстрее, чем dense-модели).

🔥 Ещё одно доказательство, что маленькие "thinking models" становятся всё умнее и быстрее!

https://huggingface.co/inclusionAI/Ring-mini-2.0
8👍6



tgoop.com/machinelearning_interview/2169
Create:
Last Update:

🚀 Ring-mini-2.0 — мощная, но лёгкая модель на 16B-A1B!

💡 Обучена с использованием новой стратегии stable RLVR + RLHF, что дало сбалансированное и надёжное качество на разных задачах.
🧠 По логическому рассуждению обгоняет денс-модели такого же размера.
Скорость — более 300 токенов/сек (в 7 раз быстрее, чем dense-модели).

🔥 Ещё одно доказательство, что маленькие "thinking models" становятся всё умнее и быстрее!

https://huggingface.co/inclusionAI/Ring-mini-2.0

BY Machine learning Interview




Share with your friend now:
tgoop.com/machinelearning_interview/2169

View MORE
Open in Telegram


Telegram News

Date: |

To delete a channel with over 1,000 subscribers, you need to contact user support Hui said the messages, which included urging the disruption of airport operations, were attempts to incite followers to make use of poisonous, corrosive or flammable substances to vandalize police vehicles, and also called on others to make weapons to harm police. Telegram Channels requirements & features The administrator of a telegram group, "Suck Channel," was sentenced to six years and six months in prison for seven counts of incitement yesterday.
from us


Telegram Machine learning Interview
FROM American