🧠 PKU-DS-LAB представили Fairy-R1 — мощную LLM-модели для математики и программирования, которая превосходит более крупные модели при меньшем числе параметров.
🚀 Что такое Fairy-R1: • Это семейство языковых моделей, разработанных для задач математического и кодингового рассуждения • Построены на базе DeepSeek-R1 с использованием метода distill-and-merge • Выпущены две версии: — FairyR1-32B (32B параметров) — FairyR1-14B-Preview (14B параметров)
📌 Почему это важно: • Модели работают почти так же точно, как GPT-4, но в 20 раз легче • Умеют обрабатывать задачи на английском и китайском • Используют архитектуру слияния нескольких специализаций (AcreeFusion)
🛠 Как обучали: • Математика: AIMO / NuminaMath-1.5 • Программирование: OpenThoughts-114k • Обучение: на 32 × NVIDIA H100 (32B), 16 × H100 (14B) • Доступ: полностью open-source (Apache 2.0)
🧠 PKU-DS-LAB представили Fairy-R1 — мощную LLM-модели для математики и программирования, которая превосходит более крупные модели при меньшем числе параметров.
🚀 Что такое Fairy-R1: • Это семейство языковых моделей, разработанных для задач математического и кодингового рассуждения • Построены на базе DeepSeek-R1 с использованием метода distill-and-merge • Выпущены две версии: — FairyR1-32B (32B параметров) — FairyR1-14B-Preview (14B параметров)
📌 Почему это важно: • Модели работают почти так же точно, как GPT-4, но в 20 раз легче • Умеют обрабатывать задачи на английском и китайском • Используют архитектуру слияния нескольких специализаций (AcreeFusion)
🛠 Как обучали: • Математика: AIMO / NuminaMath-1.5 • Программирование: OpenThoughts-114k • Обучение: на 32 × NVIDIA H100 (32B), 16 × H100 (14B) • Доступ: полностью open-source (Apache 2.0)
The court said the defendant had also incited people to commit public nuisance, with messages calling on them to take part in rallies and demonstrations including at Hong Kong International Airport, to block roads and to paralyse the public transportation system. Various forms of protest promoted on the messaging platform included general strikes, lunchtime protests and silent sit-ins. Those being doxxed include outgoing Chief Executive Carrie Lam Cheng Yuet-ngor, Chung and police assistant commissioner Joe Chan Tung, who heads police's cyber security and technology crime bureau. As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail. The creator of the channel becomes its administrator by default. If you need help managing your channel, you can add more administrators from your subscriber base. You can provide each admin with limited or full rights to manage the channel. For example, you can allow an administrator to publish and edit content while withholding the right to add new subscribers. Telegram is a leading cloud-based instant messages platform. It became popular in recent years for its privacy, speed, voice and video quality, and other unmatched features over its main competitor Whatsapp.
from us