tgoop.com/dsproglib/6003
Last Update:
✅ DeepSeek представляет новую открытую модель DeepSeek-R1
DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.
😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.
Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.
Ссылка
BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Share with your friend now:
tgoop.com/dsproglib/6003