DSPROGLIB Telegram 6003
DeepSeek представляет новую открытую модель DeepSeek-R1

DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.

😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.

Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.

Ссылка
🔥42👍2



tgoop.com/dsproglib/6003
Create:
Last Update:

DeepSeek представляет новую открытую модель DeepSeek-R1

DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.

😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.

Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.

Ссылка

BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение




Share with your friend now:
tgoop.com/dsproglib/6003

View MORE
Open in Telegram


Telegram News

Date: |

The main design elements of your Telegram channel include a name, bio (brief description), and avatar. Your bio should be: best-secure-messaging-apps-shutterstock-1892950018.jpg Co-founder of NFT renting protocol Rentable World emiliano.eth shared the group Tuesday morning on Twitter, calling out the "degenerate" community, or crypto obsessives that engage in high-risk trading. Some Telegram Channels content management tips Hashtags
from us


Telegram Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
FROM American