AI_MACHINELEARNING_BIG_DATA Telegram 6627
πŸ–€ Open R1

Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ с Hugging Face Ρ€Π΅ΡˆΠΈΠ»ΠΈ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π½Ρ‹ΠΉ Ρ†ΠΈΠΊΠ» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ DeepSeek - ΠΎΡ‚ сбора Π΄Π°Π½Π½Ρ‹Ρ… Π΄ΠΎ обучСния! πŸ”₯

ЦСль этого рСпозитория - ΠΎΠ±ΡŠΡΡΠ½ΠΈΡ‚ΡŒ всС части ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° создания R1 Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΌΠΎΠ³ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ Π΅Π³ΠΎ ΠΈΠ»ΠΈ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΠΎΠ²Π΅Ρ€Ρ… Π½Π΅Π³ΠΎ свой ΠΏΡ€ΠΎΠ΅ΠΊΡ‚.

Из Ρ‡Π΅Π³ΠΎ состоит ΠΏΡ€ΠΎΠ΅ΠΊΡ‚:
- src/open_r1 содСрТит скрипты для обучСния ΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ для Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ…:
- grpo.py : ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ GRPO
- sft.py: простой SFT
- evaluate.py: ΠΎΡ†Π΅Π½ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° основС тСстов R1.
- generate.py: гСнСрация синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Distilabel.
- Makefile содСрТит ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ Π² Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ шага ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° R1.

β–ͺ Github

@ai_machinelearning_big_data


#opensource #DeepSeekR1 #huggingface #OpenR1
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ”₯109πŸ‘26❀14



tgoop.com/ai_machinelearning_big_data/6627
Create:
Last Update:

πŸ–€ Open R1

Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ с Hugging Face Ρ€Π΅ΡˆΠΈΠ»ΠΈ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π½Ρ‹ΠΉ Ρ†ΠΈΠΊΠ» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ DeepSeek - ΠΎΡ‚ сбора Π΄Π°Π½Π½Ρ‹Ρ… Π΄ΠΎ обучСния! πŸ”₯

ЦСль этого рСпозитория - ΠΎΠ±ΡŠΡΡΠ½ΠΈΡ‚ΡŒ всС части ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° создания R1 Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΌΠΎΠ³ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ Π΅Π³ΠΎ ΠΈΠ»ΠΈ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΠΎΠ²Π΅Ρ€Ρ… Π½Π΅Π³ΠΎ свой ΠΏΡ€ΠΎΠ΅ΠΊΡ‚.

Из Ρ‡Π΅Π³ΠΎ состоит ΠΏΡ€ΠΎΠ΅ΠΊΡ‚:
- src/open_r1 содСрТит скрипты для обучСния ΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ для Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ…:
- grpo.py : ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ GRPO
- sft.py: простой SFT
- evaluate.py: ΠΎΡ†Π΅Π½ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° основС тСстов R1.
- generate.py: гСнСрация синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Distilabel.
- Makefile содСрТит ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ Π² Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ шага ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° R1.

β–ͺ Github

@ai_machinelearning_big_data


#opensource #DeepSeekR1 #huggingface #OpenR1

BY Machinelearning




Share with your friend now:
tgoop.com/ai_machinelearning_big_data/6627

View MORE
Open in Telegram


Telegram News

Date: |

Members can post their voice notes of themselves screaming. Interestingly, the group doesn’t allow to post anything else which might lead to an instant ban. As of now, there are more than 330 members in the group. Telegram Channels requirements & features Joined by Telegram's representative in Brazil, Alan Campos, Perekopsky noted the platform was unable to cater to some of the TSE requests due to the company's operational setup. But Perekopsky added that these requests could be studied for future implementation. More>> Content is editable within two days of publishing
from us


Telegram Machinelearning
FROM American