Notice: file_put_contents(): Write of 18924 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50
Machinelearning@ai_machinelearning_big_data P.6627
AI_MACHINELEARNING_BIG_DATA Telegram 6627
πŸ–€ Open R1

Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ с Hugging Face Ρ€Π΅ΡˆΠΈΠ»ΠΈ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π½Ρ‹ΠΉ Ρ†ΠΈΠΊΠ» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ DeepSeek - ΠΎΡ‚ сбора Π΄Π°Π½Π½Ρ‹Ρ… Π΄ΠΎ обучСния! πŸ”₯

ЦСль этого рСпозитория - ΠΎΠ±ΡŠΡΡΠ½ΠΈΡ‚ΡŒ всС части ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° создания R1 Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΌΠΎΠ³ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ Π΅Π³ΠΎ ΠΈΠ»ΠΈ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΠΎΠ²Π΅Ρ€Ρ… Π½Π΅Π³ΠΎ свой ΠΏΡ€ΠΎΠ΅ΠΊΡ‚.

Из Ρ‡Π΅Π³ΠΎ состоит ΠΏΡ€ΠΎΠ΅ΠΊΡ‚:
- src/open_r1 содСрТит скрипты для обучСния ΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ для Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ…:
- grpo.py : ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ GRPO
- sft.py: простой SFT
- evaluate.py: ΠΎΡ†Π΅Π½ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° основС тСстов R1.
- generate.py: гСнСрация синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Distilabel.
- Makefile содСрТит ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ Π² Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ шага ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° R1.

β–ͺ Github

@ai_machinelearning_big_data


#opensource #DeepSeekR1 #huggingface #OpenR1
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ”₯109πŸ‘26❀14



tgoop.com/ai_machinelearning_big_data/6627
Create:
Last Update:

πŸ–€ Open R1

Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ с Hugging Face Ρ€Π΅ΡˆΠΈΠ»ΠΈ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π½Ρ‹ΠΉ Ρ†ΠΈΠΊΠ» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ DeepSeek - ΠΎΡ‚ сбора Π΄Π°Π½Π½Ρ‹Ρ… Π΄ΠΎ обучСния! πŸ”₯

ЦСль этого рСпозитория - ΠΎΠ±ΡŠΡΡΠ½ΠΈΡ‚ΡŒ всС части ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° создания R1 Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΌΠΎΠ³ ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ Π΅Π³ΠΎ ΠΈΠ»ΠΈ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΠΎΠ²Π΅Ρ€Ρ… Π½Π΅Π³ΠΎ свой ΠΏΡ€ΠΎΠ΅ΠΊΡ‚.

Из Ρ‡Π΅Π³ΠΎ состоит ΠΏΡ€ΠΎΠ΅ΠΊΡ‚:
- src/open_r1 содСрТит скрипты для обучСния ΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ для Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ…:
- grpo.py : ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ GRPO
- sft.py: простой SFT
- evaluate.py: ΠΎΡ†Π΅Π½ΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° основС тСстов R1.
- generate.py: гСнСрация синтСтичСских Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Distilabel.
- Makefile содСрТит ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ Π² Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ шага ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° R1.

β–ͺ Github

@ai_machinelearning_big_data


#opensource #DeepSeekR1 #huggingface #OpenR1

BY Machinelearning




Share with your friend now:
tgoop.com/ai_machinelearning_big_data/6627

View MORE
Open in Telegram


Telegram News

Date: |

With the sharp downturn in the crypto market, yelling has become a coping mechanism for many crypto traders. This screaming therapy became popular after the surge of Goblintown Ethereum NFTs at the end of May or early June. Here, holders made incoherent groaning sounds in late-night Twitter spaces. They also role-played as urine-loving Goblin creatures. Don’t publish new content at nighttime. Since not all users disable notifications for the night, you risk inadvertently disturbing them. Channel login must contain 5-32 characters As of Thursday, the SUCK Channel had 34,146 subscribers, with only one message dated August 28, 2020. It was an announcement stating that police had removed all posts on the channel because its content β€œcontravenes the laws of Hong Kong.” β€œ[The defendant] could not shift his criminal liability,” Hui said.
from us


Telegram Machinelearning
FROM American