π ΠΠ°Π±ΠΎΡ Π΄Π°ΡΠ°ΡΠ΅ΡΠΎΠ² ΠΏΠΎ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΎΡ HF.HuggingFace, Π²ΠΎΠΎΠ΄ΡΡΠ΅Π²ΠΈΠ²ΡΠΈΡΡ ΠΏΠΎΠ±Π΅Π΄ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ
OlympicCoder Π½Π°Π΄ Sonnet 3.7 Π² Π±Π΅Π½ΡΠΌΠ°ΡΠΊΠ°Ρ
LiveCodeBench ΠΈ Π² Π·Π°Π΄Π°Π½ΠΈΡΡ
ΠΠ΅ΠΆΠ΄ΡΠ½Π°ΡΠΎΠ΄Π½ΠΎΠΉ ΠΎΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ ΠΏΠΎ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΊΠ΅ 2024 Π³ΠΎΠ΄Π°, ΠΎΠΏΡΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Π½Π°Π±ΠΎΡ Π΄Π°ΡΠ°ΡΠ΅ΡΠΎΠ² Π΄Π»Ρ ΠΏΡΠ΅Π΄Π²Π°ΡΠΈΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΈ ΡΠΎΠ½ΠΊΠΎΠΉ Π½Π°ΡΡΡΠΎΠΉΠΊΠΈ LLM Π² Π·Π°Π΄Π°ΡΠ°Ρ
Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΠΊΠΎΠ΄Π°:
π’Stack-Edu - 125 ΠΌΠ»ΡΠ΄. ΡΠΎΠΊΠ΅Π½ΠΎΠ² ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°ΡΠ΅Π»ΡΠ½ΠΎΠ³ΠΎ ΠΊΠΎΠ΄Π° Π½Π° 15 ΡΠ·ΡΠΊΠ°Ρ
ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ, ΠΎΡΡΠΈΠ»ΡΡΡΠΎΠ²Π°Π½Π½ΡΡ
ΠΈΠ· The Stack v2
π’GitHub Issues - 11 ΠΌΠ»ΡΠ΄. ΡΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈΠ· GitHub Issues
π’Kaggle Notebooks - 2 ΠΌΠ»ΡΠ΄. ΡΠΎΠΊΠ΅Π½ΠΎΠ² Π½ΠΎΡΡΠ±ΡΠΊΠΎΠ² Kaggle ΠΏΠΎ Π°Π½Π°Π»ΠΈΠ·Ρ Π΄Π°Π½Π½ΡΡ
π’CodeForces problems - 10 ΡΡΡ. ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΡ
Π·Π°Π΄Π°Ρ ΠΈΠ· ΡΠ΅ΡΠ²ΠΈΡΠ° CodeForces, 3 ΡΡΡ ΠΈΠ· ΠΊΠΎΡΠΎΡΡΡ
Π½Π΅ Π±ΡΠ»ΠΈ Π²ΠΊΠ»ΡΡΠ΅Π½Ρ Π² ΠΌΠ°ΡΡΠΈΠ² ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π²ΡΠΈΠΉΡΡ DeepMind
π’CodeForces problems DeepSeek-R1 - 8,69 Gb ΠΎΡΡΠΈΠ»ΡΡΡΠΎΠ²Π°Π½Π½ΡΡ
ΡΡΠ°ΡΡΠΈΡΠΎΠ²ΠΎΠΊ ΡΠ°ΡΡΡΠΆΠ΄Π΅Π½ΠΈΠΉ ΠΏΠΎ Π·Π°Π΄Π°ΡΠ°ΠΌ CodeForces
π’International Olympiad in Informatics: Problem statements dataset (2020 - 2024) - ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΠΉ Π½Π°Π±ΠΎΡ ΠΈΠ· Π·Π°Π΄Π°Π½ΠΈΠΉ ΠΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ ΠΏΠΎ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ, ΡΠ°Π·Π±ΠΈΡΡΠΉ Π½Π° ΠΏΠΎΠ΄Π·Π°Π΄Π°ΡΠΈ ΡΠ°ΠΊ, ΡΡΠΎΠ±Ρ ΠΊΠ°ΠΆΠ΄ΡΠΉ Π·Π°ΠΏΡΠΎΡ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΎΠ²Π°Π» ΡΠ΅ΡΠ΅Π½ΠΈΡ ΡΡΠΈΡ
ΠΏΠΎΠ΄Π·Π°Π΄Π°Ρ
π’International Olympiad in Informatics: Problem - DeepSeek-R1 CoT dataset (2020 - 2023) - 11 ΡΡΡ ΡΡΠ°ΡΡΠΈΡΠΎΠ²ΠΎΠΊ ΡΠ°ΡΡΡΠΆΠ΄Π΅Π½ΠΈΠΉ, Π²ΡΠΏΠΎΠ»Π½Π΅Π½Π½ΡΡ
DeepSeek-R1 Π² Ρ
ΠΎΠ΄Π΅ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Π½ΠΈΠΉ ΠΠ»ΠΈΠΌΠΏΠΈΠ°Π΄Ρ ΠΏΠΎ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ
@ai_machinelearning_big_data#AI #ML #LLM #Dataset #HuggingFace