tgoop.com/machinelearning_interview/1938
Last Update:
ΠΠΎΠ΄Π΅Π»Ρ Phi-4-mini-flash-reasoning β ΡΡΠΎ ΡΠ°ΡΡΡ ΡΠ΅ΠΌΠ΅ΠΉΡΡΠ²Π° Phiβ4 ΠΎΡ Microsoft. ΠΠ½Π° ΡΠΏΠ΅ΡΠΈΠ°Π»ΡΠ½ΠΎ ΡΠΎΠ·Π΄Π°Π½Π° Π΄Π»Ρ Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΌΡΡΠ»Π΅Π½ΠΈΡ, ΠΏΡΠΈ ΡΡΠΎΠΌ ΠΎΡΡΠ°ΡΡΡΡ Π»ΡΠ³ΠΊΠΎΠΉ, Π±ΡΡΡΡΠΎΠΉ ΠΈ ΡΠΊΠΎΠ½ΠΎΠΌΠ½ΠΎΠΉ ΠΏΠΎ ΡΠ΅ΡΡΡΡΠ°ΠΌ.
π Π§ΡΠΎ Π΄Π΅Π»Π°Π΅Ρ Π΅Ρ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΠΉ
- ΠΠΎΠ΄Π΅Π»Ρ Π½Π° 3.8B ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ², Π½ΠΎ ΠΏΡΠΈΠ±Π»ΠΈΠΆΠ°Π΅ΡΡΡ ΠΏΠΎ ΠΊΠ°ΡΠ΅ΡΡΠ²Ρ ΠΊ 7Bβ8B Π°Π½Π°Π»ΠΎΠ³Π°ΠΌ.
- ΠΠΎΠ½ΡΠ΅ΠΊΡΡ Π΄ΠΎ 64K ΡΠΎΠΊΠ΅Π½ΠΎΠ² β ΠΈΠ΄Π΅Π°Π»ΡΠ½ΠΎ Π΄Π»Ρ Π·Π°Π΄Π°Ρ Ρ Π΄Π»ΠΈΠ½Π½ΠΎΠΉ ΡΠ΅ΠΏΠΎΡΠΊΠΎΠΉ Π»ΠΎΠ³ΠΈΠΊΠΈ.
- ΠΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄ ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΠΊΡ: ΠΏΠΎΠ΄Ρ
ΠΎΠ΄ΠΈΡ Π΄Π»Ρ Π΄ΠΎΠΊΠ°Π·Π°ΡΠ΅Π»ΡΡΡΠ², ΡΠΈΠΌΠ²ΠΎΠ»ΡΠ½ΡΡ
Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ, Π·Π°Π΄Π°Ρ Ρ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΠΌΠΈ ΡΠ°Π³Π°ΠΌΠΈ ΠΈ ΡΠ»ΠΎΠΆΠ½ΡΡ
ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ
Π·Π°Π΄Π°Ρ.
π ΠΠΎΡΡΠΈΠΆΠ΅Π½ΠΈΡ: | ΠΠΎΠ΄Π΅Π»Ρ | AIME24 | AIME25 | Math500 | GPQA |
|----------------------------------|--------|--------|---------|------|
| Phi-4-mini-**Flash**-Reasoning | **52.29** | **33.59** | **92.45** | **45.08** |
| Phi-4-mini-Reasoning | 48.13 | 31.77 | 91.20 | 44.51 |
| DeepSeek-R1-Qwen-1.5B | 29.58 | 20.78 | 84.50 | 37.69 |
| DeepSeek-R1-LLaMA-8B | 43.96 | 27.34 | 87.48 | 45.83 |
| Bespoke-Stratos-7B | 21.51 | 18.28 | 80.73 | 38.51 |
π *ΠΠΎΠ΄Π΅Π»Ρ ΠΏΡΠ΅Π²ΠΎΡΡ ΠΎΠ΄ΠΈΡ Π΄ΡΡΠ³ΠΈΠ΅ ΠΏΠΎ ΡΠΎΡΠ½ΠΎΡΡΠΈ, Π½Π΅ΡΠΌΠΎΡΡΡ Π½Π° ΠΊΠΎΠΌΠΏΠ°ΠΊΡΠ½ΡΠΉ ΡΠ°Π·ΠΌΠ΅Ρ.*
βοΈ ΠΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ
- ΠΠΎΠ΄Π΅Π»Ρ ΠΏΠΎΡΡΡΠΎΠ΅Π½Π° Π½Π° Π³ΠΈΠ±ΡΠΈΠ΄Π½ΠΎΠΉ Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ΅ decoder + SSM, ΡΡΠΎ Π΄Π°ΡΡ:
- ΠΌΠΎΠ΄Π΅Π»Ρ ΡΠΏΠΎΡΠΎΠ±Π½Π° Π³Π΅Π½Π΅ΡΠΈΡΠΎΠ²Π°ΡΡ Π΄Π»ΠΈΠ½Π½ΡΠ΅ ΠΎΡΠ²Π΅ΡΡ ΠΏΡΠΈΠΌΠ΅ΡΠ½ΠΎ Π² 10 ΡΠ°Π· Π±ΡΡΡΡΠ΅Π΅, ΡΠ΅ΠΌ Π΅Ρ Π±Π°Π·ΠΎΠ²Π°Ρ Π²Π΅ΡΡΠΈΡ
- ΠΏΠΎΡΡΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½ΡΠΉ ΡΠΎΡΡ Π·Π°Π΄Π΅ΡΠΆΠΊΠΈ (Π² ΠΎΡΠ»ΠΈΡΠΈΠ΅ ΠΎΡ ΠΊΠ²Π°Π΄ΡΠ°ΡΠΈΡΠ½ΠΎΠ³ΠΎ Ρ ΠΎΠ±ΡΡΠ½ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ)
- Π’Π΅ΡΡΠΈΡΠΎΠ²Π°Π»Π°ΡΡ Π½Π° A100-80GB, Π±Π΅Π· tensor parallelism.
π *ΠΠ΄Π΅Π°Π»ΡΠ½Π° Π΄Π»Ρ ΠΌΠΎΠ±ΠΈΠ»ΡΠ½ΡΡ ΡΡΡΡΠΎΠΉΡΡΠ² ΠΈ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ Ρ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π½ΡΠΌΠΈ ΡΠ΅ΡΡΡΡΠ°ΠΌΠΈ.*
β οΈ ΠΠ° ΡΡΠΎ ΡΡΠΎΠΈΡ ΠΎΠ±ΡΠ°ΡΠΈΡΡ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅
- ΠΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π° ΡΠΎΠ»ΡΠΊΠΎ ΠΏΠΎΠ΄ ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΌΡΡΠ»Π΅Π½ΠΈΠ΅, Π½Π΅ ΠΏΡΠ΅Π΄Π½Π°Π·Π½Π°ΡΠ΅Π½Π° Π΄Π»Ρ ΠΎΠ±ΡΠ΅Π³ΠΎ NLP.
- ΠΠ·-Π·Π° ΡΠ°Π·ΠΌΠ΅ΡΠ° ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π° Π² ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΡ Π·Π½Π°Π½ΠΈΡΡ β ΠΆΠ΅Π»Π°ΡΠ΅Π»ΡΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Ρ ΠΏΠΎΠΈΡΠΊΠΎΠΌ ΠΈΠ»ΠΈ RAG.
Phi-4-mini-flash-reasoning β ΡΡΠΎ ΠΏΡΠΈΠΌΠ΅Ρ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π½Π΅Π±ΠΎΠ»ΡΡΠ°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΎΡΠ΅Π½Ρ ΡΠΌΠ½ΠΎΠΉ, Π΅ΡΠ»ΠΈ Π΅Ρ ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎ ΠΎΠ±ΡΡΠΈΡΡ ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ ΠΏΠΎΠ΄ ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΡΠ΅ Π·Π°Π΄Π°ΡΠΈ.
π ΠΠΎΠ΄Π΅Π»Ρ: https://huggingface.co/microsoft/Phi-4-mini-flash-reasoning
ΠΠΎΠ΄ΠΏΠΈΡΠΈΡΡ: @machinelearning_interview