MACHINELEARNING_INTERVIEW Telegram 1939
🧠 Phi-4-mini-flash-reasoning —новая компактная модСль ΠΎΡ‚ Microsoft с ΠΌΠΎΡ‰Π½ΠΎΠΉ матСматичСской Π»ΠΎΠ³ΠΈΠΊΠΎΠΉ

МодСль Phi-4-mini-flash-reasoning β€” это Ρ‡Π°ΡΡ‚ΡŒ сСмСйства Phi‑4 ΠΎΡ‚ Microsoft. Она ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ создана для Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ матСматичСского ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ, ΠΏΡ€ΠΈ этом остаётся Π»Ρ‘Π³ΠΊΠΎΠΉ, быстрой ΠΈ экономной ΠΏΠΎ рСсурсам.

πŸ” Π§Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ Π΅Ρ‘ особСнной

- МодСль Π½Π° 3.8B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², Π½ΠΎ приблиТаСтся ΠΏΠΎ качСству ΠΊ 7B–8B Π°Π½Π°Π»ΠΎΠ³Π°ΠΌ.
- ΠšΠΎΠ½Ρ‚Π΅ΠΊΡΡ‚ Π΄ΠΎ 64K Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² β€” идСально для Π·Π°Π΄Π°Ρ‡ с Π΄Π»ΠΈΠ½Π½ΠΎΠΉ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΎΠΉ Π»ΠΎΠ³ΠΈΠΊΠΈ.
- ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΡƒ: ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для Π΄ΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΡΡ‚Π², ΡΠΈΠΌΠ²ΠΎΠ»ΡŒΠ½Ρ‹Ρ… вычислСний, Π·Π°Π΄Π°Ρ‡ с нСсколькими шагами ΠΈ слоТных тСкстовых Π·Π°Π΄Π°Ρ‡.

πŸš€ ДостиТСния:

| МодСль | AIME24 | AIME25 | Math500 | GPQA |
|----------------------------------|--------|--------|---------|------|
| Phi-4-mini-**Flash**-Reasoning | **52.29** | **33.59** | **92.45** | **45.08** |
| Phi-4-mini-Reasoning | 48.13 | 31.77 | 91.20 | 44.51 |
| DeepSeek-R1-Qwen-1.5B | 29.58 | 20.78 | 84.50 | 37.69 |
| DeepSeek-R1-LLaMA-8B | 43.96 | 27.34 | 87.48 | 45.83 |
| Bespoke-Stratos-7B | 21.51 | 18.28 | 80.73 | 38.51 |


πŸ“ˆ *МодСль прСвосходит Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎ точности, нСсмотря Π½Π° ΠΊΠΎΠΌΠΏΠ°ΠΊΡ‚Π½Ρ‹ΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ€.*


βš™οΈ ΠŸΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ

- МодСль построСна Π½Π° Π³ΠΈΠ±Ρ€ΠΈΠ΄Π½ΠΎΠΉ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ decoder + SSM, Ρ‡Ρ‚ΠΎ Π΄Π°Ρ‘Ρ‚:
- модСль способна Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π»ΠΈΠ½Π½Ρ‹Π΅ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π² 10 Ρ€Π°Π· быстрСС, Ρ‡Π΅ΠΌ Π΅Ρ‘ базовая вСрсия
- ΠΏΠΎΡ‡Ρ‚ΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΉ рост Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΈ (Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΠΎΠ³ΠΎ Ρƒ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ)
- Π’Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Π»Π°ΡΡŒ Π½Π° A100-80GB, Π±Π΅Π· tensor parallelism.

πŸ“Œ *ИдСальна для ΠΌΠΎΠ±ΠΈΠ»ΡŒΠ½Ρ‹Ρ… устройств ΠΈ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ рСсурсами.*
⚠️ На Ρ‡Ρ‚ΠΎ стоит ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅

- ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π° Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΠ΄ матСматичСскоС ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΠ΅, Π½Π΅ ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π° для ΠΎΠ±Ρ‰Π΅Π³ΠΎ NLP.
- Из-Π·Π° Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π° Π² фактичСских знаниях β€” ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ с поиском ΠΈΠ»ΠΈ RAG.

Phi-4-mini-flash-reasoning β€” это ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ нСбольшая модСль ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ ΡƒΠΌΠ½ΠΎΠΉ, Ссли Π΅Ρ‘ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠΎΠ΄ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ.

πŸ“Œ МодСль: https://huggingface.co/microsoft/Phi-4-mini-flash-reasoning

Подпишись: @machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
❀7πŸ‘5πŸ₯°1



tgoop.com/machinelearning_interview/1939
Create:
Last Update:

🧠 Phi-4-mini-flash-reasoning —новая компактная модСль ΠΎΡ‚ Microsoft с ΠΌΠΎΡ‰Π½ΠΎΠΉ матСматичСской Π»ΠΎΠ³ΠΈΠΊΠΎΠΉ

МодСль Phi-4-mini-flash-reasoning β€” это Ρ‡Π°ΡΡ‚ΡŒ сСмСйства Phi‑4 ΠΎΡ‚ Microsoft. Она ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ создана для Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ матСматичСского ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ, ΠΏΡ€ΠΈ этом остаётся Π»Ρ‘Π³ΠΊΠΎΠΉ, быстрой ΠΈ экономной ΠΏΠΎ рСсурсам.

πŸ” Π§Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ Π΅Ρ‘ особСнной

- МодСль Π½Π° 3.8B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², Π½ΠΎ приблиТаСтся ΠΏΠΎ качСству ΠΊ 7B–8B Π°Π½Π°Π»ΠΎΠ³Π°ΠΌ.
- ΠšΠΎΠ½Ρ‚Π΅ΠΊΡΡ‚ Π΄ΠΎ 64K Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² β€” идСально для Π·Π°Π΄Π°Ρ‡ с Π΄Π»ΠΈΠ½Π½ΠΎΠΉ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΎΠΉ Π»ΠΎΠ³ΠΈΠΊΠΈ.
- ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΡƒ: ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для Π΄ΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΡΡ‚Π², ΡΠΈΠΌΠ²ΠΎΠ»ΡŒΠ½Ρ‹Ρ… вычислСний, Π·Π°Π΄Π°Ρ‡ с нСсколькими шагами ΠΈ слоТных тСкстовых Π·Π°Π΄Π°Ρ‡.

πŸš€ ДостиТСния:

| МодСль | AIME24 | AIME25 | Math500 | GPQA |
|----------------------------------|--------|--------|---------|------|
| Phi-4-mini-**Flash**-Reasoning | **52.29** | **33.59** | **92.45** | **45.08** |
| Phi-4-mini-Reasoning | 48.13 | 31.77 | 91.20 | 44.51 |
| DeepSeek-R1-Qwen-1.5B | 29.58 | 20.78 | 84.50 | 37.69 |
| DeepSeek-R1-LLaMA-8B | 43.96 | 27.34 | 87.48 | 45.83 |
| Bespoke-Stratos-7B | 21.51 | 18.28 | 80.73 | 38.51 |


πŸ“ˆ *МодСль прСвосходит Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎ точности, нСсмотря Π½Π° ΠΊΠΎΠΌΠΏΠ°ΠΊΡ‚Π½Ρ‹ΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ€.*


βš™οΈ ΠŸΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ

- МодСль построСна Π½Π° Π³ΠΈΠ±Ρ€ΠΈΠ΄Π½ΠΎΠΉ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ decoder + SSM, Ρ‡Ρ‚ΠΎ Π΄Π°Ρ‘Ρ‚:
- модСль способна Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π»ΠΈΠ½Π½Ρ‹Π΅ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π² 10 Ρ€Π°Π· быстрСС, Ρ‡Π΅ΠΌ Π΅Ρ‘ базовая вСрсия
- ΠΏΠΎΡ‡Ρ‚ΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΉ рост Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΈ (Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΠΎΠ³ΠΎ Ρƒ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ)
- Π’Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Π»Π°ΡΡŒ Π½Π° A100-80GB, Π±Π΅Π· tensor parallelism.

πŸ“Œ *ИдСальна для ΠΌΠΎΠ±ΠΈΠ»ΡŒΠ½Ρ‹Ρ… устройств ΠΈ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ рСсурсами.*
⚠️ На Ρ‡Ρ‚ΠΎ стоит ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅

- ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π° Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΠ΄ матСматичСскоС ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΠ΅, Π½Π΅ ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π° для ΠΎΠ±Ρ‰Π΅Π³ΠΎ NLP.
- Из-Π·Π° Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π° Π² фактичСских знаниях β€” ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ с поиском ΠΈΠ»ΠΈ RAG.

Phi-4-mini-flash-reasoning β€” это ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ нСбольшая модСль ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ ΡƒΠΌΠ½ΠΎΠΉ, Ссли Π΅Ρ‘ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠΎΠ΄ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ.

πŸ“Œ МодСль: https://huggingface.co/microsoft/Phi-4-mini-flash-reasoning

Подпишись: @machinelearning_interview

BY Machine learning Interview







Share with your friend now:
tgoop.com/machinelearning_interview/1939

View MORE
Open in Telegram


Telegram News

Date: |

β€œHey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group. A new window will come up. Enter your channel name and bio. (See the character limits above.) Click β€œCreate.” Done! Now you’re the proud owner of a Telegram channel. The next step is to set up and customize your channel. Avoid compound hashtags that consist of several words. If you have a hashtag like #marketingnewsinusa, split it into smaller hashtags: β€œ#marketing, #news, #usa. Ng Man-ho, a 27-year-old computer technician, was convicted last month of seven counts of incitement charges after he made use of the 100,000-member Chinese-language channel that he runs and manages to post "seditious messages," which had been shut down since August 2020.
from us


Telegram Machine learning Interview
FROM American