LLM_UNDER_HOOD Telegram 665
Qwen3 VL Thinking - TOP3 в бенчмарке!

Alibaba Cloud выкатили на днях новые Qwn модели. Я слышал, что они неплохи, но это говорят нынче про каждую модель.

(1) Qwen3 Max Instruct - самая крупная закрытая Qwen модель на 1T+ params - заняла 17 место. Это выше gpt-5-nano, но ниже, чем o1-2024-12-17

(2) Qwen3-VL-235B-A22B - самая крупная мультимодальная открытая модель, которая вышла в двух форматах - Instruct (карточка | веса) и Thinking (карточка | веса).

Qwen3-VL-235B-A22B-Instruct заняла 19ое место, что немного ниже Qwen3 Max Instruct. Это примерно уровень gpt-5-nano или deepseek-r1 но модель при этом работает с картинками!

(3) Qwen3-VL-235B-A22B-Thinking аналогична Instruct, но умеет думать и заняла третье место! Это самое высокое место, которое когда-либо занимала модель с открытыми весами в моем бенчмарке!

Понятно, что модели весом в пол-терабайта мало кто будет запускать на практике - не стоит оно того. Куда эффективнее взять gpt-oss-120B с 7го места или Qwen3-32B с 17 места.

Но сам факт попадания открытой мультимодальной модели в TOP3 - это повод для радости от прогресса. Теперь будем ждать таких же моделей, но в более практичном формате.

Ваш, @llm_under_hood 🤗

PS: про бенчмарки, включая их двухлетнюю историю, расписано тут
🔥58👍2612🤯2



tgoop.com/llm_under_hood/665
Create:
Last Update:

Qwen3 VL Thinking - TOP3 в бенчмарке!

Alibaba Cloud выкатили на днях новые Qwn модели. Я слышал, что они неплохи, но это говорят нынче про каждую модель.

(1) Qwen3 Max Instruct - самая крупная закрытая Qwen модель на 1T+ params - заняла 17 место. Это выше gpt-5-nano, но ниже, чем o1-2024-12-17

(2) Qwen3-VL-235B-A22B - самая крупная мультимодальная открытая модель, которая вышла в двух форматах - Instruct (карточка | веса) и Thinking (карточка | веса).

Qwen3-VL-235B-A22B-Instruct заняла 19ое место, что немного ниже Qwen3 Max Instruct. Это примерно уровень gpt-5-nano или deepseek-r1 но модель при этом работает с картинками!

(3) Qwen3-VL-235B-A22B-Thinking аналогична Instruct, но умеет думать и заняла третье место! Это самое высокое место, которое когда-либо занимала модель с открытыми весами в моем бенчмарке!

Понятно, что модели весом в пол-терабайта мало кто будет запускать на практике - не стоит оно того. Куда эффективнее взять gpt-oss-120B с 7го места или Qwen3-32B с 17 места.

Но сам факт попадания открытой мультимодальной модели в TOP3 - это повод для радости от прогресса. Теперь будем ждать таких же моделей, но в более практичном формате.

Ваш, @llm_under_hood 🤗

PS: про бенчмарки, включая их двухлетнюю историю, расписано тут

BY LLM под капотом




Share with your friend now:
tgoop.com/llm_under_hood/665

View MORE
Open in Telegram


Telegram News

Date: |

Select: Settings – Manage Channel – Administrators – Add administrator. From your list of subscribers, select the correct user. A new window will appear on the screen. Check the rights you’re willing to give to your administrator. To edit your name or bio, click the Menu icon and select “Manage Channel.” It’s yet another bloodbath on Satoshi Street. As of press time, Bitcoin (BTC) and the broader cryptocurrency market have corrected another 10 percent amid a massive sell-off. Ethereum (EHT) is down a staggering 15 percent moving close to $1,000, down more than 42 percent on the weekly chart. Done! Now you’re the proud owner of a Telegram channel. The next step is to set up and customize your channel. How to create a business channel on Telegram? (Tutorial)
from us


Telegram LLM под капотом
FROM American