Записки разработчицы@prettygeeknotes P.1778

This media is not supported in your browser

🍏 FastVLM: Apple наконец-то врывается в AI?

На CVPR 2025 показали FastVLM - мультимодальную модель с акцентом на скорость и компактность. И это реально первый серьёзный шаг Apple в сторону открытых моделей.

- ⚡️ 85× быстрее по TTFT, чем аналоги, и 3.4× компактнее благодаря гибридному визуальному энкодеру FastViTHD.
- 🧠 Версия на базе Qwen2-7B обгоняет Cambrian-1-8B, выдавая 7.9× более быстрый ответ.
- 📦 Уже на HuggingFace - модели 0.5B, 1.5B, 7B (fp16 / int8 / int4). Есть экспериментальные Stage2/3 для видео и структурированного вывода.
- 🛠 Поддержка прямо в transformers - импортнул и поехали.
- 🍎 Некоторые версии уже работают через mlx-vlm на macOS/iOS.
- 💬 Пользователи отмечают: на Mac летает, а вот iPhone 14 пока не тянет. Но в WebGPU-демо выглядит бодро.

📌 Вывод
FastVLM = компактность + скорость + мультимодальность. Кажется, Apple реально начала собирать свой AI-стек - посмотрим, как это отразится на экосистеме iPhone/iPad/Mac. Очень надеюсь что увидим от Apple еще больше моделей.

👉 Модели на HuggingFace
👉 Официальный Github

😁1

www.tgoop.com/prettygeeknotes/1778

1.17K viewsAnna Zharkova, Oct 6 at 06:31

tgoop.com/prettygeeknotes/1778

Create: 2025-10-06
Last Update: 2025-10-22 18:30:28

BY Записки разработчицы

Share with your friend now:
tgoop.com/prettygeeknotes/1778

Telegram News

🍏 FastVLM: Apple наконец-то врывается в AI?