tgoop.com/prettygeeknotes/1778
Last Update:
🍏 FastVLM: Apple наконец-то врывается в AI?
На CVPR 2025 показали FastVLM - мультимодальную модель с акцентом на скорость и компактность. И это реально первый серьёзный шаг Apple в сторону открытых моделей.
- ⚡️ 85× быстрее по TTFT, чем аналоги, и 3.4× компактнее благодаря гибридному визуальному энкодеру FastViTHD.
- 🧠 Версия на базе Qwen2-7B обгоняет Cambrian-1-8B, выдавая 7.9× более быстрый ответ.
- 📦 Уже на HuggingFace - модели 0.5B, 1.5B, 7B (fp16 / int8 / int4). Есть экспериментальные Stage2/3 для видео и структурированного вывода.
- 🛠 Поддержка прямо в transformers - импортнул и поехали.
- 🍎 Некоторые версии уже работают через mlx-vlm на macOS/iOS.
- 💬 Пользователи отмечают: на Mac летает, а вот iPhone 14 пока не тянет. Но в WebGPU-демо выглядит бодро.
📌 Вывод
FastVLM = компактность + скорость + мультимодальность. Кажется, Apple реально начала собирать свой AI-стек - посмотрим, как это отразится на экосистеме iPhone/iPad/Mac. Очень надеюсь что увидим от Apple еще больше моделей.
👉 Модели на HuggingFace
👉 Официальный Github
BY Записки разработчицы
Share with your friend now:
tgoop.com/prettygeeknotes/1778