tgoop.com/ai_volution/1339
Last Update:
Grok-4
Только что на стриме xAI Илон Маск и команда показали Grok-4. Новая SOTA?
– На Humanity’s Last Exam Grok 4 Heavy набрал 50,7%. Это больше чем в два раза выше, чем у прошлых лидеров. Gemini 2.5 Pro набирал только 22%.
– С инструментами (tools) обычный Grok 4 даёт 41%, без инструментов — 26,9%.
– Инструменты (tool use) встроены прямо в обучение. Модель реально использует браузер, интерпретатор кода и прочие внешние сервисы.
– Стал лучше голосовой режим. Grok теперь может не только говорить, но и шептать, петь (на видео выше, грок исполняет оперу о диетической Коле), менять интонации и эмоции.
– В чате доступны сразу две версии: обычная (для всех) и Grok Heavy (выбивает 100% на AIME 2025, RIP очередной бенчмарк
– За Grok Heavy — 300 долларов в месяц.
– В вендинг-бенче (тут писал, как Claude обанкротился изначально став бизнесменом) Grok 4 заработал $4694 и продал больше 4500 товаров. Для сравнения: Claude Opus смог только $2077. Grok сам принимал решения, как закупать и по каким ценам продавать. Кажется, что в ближайший год большие оптимизации коснутся больших ритейлеров.
– Grok 4 уже сегодня доступен через xAI API. Контекст 256k токенов, мультимодальный reasoning, поиск по реальным данным, безопасность для бизнеса (не обучается на данных компаний).
– Grok 4 первый, кто пробил 10% на ARC-AGI v2 (там 15,9%). В ARC-AGI v1 — 66,6%. Это лучший результат среди всех LLM.
– В медицине тоже топ! На X-ray бенчмарке Grok 4 даёт 72,8%. Выше всех остальных моделей.
– Модель уже умеет собирать 3D-игры. Grok сам находит ассеты, подбирает текстуры и добавляет 3D-модели в движок.
Что дальше?
– В августе выйдет отдельная кодовая модель.
– В сентябре появится мультимодальный агент.
– В октябре будет модель для генерации видео.
Всё это будет частью Grok 4.
xAI говорят, что Grok 4 уже лучше многих PhD по всем предметам. И обещают новые технологии и даже открытия в физике в ближайшие пару лет.
Мощная заявка и кажется у нас есть новый тариф в $300, к которому скорее всего этим летом подтянутся остальные игроки.
Чтож, Сэм, пора выпускать монстра GPT-5. Заждались!