tgoop.com/codecamp/6908
Last Update:
Ну что, GROK 3 РЕВОЛЮЦИЯ или... нет? Давайте разбираться
— Есть две версии модели: обычная (Grok 3 и Grok 3-mini) и «думающая». Обе бьют конкурентов ногами, обходя по бенчам, правда подбор самих тестов вызывает вопросы: только олимпиады по матану, кодингу и науке. При этом, у AIME уже есть версия бенча за 2025 год (где у конкурентов лучше результаты), но Маск взял версию за 2024 :)
— На LLM Arena это первая модель, которая пробила 1400 Elo рейтинга. В это охотно верю — новый Grok 3 действительно выглядит очень креативным;
— Вместе с Grok 3 завезли Deep Research. По тестам где-то на уровне с Perplexity и их недавним релизом;
— Вот тут начинается клоунада: сейчас в релиз завозят незаконченную версию Grok 3. Я посмотрел, как он кодит — результат на видео;
— Великий поборник открытых моделей Илон Маск не собирается отпускать Grok 3 в опен сорс. Вместо этого после финального релиза Grok 3 мы получим... Grok 2
— Жадно: для использования нужна подписка за $22 в Твиттере или аж за $30 в приложении. ЧЗХ, у OpenAI даже дешевле.
Мой вывод: модель действительно хорошая, но ничего такого, что вызвало бы «вау-эффект» и нестерпимое желание пересесть с вашей текущей нейронки на Grok 3. Итан Молик красиво сказал:
Очень хорошая модель, которая сейчас находится на передовой, но не то, что заставило бы вас перейти с другого ИИ
Уверен, OpenAI теперь будут активнее пилить нам GPT-4.5.