tgoop.com/ai_volution/1262
Last Update:
Claude Sonnet 4 и Opus 4
Claude Opus 4:
- Самая мощная модель Anthropic на сегодня
- Opus 4 способен самостоятельно работать над задачей 6–7 часов без вмешательства — например, в кейсе Rakuten модель провела полноценный open-source рефакторинг в агентном режиме. Это не про "магическую выносливость", а про устойчивость к сбоям и сохранение фокуса в сложных цепочках, где другие модели просто ломаются.
- Превосходит GPT-4.1 и Gemini 2.5 Pro в инженерных задачах
Claude Sonnet 4:
- Улучшенная версия Sonnet 3.7
- Точнее, быстрее, лучше следует инструкциям
- Сохраняет баланс между качеством и скоростью
- Доступна бесплатно в claude.ai
Текущий фокус Anthropic в развитии моделей — агентные и инженерные задачи, где важны устойчивость, работа с кодом, использование тулов и файлов, а также поддержание долгосрочного контекста.
Новые фишки в API: Code Execution Tool, поддержка MCP, Files API для доступа к локальным файлам, а еще можно Prompt Caching увеличить до 1 часа.
Что еще интересного:
Extended thinking и tool use (пока в бете)
Обе модели теперь могут использовать инструменты, например, веб-поиск прямо во время «длительного размышления». Claude умеет переключаться между рассуждением и использованием тулов, чтобы улучшить точность и полезность ответов.
Память и работа с файлами
Если дать Opus 4 доступ к локальным файлам, он может сохранять важную информацию в memory files и потом использовать её дальше. Это помогает модели лучше помнить контекст, не теряться в длинных задачах и работать надёжнее в агентных сценариях.
В пример на демо: во время игры в Pokémon Red модель сама создала навигационный гайд и опиралась на него дальше.
Thinking Summaries
В Claude 4 появилась новая функция — thinking summaries. Если размышления модели получаются слишком длинными, она автоматически сжимает цепочку reasoning в краткое и понятное резюме. Для этого используется отдельная, меньшая по размеру модель, которая умеет компактно пересказывать ход мыслей основной.
Получился очень долгожданный и мощный релиз от Anthropic. И мы попали в бесконечную петлю: одна компания делает мощный релиз, другая перекрывает его своим более мощным, и все эти релизы перебивает третья. И так по кругу
P.S. Немного припозднился с новостью, но лучше написать, чем не написать
О релизе можно почитать в блоге Anthropic.