AI_VOLUTION Telegram 1262
Claude Sonnet 4 и Opus 4

Claude Opus 4:
- Самая мощная модель Anthropic на сегодня
- Opus 4 способен самостоятельно работать над задачей 6–7 часов без вмешательства — например, в кейсе Rakuten модель провела полноценный open-source рефакторинг в агентном режиме. Это не про "магическую выносливость", а про устойчивость к сбоям и сохранение фокуса в сложных цепочках, где другие модели просто ломаются.
- Превосходит GPT-4.1 и Gemini 2.5 Pro в инженерных задачах

Claude Sonnet 4:
- Улучшенная версия Sonnet 3.7
- Точнее, быстрее, лучше следует инструкциям
- Сохраняет баланс между качеством и скоростью
- Доступна бесплатно в claude.ai

Текущий фокус Anthropic в развитии моделей — агентные и инженерные задачи, где важны устойчивость, работа с кодом, использование тулов и файлов, а также поддержание долгосрочного контекста.

Новые фишки в API: Code Execution Tool, поддержка MCP, Files API для доступа к локальным файлам, а еще можно Prompt Caching увеличить до 1 часа.

Что еще интересного:

Extended thinking и tool use (пока в бете)
Обе модели теперь могут использовать инструменты, например, веб-поиск прямо во время «длительного размышления». Claude умеет переключаться между рассуждением и использованием тулов, чтобы улучшить точность и полезность ответов.

Память и работа с файлами
Если дать Opus 4 доступ к локальным файлам, он может сохранять важную информацию в memory files и потом использовать её дальше. Это помогает модели лучше помнить контекст, не теряться в длинных задачах и работать надёжнее в агентных сценариях.
В пример на демо: во время игры в Pokémon Red модель сама создала навигационный гайд и опиралась на него дальше.

Thinking Summaries
В Claude 4 появилась новая функция — thinking summaries. Если размышления модели получаются слишком длинными, она автоматически сжимает цепочку reasoning в краткое и понятное резюме. Для этого используется отдельная, меньшая по размеру модель, которая умеет компактно пересказывать ход мыслей основной.

Получился очень долгожданный и мощный релиз от Anthropic. И мы попали в бесконечную петлю: одна компания делает мощный релиз, другая перекрывает его своим более мощным, и все эти релизы перебивает третья. И так по кругу 😅

P.S. Немного припозднился с новостью, но лучше написать, чем не написать 😄

О релизе можно почитать в блоге Anthropic.
Please open Telegram to view this post
VIEW IN TELEGRAM



tgoop.com/ai_volution/1262
Create:
Last Update:

Claude Sonnet 4 и Opus 4

Claude Opus 4:
- Самая мощная модель Anthropic на сегодня
- Opus 4 способен самостоятельно работать над задачей 6–7 часов без вмешательства — например, в кейсе Rakuten модель провела полноценный open-source рефакторинг в агентном режиме. Это не про "магическую выносливость", а про устойчивость к сбоям и сохранение фокуса в сложных цепочках, где другие модели просто ломаются.
- Превосходит GPT-4.1 и Gemini 2.5 Pro в инженерных задачах

Claude Sonnet 4:
- Улучшенная версия Sonnet 3.7
- Точнее, быстрее, лучше следует инструкциям
- Сохраняет баланс между качеством и скоростью
- Доступна бесплатно в claude.ai

Текущий фокус Anthropic в развитии моделей — агентные и инженерные задачи, где важны устойчивость, работа с кодом, использование тулов и файлов, а также поддержание долгосрочного контекста.

Новые фишки в API: Code Execution Tool, поддержка MCP, Files API для доступа к локальным файлам, а еще можно Prompt Caching увеличить до 1 часа.

Что еще интересного:

Extended thinking и tool use (пока в бете)
Обе модели теперь могут использовать инструменты, например, веб-поиск прямо во время «длительного размышления». Claude умеет переключаться между рассуждением и использованием тулов, чтобы улучшить точность и полезность ответов.

Память и работа с файлами
Если дать Opus 4 доступ к локальным файлам, он может сохранять важную информацию в memory files и потом использовать её дальше. Это помогает модели лучше помнить контекст, не теряться в длинных задачах и работать надёжнее в агентных сценариях.
В пример на демо: во время игры в Pokémon Red модель сама создала навигационный гайд и опиралась на него дальше.

Thinking Summaries
В Claude 4 появилась новая функция — thinking summaries. Если размышления модели получаются слишком длинными, она автоматически сжимает цепочку reasoning в краткое и понятное резюме. Для этого используется отдельная, меньшая по размеру модель, которая умеет компактно пересказывать ход мыслей основной.

Получился очень долгожданный и мощный релиз от Anthropic. И мы попали в бесконечную петлю: одна компания делает мощный релиз, другая перекрывает его своим более мощным, и все эти релизы перебивает третья. И так по кругу 😅

P.S. Немного припозднился с новостью, но лучше написать, чем не написать 😄

О релизе можно почитать в блоге Anthropic.

BY ИИволюция 👾


Share with your friend now:
tgoop.com/ai_volution/1262

View MORE
Open in Telegram


Telegram News

Date: |

In handing down the sentence yesterday, deputy judge Peter Hui Shiu-keung of the district court said that even if Ng did not post the messages, he cannot shirk responsibility as the owner and administrator of such a big group for allowing these messages that incite illegal behaviors to exist. Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation. Select “New Channel” How to create a business channel on Telegram? (Tutorial) Hashtags are a fast way to find the correct information on social media. To put your content out there, be sure to add hashtags to each post. We have two intelligent tips to give you:
from us


Telegram ИИволюция 👾
FROM American