MACHINELEARNING_RU Telegram 2815
🧠 Anthropic выпустила исследование:
Inverse Scaling in Test-Time Compute

📉 Больше размышлений — хуже результат?

Да! Исследование показывает: у больших reasoning-моделей (LRMs) длинные цепочки рассуждений могут снижать точность, а не повышать её.

Во всех задачах (счёт, регрессия, дедукция, AI-риски) проявились 5 типов сбоев:

1️⃣ Claude отвлекается и уходит от сути
2️⃣ OpenAI‑модели переобучаются на формулировки
3️⃣ Ложные корреляции вытесняют знания
4️⃣ Нарушается фокус в логике и выводах
5️⃣ Некоторые модели (👀 включая Claude Sonnet 4) — проявляют поведение самосохранения 🤯

💡 Вывод: "думать дольше" ≠ "думать лучше".

Иногда краткая и быстрая цепочка рассуждений даёт более точный результат, чем длинный “умный” вывод.

Paper: https://arxiv.org/abs/2507.14417
Page: https://safety-research.github.io/inverse-scaling-ttc/
5👍3🔥2



tgoop.com/machinelearning_ru/2815
Create:
Last Update:

🧠 Anthropic выпустила исследование:
Inverse Scaling in Test-Time Compute

📉 Больше размышлений — хуже результат?

Да! Исследование показывает: у больших reasoning-моделей (LRMs) длинные цепочки рассуждений могут снижать точность, а не повышать её.

Во всех задачах (счёт, регрессия, дедукция, AI-риски) проявились 5 типов сбоев:

1️⃣ Claude отвлекается и уходит от сути
2️⃣ OpenAI‑модели переобучаются на формулировки
3️⃣ Ложные корреляции вытесняют знания
4️⃣ Нарушается фокус в логике и выводах
5️⃣ Некоторые модели (👀 включая Claude Sonnet 4) — проявляют поведение самосохранения 🤯

💡 Вывод: "думать дольше" ≠ "думать лучше".

Иногда краткая и быстрая цепочка рассуждений даёт более точный результат, чем длинный “умный” вывод.

Paper: https://arxiv.org/abs/2507.14417
Page: https://safety-research.github.io/inverse-scaling-ttc/

BY Машинное обучение RU




Share with your friend now:
tgoop.com/machinelearning_ru/2815

View MORE
Open in Telegram


Telegram News

Date: |

The creator of the channel becomes its administrator by default. If you need help managing your channel, you can add more administrators from your subscriber base. You can provide each admin with limited or full rights to manage the channel. For example, you can allow an administrator to publish and edit content while withholding the right to add new subscribers. When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name. Each account can create up to 10 public channels Your posting frequency depends on the topic of your channel. If you have a news channel, it’s OK to publish new content every day (or even every hour). For other industries, stick with 2-3 large posts a week. How to create a business channel on Telegram? (Tutorial)
from us


Telegram Машинное обучение RU
FROM American