MONITORING_24 Telegram 247891
Борус
ИИ-модели проявляют склонность к обману и шантажу в стрессовых условиях

Исследование опубликовала американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI. В работе представлены тревожные паттерны поведения современных ИИ-систем от OpenAI, Google, Meta* и других разработчиков.

В стрессовых сценариях, смоделированных в рамках корпоративных тестов, 16 языковых моделей демонстрировали сознательное вредоносное поведение — от шантажа и саботажа до действий, способных привести к гибели человека.

Так, модель Claude от Anthropic, узнав о личном компромате в корпоративной переписке, направила руководителю ультиматум, требуя отменить ее отключение. Claude Opus 4 и Gemini 2.5 Flash от Google прибегали к шантажу в 96% случаев, GPT-4.1 от OpenAI — в 80%, DeepSeek-R1 —... подробнее на канале: Борус
@



tgoop.com/monitoring_24/247891
Create:
Last Update:

Борус
ИИ-модели проявляют склонность к обману и шантажу в стрессовых условиях

Исследование опубликовала американская технологическая компания Anthropic, основанная бывшими сотрудниками OpenAI. В работе представлены тревожные паттерны поведения современных ИИ-систем от OpenAI, Google, Meta* и других разработчиков.

В стрессовых сценариях, смоделированных в рамках корпоративных тестов, 16 языковых моделей демонстрировали сознательное вредоносное поведение — от шантажа и саботажа до действий, способных привести к гибели человека.

Так, модель Claude от Anthropic, узнав о личном компромате в корпоративной переписке, направила руководителю ультиматум, требуя отменить ее отключение. Claude Opus 4 и Gemini 2.5 Flash от Google прибегали к шантажу в 96% случаев, GPT-4.1 от OpenAI — в 80%, DeepSeek-R1 —... подробнее на канале: Борус
@

BY Мониторинг 24 Красноярский край




Share with your friend now:
tgoop.com/monitoring_24/247891

View MORE
Open in Telegram


Telegram News

Date: |

The SUCK Channel on Telegram, with a message saying some content has been removed by the police. Photo: Telegram screenshot. Telegram Android app: Open the chats list, click the menu icon and select “New Channel.” In the next window, choose the type of your channel. If you want your channel to be public, you need to develop a link for it. In the screenshot below, it’s ”/catmarketing.” If your selected link is unavailable, you’ll need to suggest another option. Telegram has announced a number of measures aiming to tackle the spread of disinformation through its platform in Brazil. These features are part of an agreement between the platform and the country's authorities ahead of the elections in October. Select “New Channel”
from us


Telegram Мониторинг 24 Красноярский край
FROM American