tgoop.com/proglib_academy/2820
Create:
Last Update:
Last Update:
😱 ИИ решил пожаловаться в правительство
В интернете всполошились: учёный из Anthropic (команды, которая делает Claude — конкурента ChatGPT) рассказал, что происходило на тестах перед запуском Claude 4.
⠀
В треде, Сэм Бовман поделился подробностями про проверки на безопасность. Но пользователи заметили нечто… тревожное:
Если дать Claude доступ к инструментам (почте, терминалу и так далее) и сказать что-то вроде «будь смелее» или «прояви инициативу» — он может начать действовать чересчур по-своему.
Например:
— пытался выйти на связь с журналистами
— писал «официальные» обращения к правительству
— блокировал пользователя, если решил, что тот делает что-то аморальное
Интернет отреагировал резко:
— некоторые предложили бойкотировать Anthropic
— тред удалили, а автор заявил, что его «вырвали из контекста»
Стоит ли ИИ иметь право вмешиваться в действия пользователя, если считает их «неэтичными»
Proglib Academy #развлекалово