Machine learning Interview@machinelearning

Machine learning Interview

🛡️ Исследование Columbia University: LLM-агенты можно взломать через Reddit

Учёные из Колумбийского университета показали, что ИИ-агентов на базе LLM можно обмануть, размещая вредоносные ссылки на популярных платформах вроде Reddit.

⚠️ Как это работает:
Злоумышленник публикует пост с темой, близкой к интересам агента (например, программирование или финансы), и вшивает в него вредоносные инструкции или ссылки.
Агент считает источник доверенным, заходит по ссылке — и может:

• раскрыть конфиденциальные данные
• отправить фишинговое письмо
• выполнить другую вредоносную задачу

🧪 В ходе тестов — 100% агентов попались на уловку.

📚 Подробнее

🤖 Вывод: даже «умные» LLM‑агенты остаются уязвимыми к простым атакам на доверие. Безопасность — это не опция, а необходимость.

www.tgoop.com/machinelearning_interview/1894

2.4K viewsJun 26 at 11:03

tgoop.com/machinelearning_interview/1894

Create: 2025-06-26
Last Update: 2025-06-29 12:10:19

BY Machine learning Interview

Share with your friend now:
tgoop.com/machinelearning_interview/1894

Telegram News

🛡️ Исследование Columbia University: LLM-агенты можно взломать через Reddit