llm security и каланы@llmsecurity P.73

llm security и каланы

Исследователи представляют концепт враждебных самореплицирующихся затравок (adversarial self-replicating prompt). На основе такой затравки они создают GenAI-«червя», который называют Morris II. Для тех, кто не углублялся так далеко в историю вредоносного ПО, червь – это самореплицирующаяся вредоносная программа, распространяющаяся через компьютерные сети (в отличие от вирусов, которые распространяются, инфицируя другие программы, или троянов, которых люди скачивают сами). Червь Морриса был первым сетевым червем, который нанес серьезный ущерб тогдашнему ~~интернету~~ арпанету: он сам по себе, кроме самовоспроизведения, ничего плохого, типа удаления файлов, не делал, но из-за ошибки самовоспроизводился так активно 😏, что клал так тогдашние хилые хосты, так и не очень-то производительную сеть.

If Morris is so good, why isn’t there Morris II, подумали исследователи и обозвали свое исследование в честь легендарного червя, достаточно сильно задрав ожидания от дальнейшего текста. По заявлению авторов, реализация такой концепции несет угрозу GenAI-экосистемам, которые будут подвержены zero-click-заражениям и, попав под действие «червя», начнут тотчас же генерировать спам и рассылать пропаганду.

www.tgoop.com/llmsecurity/73

104 viewsMar 1, 2024 at 20:31

tgoop.com/llmsecurity/73

Create: 2024-03-01
Last Update: 2025-07-06 19:23:44

BY llm security и каланы

Share with your friend now:
tgoop.com/llmsecurity/73

Telegram News

Исследователи представляют концепт враждебных самореплицирующихся затравок (adversarial self-replicating prompt). На основе такой затравки они создают GenAI-«червя»