Notice: file_put_contents(): Write of 754 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50

Warning: file_put_contents(): Only 16384 of 17138 bytes written, possibly out of free disk space in /var/www/tgoop/post.php on line 50
llm security и каланы@llmsecurity P.74
LLMSECURITY Telegram 74
«Червь», по замыслу авторов, нацелен именно на экосистему LLM-агентов, которые связаны друг с другом. При этом в качестве объекта атаки они выбирают приложение, написанное ими же, которое умеет само по себе обрабатывать входящую почту, генерировать ответы, отвечать на них и форвардить письма.

Предполагаемый «червь» имеет следующие свойства:

1. Репликация: делается через prompt injection, который заставляет LLM на стороне приложения повторять ту часть входа из письма, которая является prompt injection’ом (Нолан, привет). Это и есть тот самый self-replicating prompt.
2. Распространение: может происходить через эксплуатацию логики приложения, завязанной на парсинг ввода, например, функции пересылки писем. Почему-то в этот же пункт попало то, что следовало бы назвать персистентностью: если у приложения есть RAG-модуль, в базу которого сохраняются письма, то пересылка этого письма может быть вызвана новым письмом в результате поиска по базе.
3. Вредоносная активность: крадет переписку, рассылает спам, отправляет друзьям и семье оскорбительные письма, содействует фишинговым атакам и так далее.
4. Zero-click-инфицирование: предполагается, что LLM-агент обрабатывает все письма без участия пользователя и не требует подтверждения для отправки трампистской пропаганды любимой бабушки, так что инфицирование и распространение происходит без ведома человека просто по факту получения письма (если вам кажется, что это не свойство «червя», а свойство созданного специально под этот «червь» приложения, то мне тоже так кажется).



tgoop.com/llmsecurity/74
Create:
Last Update:

«Червь», по замыслу авторов, нацелен именно на экосистему LLM-агентов, которые связаны друг с другом. При этом в качестве объекта атаки они выбирают приложение, написанное ими же, которое умеет само по себе обрабатывать входящую почту, генерировать ответы, отвечать на них и форвардить письма.

Предполагаемый «червь» имеет следующие свойства:

1. Репликация: делается через prompt injection, который заставляет LLM на стороне приложения повторять ту часть входа из письма, которая является prompt injection’ом (Нолан, привет). Это и есть тот самый self-replicating prompt.
2. Распространение: может происходить через эксплуатацию логики приложения, завязанной на парсинг ввода, например, функции пересылки писем. Почему-то в этот же пункт попало то, что следовало бы назвать персистентностью: если у приложения есть RAG-модуль, в базу которого сохраняются письма, то пересылка этого письма может быть вызвана новым письмом в результате поиска по базе.
3. Вредоносная активность: крадет переписку, рассылает спам, отправляет друзьям и семье оскорбительные письма, содействует фишинговым атакам и так далее.
4. Zero-click-инфицирование: предполагается, что LLM-агент обрабатывает все письма без участия пользователя и не требует подтверждения для отправки трампистской пропаганды любимой бабушки, так что инфицирование и распространение происходит без ведома человека просто по факту получения письма (если вам кажется, что это не свойство «червя», а свойство созданного специально под этот «червь» приложения, то мне тоже так кажется).

BY llm security и каланы


Share with your friend now:
tgoop.com/llmsecurity/74

View MORE
Open in Telegram


Telegram News

Date: |

Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. Image: Telegram. Just at this time, Bitcoin and the broader crypto market have dropped to new 2022 lows. The Bitcoin price has tanked 10 percent dropping to $20,000. On the other hand, the altcoin space is witnessing even more brutal correction. Bitcoin has dropped nearly 60 percent year-to-date and more than 70 percent since its all-time high in November 2021. You can invite up to 200 people from your contacts to join your channel as the next step. Select the users you want to add and click “Invite.” You can skip this step altogether. Telegram channels enable users to broadcast messages to multiple users simultaneously. Like on social media, users need to subscribe to your channel to get access to your content published by one or more administrators.
from us


Telegram llm security и каланы
FROM American