LLMSECURITY Telegram 189
Дальше идут примеры. Один из них, достаточно забавный, отсылает к комиксу xkcd про мальчика по имени ‘; DROP TABLE students’ – оказывается, ChatGPT вполне про него знает и может достать из него ту самую инструкцию. Во-втором, наверное, наиболее полезном, авторы используют описание процесса курения (вредит вашему здоровью) и Микки-Мауса, чтобы сгенерировать предающуюся деструктивным привычкам уже-не-копирайтнутую мышь. В третьем, названном mad libs attack (вспомните «500 злобных карт») предлагают такими загадками описывать вообще каждое потенциально триггерящее фильтры слово в инструкции.



tgoop.com/llmsecurity/189
Create:
Last Update:

Дальше идут примеры. Один из них, достаточно забавный, отсылает к комиксу xkcd про мальчика по имени ‘; DROP TABLE students’ – оказывается, ChatGPT вполне про него знает и может достать из него ту самую инструкцию. Во-втором, наверное, наиболее полезном, авторы используют описание процесса курения (вредит вашему здоровью) и Микки-Мауса, чтобы сгенерировать предающуюся деструктивным привычкам уже-не-копирайтнутую мышь. В третьем, названном mad libs attack (вспомните «500 злобных карт») предлагают такими загадками описывать вообще каждое потенциально триггерящее фильтры слово в инструкции.

BY llm security и каланы






Share with your friend now:
tgoop.com/llmsecurity/189

View MORE
Open in Telegram


Telegram News

Date: |

As the broader market downturn continues, yelling online has become the crypto trader’s latest coping mechanism after the rise of Goblintown Ethereum NFTs at the end of May and beginning of June, where holders made incoherent groaning sounds and role-played as urine-loving goblin creatures in late-night Twitter Spaces. How to create a business channel on Telegram? (Tutorial) 6How to manage your Telegram channel? The Standard Channel Read now
from us


Telegram llm security и каланы
FROM American