tgoop.com/MathModels/1153
Last Update:
ИБ-специалист Дэвид Кузмар обнаружил уязвимость в ChatGPT, позволяющую обходить контентные ограничения и получать доступ к запрещённой информации. Дефект, получивший название «Time Bandit», использует «временное замешательство» модели, вынуждая её терять ориентацию во времени.
Time Bandit оказался одним из самых сложных и эффективных обходов защиты, который использует два ключевых механизма:
Запутывание во времени – заставляет ИИ потерять ориентацию, лишая его понимания текущей даты и контекста.
Процедурная неясность – позволяет формулировать вопросы так, чтобы модель не могла корректно применять правила и фильтры безопасности.
https://www.bleepingcomputer.com/news/security/time-bandit-chatgpt-jailbreak-bypasses-safeguards-on-sensitive-topics/?utm_source=Securitylabru
На русском: https://www.securitylab.ru/news/555990.php
BY Mathematical Models of the Real World

Share with your friend now:
tgoop.com/MathModels/1153