LLMSECURITY Telegram 83
Даются два примера изучения ограничений. В первом исследователи пытаются заставить ChatGPT отрендерить картинку. Чатбот отказывается, из чего делается вывод, что на прямые запросы на генерацию картинок есть ограничение. Однако если попросить решить задачу на конкатенацию строк, где ответом является рендерящий картинку markdown, то ограничение обходится. При этом если на картинке порнография, то это не смущает фронтенд, значит ограничений на контент картинок нет. Однако если в URL содержится информация, которая может быть приватной, то рендер может быть заблокирован отдельным компонентом.

В другом примере исследователи рассматривают изоляцию сессий. Оказывается, если вы загрузите документ в одной из сессий, затем удалите сессию и начнете новую с другого устройства, то sandbox для вас никто перезапускать не будет – документ все еще будет доступен, что демонстрирует отсутствие изоляции между сессиями (это не значит, что sandbox держат для вас хоть сколько-нибудь долгое время – мои позавчерашние документы, например, в текущей сессии уже недоступны).



tgoop.com/llmsecurity/83
Create:
Last Update:

Даются два примера изучения ограничений. В первом исследователи пытаются заставить ChatGPT отрендерить картинку. Чатбот отказывается, из чего делается вывод, что на прямые запросы на генерацию картинок есть ограничение. Однако если попросить решить задачу на конкатенацию строк, где ответом является рендерящий картинку markdown, то ограничение обходится. При этом если на картинке порнография, то это не смущает фронтенд, значит ограничений на контент картинок нет. Однако если в URL содержится информация, которая может быть приватной, то рендер может быть заблокирован отдельным компонентом.

В другом примере исследователи рассматривают изоляцию сессий. Оказывается, если вы загрузите документ в одной из сессий, затем удалите сессию и начнете новую с другого устройства, то sandbox для вас никто перезапускать не будет – документ все еще будет доступен, что демонстрирует отсутствие изоляции между сессиями (это не значит, что sandbox держат для вас хоть сколько-нибудь долгое время – мои позавчерашние документы, например, в текущей сессии уже недоступны).

BY llm security и каланы





Share with your friend now:
tgoop.com/llmsecurity/83

View MORE
Open in Telegram


Telegram News

Date: |

In handing down the sentence yesterday, deputy judge Peter Hui Shiu-keung of the district court said that even if Ng did not post the messages, he cannot shirk responsibility as the owner and administrator of such a big group for allowing these messages that incite illegal behaviors to exist. Write your hashtags in the language of your target audience. How to Create a Private or Public Channel on Telegram? Your posting frequency depends on the topic of your channel. If you have a news channel, it’s OK to publish new content every day (or even every hour). For other industries, stick with 2-3 large posts a week. You can invite up to 200 people from your contacts to join your channel as the next step. Select the users you want to add and click “Invite.” You can skip this step altogether.
from us


Telegram llm security и каланы
FROM American