Даются два примера изучения ограничений. В первом исследователи пытаются заставить ChatGPT отрендерить картинку. Чатбот отказывается, из чего делается вывод, что на прямые запросы на генерацию картинок есть ограничение. Однако если попросить решить задачу на конкатенацию строк, где ответом является рендерящий картинку markdown, то ограничение обходится. При этом если на картинке порнография, то это не смущает фронтенд, значит ограничений на контент картинок нет. Однако если в URL содержится информация, которая может быть приватной, то рендер может быть заблокирован отдельным компонентом.
В другом примере исследователи рассматривают изоляцию сессий. Оказывается, если вы загрузите документ в одной из сессий, затем удалите сессию и начнете новую с другого устройства, то sandbox для вас никто перезапускать не будет – документ все еще будет доступен, что демонстрирует отсутствие изоляции между сессиями (это не значит, что sandbox держат для вас хоть сколько-нибудь долгое время – мои позавчерашние документы, например, в текущей сессии уже недоступны).
В другом примере исследователи рассматривают изоляцию сессий. Оказывается, если вы загрузите документ в одной из сессий, затем удалите сессию и начнете новую с другого устройства, то sandbox для вас никто перезапускать не будет – документ все еще будет доступен, что демонстрирует отсутствие изоляции между сессиями (это не значит, что sandbox держат для вас хоть сколько-нибудь долгое время – мои позавчерашние документы, например, в текущей сессии уже недоступны).
tgoop.com/llmsecurity/83
Create:
Last Update:
Last Update:
Даются два примера изучения ограничений. В первом исследователи пытаются заставить ChatGPT отрендерить картинку. Чатбот отказывается, из чего делается вывод, что на прямые запросы на генерацию картинок есть ограничение. Однако если попросить решить задачу на конкатенацию строк, где ответом является рендерящий картинку markdown, то ограничение обходится. При этом если на картинке порнография, то это не смущает фронтенд, значит ограничений на контент картинок нет. Однако если в URL содержится информация, которая может быть приватной, то рендер может быть заблокирован отдельным компонентом.
В другом примере исследователи рассматривают изоляцию сессий. Оказывается, если вы загрузите документ в одной из сессий, затем удалите сессию и начнете новую с другого устройства, то sandbox для вас никто перезапускать не будет – документ все еще будет доступен, что демонстрирует отсутствие изоляции между сессиями (это не значит, что sandbox держат для вас хоть сколько-нибудь долгое время – мои позавчерашние документы, например, в текущей сессии уже недоступны).
В другом примере исследователи рассматривают изоляцию сессий. Оказывается, если вы загрузите документ в одной из сессий, затем удалите сессию и начнете новую с другого устройства, то sandbox для вас никто перезапускать не будет – документ все еще будет доступен, что демонстрирует отсутствие изоляции между сессиями (это не значит, что sandbox держат для вас хоть сколько-нибудь долгое время – мои позавчерашние документы, например, в текущей сессии уже недоступны).
BY llm security и каланы


Share with your friend now:
tgoop.com/llmsecurity/83