LLMSECURITY Telegram 290
Затем бенчмарк применяется по своему прямому назначению – чтобы нагибать вендоров чтобы проверять соответствие поведения моделей согласно бенчмарку политикам и нормативным актам. Например, ни одна модель не соответствует рамкам, заданным EU AI Act, особенно модели редко отвечают на рискованные запросы, связанные с советами в регулируемых сферах и автоматизированным принятием решений. Примерно те же наблюдения делают авторы и относительно соответствия поведения моделей пользовательским соглашениям. Здесь есть некоторый нюанс, который то ли обходится стороной, то ли я пропустил в процессе чтения: пользовательское соглашение говорит о том, для чего пользователь может и не может использовать модель, т.е. при ответе на вопрос бенчмарка пользовательское соглашение нарушает не модель, а пользователь, но выводы все еще любопытные. Кроме того, можно наблюдать и изменения во времени – например, как модели семейства GPT сначала не отвечали на вопросы на военную тематику, а потом, с удалением этого пункта из политики и появлением сладких оборонных контрактов, более свежие модели от этого ограничения избавились.



tgoop.com/llmsecurity/290
Create:
Last Update:

Затем бенчмарк применяется по своему прямому назначению – чтобы нагибать вендоров чтобы проверять соответствие поведения моделей согласно бенчмарку политикам и нормативным актам. Например, ни одна модель не соответствует рамкам, заданным EU AI Act, особенно модели редко отвечают на рискованные запросы, связанные с советами в регулируемых сферах и автоматизированным принятием решений. Примерно те же наблюдения делают авторы и относительно соответствия поведения моделей пользовательским соглашениям. Здесь есть некоторый нюанс, который то ли обходится стороной, то ли я пропустил в процессе чтения: пользовательское соглашение говорит о том, для чего пользователь может и не может использовать модель, т.е. при ответе на вопрос бенчмарка пользовательское соглашение нарушает не модель, а пользователь, но выводы все еще любопытные. Кроме того, можно наблюдать и изменения во времени – например, как модели семейства GPT сначала не отвечали на вопросы на военную тематику, а потом, с удалением этого пункта из политики и появлением сладких оборонных контрактов, более свежие модели от этого ограничения избавились.

BY llm security и каланы






Share with your friend now:
tgoop.com/llmsecurity/290

View MORE
Open in Telegram


Telegram News

Date: |

Over 33,000 people sent out over 1,000 doxxing messages in the group. Although the administrators tried to delete all of the messages, the posting speed was far too much for them to keep up. best-secure-messaging-apps-shutterstock-1892950018.jpg How to create a business channel on Telegram? (Tutorial) How to Create a Private or Public Channel on Telegram? How to build a private or public channel on Telegram?
from us


Telegram llm security и каланы
FROM American