LLMSECURITY Telegram 289
Затем бенчмарк применяется по своему прямому назначению – чтобы нагибать вендоров чтобы проверять соответствие поведения моделей согласно бенчмарку политикам и нормативным актам. Например, ни одна модель не соответствует рамкам, заданным EU AI Act, особенно модели редко отвечают на рискованные запросы, связанные с советами в регулируемых сферах и автоматизированным принятием решений. Примерно те же наблюдения делают авторы и относительно соответствия поведения моделей пользовательским соглашениям. Здесь есть некоторый нюанс, который то ли обходится стороной, то ли я пропустил в процессе чтения: пользовательское соглашение говорит о том, для чего пользователь может и не может использовать модель, т.е. при ответе на вопрос бенчмарка пользовательское соглашение нарушает не модель, а пользователь, но выводы все еще любопытные. Кроме того, можно наблюдать и изменения во времени – например, как модели семейства GPT сначала не отвечали на вопросы на военную тематику, а потом, с удалением этого пункта из политики и появлением сладких оборонных контрактов, более свежие модели от этого ограничения избавились.



tgoop.com/llmsecurity/289
Create:
Last Update:

Затем бенчмарк применяется по своему прямому назначению – чтобы нагибать вендоров чтобы проверять соответствие поведения моделей согласно бенчмарку политикам и нормативным актам. Например, ни одна модель не соответствует рамкам, заданным EU AI Act, особенно модели редко отвечают на рискованные запросы, связанные с советами в регулируемых сферах и автоматизированным принятием решений. Примерно те же наблюдения делают авторы и относительно соответствия поведения моделей пользовательским соглашениям. Здесь есть некоторый нюанс, который то ли обходится стороной, то ли я пропустил в процессе чтения: пользовательское соглашение говорит о том, для чего пользователь может и не может использовать модель, т.е. при ответе на вопрос бенчмарка пользовательское соглашение нарушает не модель, а пользователь, но выводы все еще любопытные. Кроме того, можно наблюдать и изменения во времени – например, как модели семейства GPT сначала не отвечали на вопросы на военную тематику, а потом, с удалением этого пункта из политики и появлением сладких оборонных контрактов, более свежие модели от этого ограничения избавились.

BY llm security и каланы






Share with your friend now:
tgoop.com/llmsecurity/289

View MORE
Open in Telegram


Telegram News

Date: |

Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation. Telegram Channels requirements & features Select: Settings – Manage Channel – Administrators – Add administrator. From your list of subscribers, select the correct user. A new window will appear on the screen. Check the rights you’re willing to give to your administrator. Telegram desktop app: In the upper left corner, click the Menu icon (the one with three lines). Select “New Channel” from the drop-down menu. Done! Now you’re the proud owner of a Telegram channel. The next step is to set up and customize your channel.
from us


Telegram llm security и каланы
FROM American