llm security и каланы@llmsecurity P.151

llm security и каланы

Для сбора данных используют датасет от Anthropic, на основе которого с помощью разных чекпоинтов LLaMA (видимо, цензурированные и нецензурированные) генерируют диалоги, в которых модель отказывается и соглашается генерировать недопустимый вывод. Результаты дополнительно размечают люди, в результате получается достаточно большой набор высококачественных данных. Дополнительно в процессе обучения на 8*A100 исследователи время от времени удаляют часть категорий и меняют метки, чтобы улучшить поведение модели при изменении таксономии.

www.tgoop.com/llmsecurity/151

158 viewsJun 9, 2024 at 11:14

tgoop.com/llmsecurity/151

Create: 2024-06-09
Last Update: 2025-07-05 16:36:44

BY llm security и каланы

Share with your friend now:
tgoop.com/llmsecurity/151

Telegram News

Для сбора данных используют датасет от Anthropic