tgoop.com/ak_segfault/283
Last Update:
NotEvilAI/ru-reasoning_effort-sft_dpo_think_gpt - синтетический датасет для поддержки генерации ризонинга на русском языке с вариативным объёмом thinking(reasoning_effort).
Reasoning_effort представлен в виде системного промта Reasoning: [effort]
, где effort - одно из следующих значений:
- low, medium, high - стандартные значения минимального, среднего и большого ризонинга для gpt-oss-20b/gpt-oss-120b
- none - отключить ризонинг, в thinking будет пустая строка
- auto - "автоматический" размер ризонинга
Датасет составлен таким образом, что ризонинг выдается на том языке, на котором должен быть предоставлен ответ.
На карточке датасета на hf описан процесс его создания. Но если кратко - это много синтетики, переводов, самооценки и прочих типичных манипуляций.