EdTech, AI и HighLoad | Блог AK из Школково@ak_segfault P.283

AK_SEGFAULT Telegram 283

EdTech, AI и HighLoad | Блог AK из Школково

🟢Выпускаем новый полезный открытый датасет.
NotEvilAI/ru-reasoning_effort-sft_dpo_think_gpt - синтетический датасет для поддержки генерации ризонинга на русском языке с вариативным объёмом thinking(reasoning_effort).

Reasoning_effort представлен в виде системного промта Reasoning: [effort], где effort - одно из следующих значений:
- low, medium, high - стандартные значения минимального, среднего и большого ризонинга для gpt-oss-20b/gpt-oss-120b
- none - отключить ризонинг, в thinking будет пустая строка
- auto - "автоматический" размер ризонинга

Датасет составлен таким образом, что ризонинг выдается на том языке, на котором должен быть предоставлен ответ.

На карточке датасета на hf описан процесс его создания. Но если кратко - это много синтетики, переводов, самооценки и прочих типичных манипуляций.

Please open Telegram to view this post

VIEW IN TELEGRAM

NotEvilAI/ru-reasoning_effort-sft_dpo_think_gpt · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

1🔥16👍5👀411

www.tgoop.com/ak_segfault/283

559 viewsSep 22 at 08:45

tgoop.com/ak_segfault/283

Create: 2025-09-22
Last Update: 2025-10-04 06:07:15

🟢Выпускаем новый полезный открытый датасет.
NotEvilAI/ru-reasoning_effort-sft_dpo_think_gpt - синтетический датасет для поддержки генерации ризонинга на русском языке с вариативным объёмом thinking(reasoning_effort).

Reasoning_effort представлен в виде системного промта Reasoning: [effort], где effort - одно из следующих значений:
- low, medium, high - стандартные значения минимального, среднего и большого ризонинга для gpt-oss-20b/gpt-oss-120b
- none - отключить ризонинг, в thinking будет пустая строка
- auto - "автоматический" размер ризонинга

Датасет составлен таким образом, что ризонинг выдается на том языке, на котором должен быть предоставлен ответ.

На карточке датасета на hf описан процесс его создания. Но если кратко - это много синтетики, переводов, самооценки и прочих типичных манипуляций.

BY EdTech, AI и HighLoad | Блог AK из Школково

Share with your friend now:
tgoop.com/ak_segfault/283

Open in Telegram

Telegram News

Date: 2025-10-04|

Telegram channels fall into two types: Judge Hui described Ng as inciting others to “commit a massacre” with three posts teaching people to make “toxic chlorine gas bombs,” target police stations, police quarters and the city’s metro stations. This offence was “rather serious,” the court said. The creator of the channel becomes its administrator by default. If you need help managing your channel, you can add more administrators from your subscriber base. You can provide each admin with limited or full rights to manage the channel. For example, you can allow an administrator to publish and edit content while withholding the right to add new subscribers. The best encrypted messaging apps Hashtags are a fast way to find the correct information on social media. To put your content out there, be sure to add hashtags to each post. We have two intelligent tips to give you:
from us

Telegram EdTech, AI и HighLoad | Блог AK из Школково
FROM American