Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
- Telegram Web
Telegram Web
✈️ Кому тоже периодами требуется хотфикс для мозга?

Иногда, чтобы не сдохнуть поймать правильное настроение перед новым сезоном, нужно просто сменить декорации.
В этот раз перед учебным годом было решено отправиться в Калининград.

И вот Калининград. Саша, наш ИИ-инженер, очень любит этот город. Он составил хороший список значимых мест для посещения, по ним собственно я и ходил-вдохновлялся и заряжался. Ну и конечно же одним Калининградом нельзя обойтись - поэтому ещё и в Светлогорск и Зеленоградск надо съездить обязательно.

Каждый новый проект для меня, как новый город: чтобы увидеть перспективы, нужно иногда просто сменить точку обзора. Поэтому — небольшая пауза на перезагрузку, и уже скоро возвращаюсь назад и вперёд штурмовать новые проекты!

Кстати, через недельку примерно будет любопытный анонс, да😉
13🔥541
This media is not supported in your browser
VIEW IN TELEGRAM
13🔥12👍7
Блин, кружочек ограничен по времени, поэтому всё не поместилось.
У нас в @ZeroAgency с нулевого дня была традиция - поздравлять каждого сотрудника с днём рождения, а тот соответственно угощения приносит всякие(пицца, шашлык, роллы).

И вот сейчас, когда нас уже чуть меньше сотни - каждую неделю мы празднуем чей-то др. Даже если это удалёнщик - мы все собираемся и записываем ему видео поздравление.
Ну и иногда у нас бывают вот такие дни, когда мы поздравляем сразу нескольких человек.

В общем, у нас хорошо. Приходите к нам работать!

Контакты HR: @Valeria_840
🔥1797👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥143111
Пояснения к кружку.

Что оптимизировали собственно:
- Обороты вентиляторов GPU-сервера теперь не на полную катушку, а в зависимости от температуры GPU.
- Работают сразу два кондиционера вместо одного.
- Преграда в виде минваты и запененные дырки между серверной и офисом => минус шум.

Троттлинга и просадки по производительности кстати нет. Сервер теперь работает 24/7.

Проект "Шум-бокс" временно отменён за ненадобностью - мы просто улучшим "минеральную преграду", чтобы она была более пожаробезопасной и удобной.
513🔥6👍5
🥳 Сегодня я официально зарегистрировал новую компанию - NotEvil AI (ООО "Незлой ИИ").

В рамках этой организации мы будем заниматься искусственным интеллектом и разрабатывать нашу no-code платформу автоматизации ИИ - AIChief.
ZeroAgency в свою очередь сосредоточится на разработке образовательных и high-load платформ.

Ну а AIChief разрабатывается полным ходом, уже тестируем его внедрение для нескольких компаний в различных сценариях. И там не только Школково уже😉
Конечно же, часть AI наработок пойдет в open-source.

Stay tuned...

PS: На днях выложим скорее всего один любопытный датасет и к нему модельку. Пока что треним с различными гипер-параметрами и замеряем.
1🔥2587👍4
Размин​очка. Угадайте стадию обучения по графику загрузки GPU
🔥52🤔2
Страшные схемы на офисной доске как отдельный вид искусства. Кто угадает, что мы тут обсуждали?
🔥76👀3🤔22
Наша почти уже регулярная рубрика «страшные схемы на офисной доске»
108🔥7🤔11
🟢Выпускаем новый полезный открытый датасет.
NotEvilAI/ru-reasoning_effort-sft_dpo_think_gpt - синтетический датасет для поддержки генерации ризонинга на русском языке с вариативным объёмом thinking(reasoning_effort).

Reasoning_effort представлен в виде системного промта Reasoning: [effort], где effort - одно из следующих значений:
- low, medium, high - стандартные значения минимального, среднего и большого ризонинга для gpt-oss-20b/gpt-oss-120b
- none - отключить ризонинг, в thinking будет пустая строка
- auto - "автоматический" размер ризонинга

Датасет составлен таким образом, что ризонинг выдается на том языке, на котором должен быть предоставлен ответ.

На карточке датасета на hf описан процесс его создания. Но если кратко - это много синтетики, переводов, самооценки и прочих типичных манипуляций.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥16👍5👀411
🔴Продолжаем день релизов - новая открытая моделька!
NotEvilAI/gpt-oss-20b-ru-reasoner - экспериментальная модель, full fine-tuning gpt-oss-20b для поддержки генерации ответов с русским ризонингом с двумя дополнительными режимами reasoning_effort - auto и none.

Спрашиваем на английском - думает на английском, как оригинальная модель. Спрашиваем на русском - думает по-русски. И не надо никаких reasoning language: Russian.

Модель тренировалась в 2 стадии - SFT и DPO на основе нашего синтетического датасета русского ризонинга.

Мы выложили bf16 версию на 20b.
Ставьте 👍, если хотите аналогичную модель на 120b.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍27🔥13632
В комментариях спрашивают "В чём прикол тратить столько ресурсов на опенсорс?"
С удовольствием отвечу и подсвечу нашу позицию.

На составление датасета на самом деле ушло больше ресурсов, чем на обучение модели. Семплирование, оценка, верификация - это не быстро. На весь датасет ушло в общей сложности около двух недель.

Всё это мы делаем конечно же не просто так, а в первую очередь в рамках своих собственных коммерческих задач. GPT-OSS хорошо подходит для многих сценариев, но с таким тюнингом его сфера применения для нас ещё больше расширяется. Сейчас мы разрабатываем свою no-code платформу для ИИ-автоматизации и обучения моделей. Какие-то процессы там работают на вариациях нашего Zero-Mistral, а какие-то работают на GPT-OSS.

Конечно же, мы могли бы как и многие компании пожадничать и оставить все наработки закрытыми, но:
1. Хороших "рабочих" данных на русском языке не так много. Чем больше данных - тем быстрее движется сама индустрия и русский сегмент в частности. Лично я верю в сообщество - именно благодаря открытым работам я в своё время начинал вообще путь этого вашего AI и LLM(да и в айти я входил примерно аналогично). Нам не жалко, а другим может быть полезно.
2. Продавать такие датасеты и модели малоперспективно в нынешних реалиях. Плюс есть лицензионные и юридические ограничения. Связываться с этим сегментом рынка не хочется вообще - у нас другой продукт.
3. Надо вдохновлять других разработчиков на новые крутые штуки! Сегодня они увидели какую-то модельку или датасет, а завтра эти таланты уже создают реальные полезные продукты, которыми мы сами с вами будем пользоваться. Кто знает, может потом кто-нибудь из этих людей присоединится к нашей команде и станет сотрудником моей второй компании (кстати Валерия HR ждёт вас тут @Valeria_840).

У нас в ZeroAgency & NotEvil AI любят open-source. Чего и вам советую!
27🔥126👍1
А вот и очередная конфа. Посмотрим 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥198👀743
2025/10/08 09:56:39
Back to Top
HTML Embed Code: