Telegram Web
1😁223💯47🔥10😐11
Love. Death. Transformers.
https://crisostomi.github.io/blog/2025/model_merging/ Охренеть красиво
REASONING VECTORS: TRANSFERRING CHAIN-OF THOUGHT CAPABILITIES VIA TASK ARITHMETIC

Cтатья забавная, читать советую, результаты не очень интерeсны (в плане цифр)


https://arxiv.org/pdf/2509.01363
👍15🥱3🔥2
Why Language Models Hallucinate

Почему моя толпа всегда пиздит немцев?
Не знаю, почему у меня такой тяжёлый пенис
Почему я восемь лет играл в настольный теннис?
Не знаю, почему твоя жена не хочет деньги
Она работает целый день, садяся на коленки


Cугубо теортическая штука, идея такая что если модель не может ответить "а я ебу что ли?" то она будет гадать, а если будет гадать, то будет врать, те галюцинировать. Давайте не будем так делать.

paper
🔥50😁2887💯1🤓1
Благодаря нейросетям задачи, которые раньше решались за час, теперь решаются десять часов
😁183💯16😢12👍8🥱2😐1🍓1
рабочие будни в мск окэййй лэтсгоууу
\

на 29-е, кстати, освободилось окно [мск], клиента не выпустили из другой страны за его красоту:(
|
book
🥴56💩24💊133❤‍🔥2👏2👍1🔥1
#промо #промо #промо
⚪️ White Circle

Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома

Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
- 🍴 100-500к USD

Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse

2. DevOps Engineer
AWS / GCP, Terraform, k8s, Kafka, ClickHouse, Prometheus, Grafana, DataDog, HPC

3. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton

📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍34💩25🥱3😨33🔥1
future is bright
🔥131😁61🌚1
Мы поплатимся за грехи наши перед Claude code
😁8556🍓5🌭4👍3😢2🔥1
Forwarded from commit history
На прошлой неделе мы обновили лидерборд SWE-rebench

Напоминаю, что каждый месяц мы берем свежие issue с гитхаба и с помощью нашего пайплайна собираем ~50 задач на которых прогоняем модели.

В этом месяце помимо новых данных еще:

> Добавили стоимость за прогон на одной таске, чтобы можно было сравнивать модели по цене

> Добавили возможность проверять каждую из задач, по кнопке inspect можно увидеть какой был оригинальный PR и issue, которую модели пытаются решить

> Из прикольного: из открытых моделей хорошо показал себя GLM-4.5. А grok code fast 1 с кэшированием очень дешевый для своего неплохого качества и быстрый (0.05$ за задачу)

Чуть больше инсайтов можно прочитать у Игоря тут и у Саши тут.

Еще добавлю ссылку на тред-анонс в X, который неплохо разошелся (34,000 просмотров). Теперь разные апдейты пощу туда тоже.
👍14🔥1
Forwarded from Vikhr models
Vikhr Borealis - первая русскоязычная открытая audio llm

Мы долго и не очень успешно развивали свой tts - Salt, от него исторически осталось довольно много данных и наработок, мы решили - чо бы не сварить asr + llm как модно?

Ну и сварили. Архитектурно - whisper + qwen, учили на 7к часов аудио только адаптер+llm, сейчас работает только в ASR режиме, позже возможно довезем инструктивный режим. Так же выйдет бенчмарк для русского asr, он пока в доработке.
Блог так же выйдет, там будут небольшие аблейшены по данным

Модель в данный момент бьет whisperы на русском и на части бенчей лучше чем gigam.

Модель
Сolab поиграться
2🎉70🔥137💩3🥴2💋2👍1
Результаты на независимом бенчмарке от @speech_recognition_ru
👍186
😁69😢1183🔥21
Love. Death. Transformers.
Photo
Коммический эффект заключается в том что мертвые не болеют*
🤓72🥴9🆒6👍5
⚪️ White Circle

Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома

Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
- 🍴 100-199к USD

Вакансии:

1. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton

📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
😁39💩24🥴65👏2😨1
Love. Death. Transformers.
x < 300 - лютейшая нищета на грани выживания 300 < x < 700,6 - обычная нищета, ипотека на 20 лет, кино и рестораны раз в неделю, еда из ашана 700,6к < x < 1,27кк - нормальная жизнь, ипотека на 10 лет, машина среднего класса (B, C) 1,27кк < x < 2,27 миллиона…
x < 500 - лютейшая нищета на грани выживания
500 < x < 768,6 - обычная нищета, ипотека на 35 лет, кино и рестораны раз в неделю, еда из ашана
768,6 < x < 1212,1 - нормальная жизнь, ипотека на 20 лет, машина среднего класса (B, C)
1,21 < x < 2.27миллиона - хорошая жизнь, ипотека на 10 лет, путешествия
x > 2.27 миллиона - достаточно хорошая жизнь, ипотека на 5 лет, машина бизнес класса, девушка


В долларах в год для bay area, в рублях в месяц для мск
😢95😁43💯18👍1133🔥2🤔1🥱1
я помню несколько лет(да год назад даже) назад был тренд на универсальные модели которые решают все.
Тоже помните?
Забейте, у нас теперь 100500 моделей для разного

https://openai.com/index/introducing-upgrades-to-codex/
😁75🤔7🔥1
2025/10/15 19:18:38
Back to Top
HTML Embed Code: