Love. Death. Transformers.
https://crisostomi.github.io/blog/2025/model_merging/ Охренеть красиво
REASONING VECTORS: TRANSFERRING CHAIN-OF THOUGHT CAPABILITIES VIA TASK ARITHMETIC
Cтатья забавная, читать советую, результаты не очень интерeсны (в плане цифр)
https://arxiv.org/pdf/2509.01363
Cтатья забавная, читать советую, результаты не очень интерeсны (в плане цифр)
https://arxiv.org/pdf/2509.01363
👍15🥱3🔥2
Why Language Models Hallucinate
Cугубо теортическая штука, идея такая что если модель не может ответить "а я ебу что ли?" то она будет гадать, а если будет гадать, то будет врать, те галюцинировать. Давайте не будем так делать.
paper
Почему моя толпа всегда пиздит немцев?
Не знаю, почему у меня такой тяжёлый пенис
Почему я восемь лет играл в настольный теннис?
Не знаю, почему твоя жена не хочет деньги
Она работает целый день, садяся на коленки
Cугубо теортическая штука, идея такая что если модель не может ответить "а я ебу что ли?" то она будет гадать, а если будет гадать, то будет врать, те галюцинировать. Давайте не будем так делать.
paper
🔥50😁28 8 7💯1🤓1
Forwarded from Пресс-служба Сириона
Благодаря нейросетям задачи, которые раньше решались за час, теперь решаются десять часов
😁183💯16😢12👍8🥱2😐1🍓1
Forwarded from Juls kolet d̶̜̞̥̯̟̽̂̌ͅr̵̐͐͘ ̙̙͚̞̦̻͜a̵̞͉͖͚̬͇̙͉͌̽̋̀̎͂̈́̄̀̕ͅĭ̶̉̈́̕ ̢͇̩̖̯͓̮͚͓̓͜ ̝ǹ̶̡͖̯͕̓̄̆̍͊̒͘
рабочие будни в мск окэййй лэтсгоууу
\
на 29-е, кстати, освободилось окно [], клиента не выпустили из другой страны за его красоту:(
|
book
\
мск
|
book
🥴56💩24💊13 3❤🔥2👏2👍1🔥1
#промо #промо #промо
⚪️ White Circle
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
-🍴 100-500к USD
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. DevOps Engineer
AWS / GCP, Terraform, k8s, Kafka, ClickHouse, Prometheus, Grafana, DataDog, HPC
3. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
⚪️ White Circle
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
-
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. DevOps Engineer
AWS / GCP, Terraform, k8s, Kafka, ClickHouse, Prometheus, Grafana, DataDog, HPC
3. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍34💩25🥱3😨3 3🔥1
Forwarded from commit history
На прошлой неделе мы обновили лидерборд SWE-rebench
Напоминаю, что каждый месяц мы берем свежие issue с гитхаба и с помощью нашего пайплайна собираем ~50 задач на которых прогоняем модели.
В этом месяце помимо новых данных еще:
> Добавили стоимость за прогон на одной таске, чтобы можно было сравнивать модели по цене
> Добавили возможность проверять каждую из задач, по кнопке inspect можно увидеть какой был оригинальный PR и issue, которую модели пытаются решить
> Из прикольного: из открытых моделей хорошо показал себя GLM-4.5. А grok code fast 1 с кэшированием очень дешевый для своего неплохого качества и быстрый (0.05$ за задачу)
Чуть больше инсайтов можно прочитать у Игоря тут и у Саши тут.
Еще добавлю ссылку на тред-анонс в X, который неплохо разошелся (34,000 просмотров). Теперь разные апдейты пощу туда тоже.
Напоминаю, что каждый месяц мы берем свежие issue с гитхаба и с помощью нашего пайплайна собираем ~50 задач на которых прогоняем модели.
В этом месяце помимо новых данных еще:
> Добавили стоимость за прогон на одной таске, чтобы можно было сравнивать модели по цене
> Добавили возможность проверять каждую из задач, по кнопке inspect можно увидеть какой был оригинальный PR и issue, которую модели пытаются решить
> Из прикольного: из открытых моделей хорошо показал себя GLM-4.5. А grok code fast 1 с кэшированием очень дешевый для своего неплохого качества и быстрый (0.05$ за задачу)
Чуть больше инсайтов можно прочитать у Игоря тут и у Саши тут.
Еще добавлю ссылку на тред-анонс в X, который неплохо разошелся (34,000 просмотров). Теперь разные апдейты пощу туда тоже.
Telegram
Сиолошная
В SWE-ReBench добавили 52 новых задачи за август, результаты по ним на первой картинке. Напомню, что это бенчмарк-аналог SWE-Bench, где задачи собираются с GitHub за последний месяц, и модели точно не могли видеть решения во время тренировки.
Claude Sonnet…
Claude Sonnet…
👍14🔥1
Forwarded from Vikhr models
Vikhr Borealis - первая русскоязычная открытая audio llm
Мы долго и не очень успешно развивали свой tts - Salt, от него исторически осталось довольно много данных и наработок, мы решили - чо бы не сварить asr + llm как модно?
Ну и сварили. Архитектурно - whisper + qwen, учили на 7к часов аудио только адаптер+llm, сейчас работает только в ASR режиме, позже возможно довезем инструктивный режим. Так же выйдет бенчмарк для русского asr, он пока в доработке.
Блог так же выйдет, там будут небольшие аблейшены по данным
Модель в данный момент бьет whisperы на русском и на части бенчей лучше чем gigam.
Модель
Сolab поиграться
Мы долго и не очень успешно развивали свой tts - Salt, от него исторически осталось довольно много данных и наработок, мы решили - чо бы не сварить asr + llm как модно?
Ну и сварили. Архитектурно - whisper + qwen, учили на 7к часов аудио только адаптер+llm, сейчас работает только в ASR режиме, позже возможно довезем инструктивный режим. Так же выйдет бенчмарк для русского asr, он пока в доработке.
Блог так же выйдет, там будут небольшие аблейшены по данным
Модель в данный момент бьет whisperы на русском и на части бенчей лучше чем gigam.
Модель
Сolab поиграться
2🎉70🔥13 7💩3🥴2💋2👍1
Love. Death. Transformers.
Photo
Коммический эффект заключается в том что мертвые не болеют*
🤓72🥴9🆒6👍5
⚪️ White Circle
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
- 🍴 100-199к USD
Вакансии:
1. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
- 🍴 100-199к USD
Вакансии:
1. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
😁39💩24🥴6 5👏2😨1
Love. Death. Transformers.
Шутки шутками, а у меня реально же куплено два сервера которые стоят сопоставимо с небольшим домом....
Он реально лысый, в разводе и в подвале стоит это
😍75👏14🙈4 3❤🔥1🔥1🥴1
Love. Death. Transformers.
x < 300 - лютейшая нищета на грани выживания 300 < x < 700,6 - обычная нищета, ипотека на 20 лет, кино и рестораны раз в неделю, еда из ашана 700,6к < x < 1,27кк - нормальная жизнь, ипотека на 10 лет, машина среднего класса (B, C) 1,27кк < x < 2,27 миллиона…
x < 500 - лютейшая нищета на грани выживания
500 < x < 768,6 - обычная нищета, ипотека на 35 лет, кино и рестораны раз в неделю, еда из ашана
768,6 < x < 1212,1 - нормальная жизнь, ипотека на 20 лет, машина среднего класса (B, C)
1,21 < x < 2.27миллиона - хорошая жизнь, ипотека на 10 лет, путешествия
x > 2.27 миллиона - достаточно хорошая жизнь, ипотека на 5 лет, машина бизнес класса, девушка
В долларах в год для bay area, в рублях в месяц для мск
500 < x < 768,6 - обычная нищета, ипотека на 35 лет, кино и рестораны раз в неделю, еда из ашана
768,6 < x < 1212,1 - нормальная жизнь, ипотека на 20 лет, машина среднего класса (B, C)
1,21 < x < 2.27миллиона - хорошая жизнь, ипотека на 10 лет, путешествия
x > 2.27 миллиона - достаточно хорошая жизнь, ипотека на 5 лет, машина бизнес класса, девушка
В долларах в год для bay area, в рублях в месяц для мск
😢95😁43💯18👍11 3 3🔥2🤔1🥱1
я помню несколько лет(да год назад даже) назад был тренд на универсальные модели которые решают все.
Тоже помните?
Забейте, у нас теперь 100500 моделей для разного
https://openai.com/index/introducing-upgrades-to-codex/
Тоже помните?
Забейте, у нас теперь 100500 моделей для разного
https://openai.com/index/introducing-upgrades-to-codex/
😁75🤔7🔥1