Love. Death. Transformers. 9810

84😁9🤔1

7.42K views09:16

Кейс с наймом блогеров rlщиков в сбер, может быть следствием т.н. войны башен и укладываться в рамки теории «Черных лебедей»

81😁21

7.5K viewsedited 09:16

Love. Death. Transformers.

CWM: An Open-Weights LLM for Research on Code
Generation with World Models

Как выпуская среднюю по размеру и бенчам модель хайпануть в 2025? правильно - назвать ее World Model.

Дефолтный претрен на 8 трлн токенов + посттрен на 5т токенов трейсов Python_овских функций и кодовых контестов. По сути, ребята дистиллировали питоновский интерпретатор в LLM.

Еще надистилировали кучу агенстких SWE bench like трейсов для issue-fix и mutate-fix, из забавного - использовали r Qwen3-235B-A22B и Llama3-70B-Instruct, с этого вышло 3М агентских траекторий.

Архитектурно это обычная Dense модель, qwen-llama3 образная.

RL
- свой grpo на multiturn
- добавили асинхронщину, убрали нормализацию на длинну, убрали KL
- выкидывают траектории без награды

Очень качественная работа, хоть и с кринжевым названием, была б это llama coder4 было б круто. Sota модель не является на большинстве бенчей, скорее где то в районе qwen3 32b + в части бенчей не указан бюджет на ризонинг что вообще не очень приятно

paper
model

👍25🤔11

8.15K viewsedited 10:07

Love. Death. Transformers.

https://openai.com/index/gdpval/

https://huggingface.co/datasets/openai/gdpval

старая ресерч традиция, underepresented models

🤷208😍5🍓2

7.68K viewsedited 17:08

Love. Death. Transformers.

T-ECD: E-commerce кросс-доменный датасет для рекомендательных систем

В открытый доступ выложили еще один датасет, на этот раз RecSys

Один из самых больших индустриальных датасетов в открытом доступе. 44 млн уникальных, 135 млрд взаимодействий.

Датасет собран на основе анонимизированных данных пользователей экосистемы, добавили и доставки продуктов и эмбеддинги и детализированные чековые позиции + статистику по ОС

Habr
Huggingface

1🔥65👍103💩22🤔11

7.76K views08:49

Love. Death. Transformers.

Таймлайн у нас... Интересный.
Короче Sama дали PhD в mbzuai

Спасибо Артёму за инсайты!

😁134💩246🥱1

7.97K views13:08

Love. Death. Transformers.

https://github.com/MoonshotAI/K2-Vendor-Verfier

это что же, тугезер контора пидорасов?)

GitHub

GitHub - MoonshotAI/K2-Vendor-Verfier: Verify Precision of all Kimi K2 API Vendor

Verify Precision of all Kimi K2 API Vendor. Contribute to MoonshotAI/K2-Vendor-Verfier development by creating an account on GitHub.

👍25🍌4🤔1

7.67K views15:41

Love. Death. Transformers.

0:17

30😁10🤓1

7.63K views15:41

Love. Death. Transformers.

😁25

7.59K views15:41

Love. Death. Transformers.

😁49💅4🗿2🥱1🐳1

7.62K views19:21

Love. Death. Transformers.

Forwarded from КПД

Из горячо обсуждаемой книженции Юдковского и Соареса.

Даже если не соглашаться с позицией авторов частично или полностью, сей опус стоит прочитать, чтобы поржать.

😁67🐳238🔥2👏2💩2❤‍🔥1💯1😐1

7.21K views06:25

Love. Death. Transformers.

Сегодня начнётся PML 2025, конференция Яндекса по разным практическим применениям машинного обучения в индустрии.

В этом году я был в программном комитете, отсмотривал CV и NLP доклады. Будет интересно, заходите послушать трансляцию, или приходите лично в Москве.

https://pmlconf.yandex.ru/2025

Practical ML Conf 2025

Конференция про практический ML от Яндекса

1👍39💩19🔥11🥴8🥱6❤‍🔥5👏1

8.06K viewsedited 08:36

Love. Death. Transformers.

Не хочешь быть лохозавром? Приходи на PML и подчиняй ии

😁132😢11💩8💯8🔥3🥴3🍓1

8.41K viewsedited 12:33

Love. Death. Transformers.

CWM: An Open-Weights LLM for Research on Code Generation with World Models Как выпуская среднюю по размеру и бенчам модель хайпануть в 2025? правильно - назвать ее World Model. Дефолтный претрен на 8 трлн токенов + посттрен на 5т токенов трейсов Python_овских…

я бтв слегка проебался в чтении статьи, на swe бенче авторы использовали TTC(test time compute) pass@1 - те по сути ограничивали время выполнения сверху

🆒16👍2🙈1

7.93K viewsedited 14:06

Love. Death. Transformers.

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Пока телеграмчик наяривает богоугодные черрипики из Wan 2.5, мы задаемся вопросом, а что там с цензурой?

А ничего! Нет ея!
Берется обычный image2video, в него присовываются ваши бесовские фантазии и Wan 2.5 прекрасно претворяет их в жизнь. Без всяких Лор, которых и быть не может, ибо веса Алибабищенко приподзажал на некоторое время.

Пруфы и промпты вы можете подсмотреть на картинке из Хиггсфилда. И спасибо Мигелю за информацию.
Есть версия, что Хиггсы тупо отключили цензуру на этапе промпта, для охватов, так сказать...

А уж что с лорами будет страшно представить.

@cgevent

1🍓9658🎉124💩3🥱3⚡1🔥1🥴1

7.96K views08:55

Love. Death. Transformers.

Охуеть митинг верни 20!8 собрали

Я имею ввиду концерт пошлой Молли в Белграде

🔥57🤓23💩11❤‍🔥6💔2👏1

7.9K viewsedited 18:07

Love. Death. Transformers.

Forwarded from Vikhr models

Vistral-24B-Instruct

Vistral - это наша новая флагманская унимодальная LLM представляющая из себя улучшенную версию Mistral-Small-3.2-24B-Instruct-2506 командой VikhrModels, адаптированную преимущественно для русского и английского языков. Удалён визуальный энкодер, убрана мультимодальность. Сохранена стандартная архитектура MistralForCausalLM без изменений в базовой структуре модели.

🔗 Карточка модели: https://huggingface.co/Vikhrmodels/Vistral-24B-Instruct
🔗 GGUF (скоро): https://huggingface.co/Vikhrmodels/Vistral-24B-Instruct-GGUF
⚖️ Лицензия: apache-2.0

Сайт: https://vikhr.org
Донаты: Здесь

👥 Авторы: @LakoMoorDev @nlpwanderer

20🔥9🥱6🥴2👍1

6.91K views09:29

2025/10/12 11:22:17
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>