Невыложнные фотки от поездки в Россию, город который должен был чем то стать, но не смог. Нерешаемые проблемы замазанные штукатуркой и куча воспоминаний "было и у нас величие". Офис Вк с исторической переговоркой в этом смысле очень интересный объект.
🔥51😢40🥱8😡8💩5🍓5💊4😁3👍2🌚1
Любовь и забота о месте в котором живёшь позволяет решать "нерешаемые" проблемы грязи и мигрантов и не забывая великое прошлое смотреть в будущее.
💊92🍓57🥴17💯12💩9🤔8👍6🤷♂2🔥2☃1🆒1
Love. Death. Transformers.
Позиция по sora2 - это не совсем sota. Ну точнее так - как и gpt5 это массовый продукт и при акценте на массовость я имею ввиду сотни миллионов юзеров - это очень быстрая и явно дешевая для oai модель и цена генерации в апи я ожидаю в пределах 1cent/s
Проиграл выходит
С другой стороны на рынке нет нормального конкурента, чо бы не крутить прайс?
С другой стороны на рынке нет нормального конкурента, чо бы не крутить прайс?
👍9
Qwen3-Next 80B-A3B
C того момента как она вышла, уже вышла Doubao, Step3, Qwen3-235B, DeepSeek V3.2 и я за пивом
- Hybrid Architecture: Gated DeltaNet + Gated Att - вариция на тему RNN + не везде а только 75% cлоев и 25% cлоев обычный attention
- 3b активных параметров при 80 тотал
- Используют QK postnorm по аналогии с DIT для улучшения стабильности
- MTP как в deepseek
- Показывают бОльшую скорость префила и декода чем соседи по метрикам (это если что qwen 30bA3 и qwen 32b)
blog
C того момента как она вышла, уже вышла Doubao, Step3, Qwen3-235B, DeepSeek V3.2 и я за пивом
- Hybrid Architecture: Gated DeltaNet + Gated Att - вариция на тему RNN + не везде а только 75% cлоев и 25% cлоев обычный attention
- 3b активных параметров при 80 тотал
- Используют QK postnorm по аналогии с DIT для улучшения стабильности
- MTP как в deepseek
- Показывают бОльшую скорость префила и декода чем соседи по метрикам (это если что qwen 30bA3 и qwen 32b)
blog
🔥34 6
#промо #промо #промо
⚪️ White Circle
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
-🍴 80-150к USD
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
⚪️ White Circle
Всем привет, мы делаем лучшую AI safety платформу, чтобы модельки не делали rm -rf без вашего ведома
Про нас:
- Подняли 💸 $10m 💸, инвесторы — топы OpenAI, Anthropic, Deepmind, Mistral, HuggingFace, etc
- Команда из 10 человек с офисом в самом центре Парижа
- Обрабатываем десятки миллионов API запросов в месяц
-
Вакансии:
1. FullStack Engineer
Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse
2. AI Engineer
MoE, multimodality (audio / images), Megatron, distributed training, Triton
3. AI Engineer
Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас
📨 CV → https://forms.gle/XysjrjHgxiRicGsb6
Please open Telegram to view this post
VIEW IN TELEGRAM
😁40💩9🍌3❤🔥2👍2🔥2💅2💋1
Forwarded from Старший Авгур
Пришли рецензии на сгенерированную статью на сгенерированной конфе.
- AI Reviewer 1 -> Borderline reject (3)
- AI Reviewer 2 -> Strong Accept (6)
- AI Reviewer 3 -> Borderline reject (3)
- Человек -> Borderline reject (3)
В итоге reject.
Замечания от моделей повторяют секцию Limitations. Человек написал, что это интересный proof-of-concept, но нужно сам текст доработать.
Есть ощущение, что не хватило чуть-чуть, и потрать я ещё один день на полировку, статью бы приняли.
Всего взяли <50 статей из >300, то есть acceptance rate что-то типа 15%. Принятые статьи можно посмотреть тут.
- AI Reviewer 1 -> Borderline reject (3)
- AI Reviewer 2 -> Strong Accept (6)
- AI Reviewer 3 -> Borderline reject (3)
- Человек -> Borderline reject (3)
В итоге reject.
Замечания от моделей повторяют секцию Limitations. Человек написал, что это интересный proof-of-concept, но нужно сам текст доработать.
Есть ощущение, что не хватило чуть-чуть, и потрать я ещё один день на полировку, статью бы приняли.
Всего взяли <50 статей из >300, то есть acceptance rate что-то типа 15%. Принятые статьи можно посмотреть тут.
😨21👍15😁7🔥1👏1😢1