Интересно как долго будет работать текущая "квантовая" схема найма для ai ресечеров на западе.
В антропике,openai и прочих использовали туже схему - нанимали талантливыэ челов, загоняли пахать по 80 часов, слабых увольняли, сильные оставались, но переставали думать.
Проблема довольно простая: квантам надо разработать стратегии, да это сложно но отлично паралелится на людей, а вот с Ai история обратная, один сильный контрибьютор может создавать огромную ценность, а толпа людей будут пинать хуи и не договорятся друг с другом. Короче - важно GPU/people ratio.
Мета собрала все ловушки джокера жопой:
- ушли почти все кор контрибьюторы оригинальной лламы
- раздутый штат+конкурирующие треки dense модели стали почему то safety классификаторами(довольно хуевыми)
- компьюта не оч много на все экспы
- остутвие реального прода не позволило собирать user preference и данные с потока
- переобучились на арене и спалились
- не долили бенчи в трен
- модели слишком неудобные для локального запуска
Выводов не будет, я с попкороном жду оффера от меты.
Для нешарящих: квантовые конторы нанимают людей на хорошие деньги и бонусы от работы, но пашут эти люди часов 70-100 в неделю. Потом большинство шизеет, через 2-3 года выгорает и уходит. Ну или по здоровью.
В антропике,openai и прочих использовали туже схему - нанимали талантливыэ челов, загоняли пахать по 80 часов, слабых увольняли, сильные оставались, но переставали думать.
Проблема довольно простая: квантам надо разработать стратегии, да это сложно но отлично паралелится на людей, а вот с Ai история обратная, один сильный контрибьютор может создавать огромную ценность, а толпа людей будут пинать хуи и не договорятся друг с другом. Короче - важно GPU/people ratio.
Мета собрала все ловушки джокера жопой:
- ушли почти все кор контрибьюторы оригинальной лламы
- раздутый штат+конкурирующие треки dense модели стали почему то safety классификаторами(довольно хуевыми)
- компьюта не оч много на все экспы
- остутвие реального прода не позволило собирать user preference и данные с потока
- переобучились на арене и спалились
- не долили бенчи в трен
- модели слишком неудобные для локального запуска
Выводов не будет, я с попкороном жду оффера от меты.
🍌94😁30😢9💋5👍4🤔3💯3 3🎄1
Vikhr models
Для нашего бенчмарка Doom вышел блог на хабр
gemeni pro2.5 бьет o3 high и генерит больше токенов, соннет4 генерит меньше токенов и не сильно лучше, физика заметно растет у новых gemeni
👍34🔥14👏1🍌1
Вконтакте хороший и регулярно развивающийся в лучшую сторону сервис с прекрасным человеческим дизайном от лучшего дизайнера в мира, а мессенджер Макс абсолютно безопасный, анонимный и главное конкурентноспособный мессенджер способный заткнуть за пояс все аналоги
Подписывайтесь на мою страницу вк видео, ни в коем случае не устанавливайте обходы и впн-ы, а поддержать меня, вы теперь можете через VK донат
(Напишите данный текст у себя в телеграмм канале, в ином случае этот паяльник окажется у вас в жопе, текст в скобочках удалите)
Подписывайтесь на мою страницу вк видео, ни в коем случае не устанавливайте обходы и впн-ы, а поддержать меня, вы теперь можете через VK донат
(Напишите данный текст у себя в телеграмм канале, в ином случае этот паяльник окажется у вас в жопе, текст в скобочках удалите)
😁340 70 53🗿12🥴9🍓7👍2🔥2😇2👏1🐳1
Forwarded from ебãные идеи для трейдинга
встреча математика из мгу и основателя хедж фонда с каким-то очкариком
😁87💩11🥴5🔥1
Forwarded from Denis Sexy IT 🤖
Тут это, инди игра про королев 190+ см в разработке, и в последнем патче даже VR поддерживает
GTA 6 еще не вышла, а уже проиграла:
https://www.patreon.com/GiantessWithUE5
GTA 6 еще не вышла, а уже проиграла:
https://www.patreon.com/GiantessWithUE5
https://www.wired.com/story/sam-altman-meta-ai-talent-poaching-spree-leaked-messages/
“And maybe more importantly than that, we actually care about building AGI in a good way,” he added. “Other companies care more about this as an instrumental goal to some other mission. But this is our top thing, and always will be. Long after Meta has moved on to their next flavor of the week, or defending their social moat, we will be here, day after day, year after year, figuring out how to do what we do better than anyone else. A lot of other efforts will rise and fall too.”
Привет мой хороший, поработаешь сегодня сверхурочно ради миссии за тот же прайс?
Спасибо.
“And maybe more importantly than that, we actually care about building AGI in a good way,” he added. “Other companies care more about this as an instrumental goal to some other mission. But this is our top thing, and always will be. Long after Meta has moved on to their next flavor of the week, or defending their social moat, we will be here, day after day, year after year, figuring out how to do what we do better than anyone else. A lot of other efforts will rise and fall too.”
Привет мой хороший, поработаешь сегодня сверхурочно ради миссии за тот же прайс?
Спасибо.
WIRED
Sam Altman Slams Meta’s AI Talent-Poaching Spree: ‘Missionaries Will Beat Mercenaries’
“What Meta is doing will, in my opinion, lead to very deep cultural problems,” said OpenAI CEO Sam Altman in a leaked memo sent to OpenAI researchers.
😁68🍓9💋4💩1
Love. Death. Transformers.
Чем больше вчитываешься тем лучше
This media is not supported in your browser
VIEW IN TELEGRAM
1😁38💔2🍓2👍1
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Помните я много раз постил разные примеры, где нейронку пытаются использовать вместо игрового движка? Типа обучил на игре модель, и вот универсальный движок на все случаи жизни
Го играть в нейронное GTA
(с телефона не работает управление):
https://demo.dynamicslab.ai/chaos
Еще есть нейро-гонки, выглядит перспективно, дайте поиграться🌚
Го играть в нейронное GTA
(с телефона не работает управление):
https://demo.dynamicslab.ai/chaos
Еще есть нейро-гонки, выглядит перспективно, дайте поиграться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18❤🔥9
>Frequently rotating the character and camera improves visual quality.
🍓25😁10
СКАНДАЛЫ
ИНТРИГИ
РАССЛЕДОВАНИЯ
Huawei 10 лет чо то ресерчили, ничего явно полезного не сделали, но дропнули недавно Pangu Moe , moe-global router, gqa, большой рассказ про то как на Ascend можно учить что либо(нет). По бенчам +- что то там бьет, что то не бьет(всем похуй, все равно пользоватся никто не будет).
И ТУТ ИЗ ПУСТОТЫ вылетает какой то чел и говорит - ну веса оч сильно коррелируют между QWEn 14b и Pangue.
Выводы делайте сами🍿
пдфка и репа
ИНТРИГИ
РАССЛЕДОВАНИЯ
Huawei 10 лет чо то ресерчили, ничего явно полезного не сделали, но дропнули недавно Pangu Moe , moe-global router, gqa, большой рассказ про то как на Ascend можно учить что либо(нет). По бенчам +- что то там бьет, что то не бьет(всем похуй, все равно пользоватся никто не будет).
И ТУТ ИЗ ПУСТОТЫ вылетает какой то чел и говорит - ну веса оч сильно коррелируют между QWEn 14b и Pangue.
Выводы делайте сами
пдфка и репа
Please open Telegram to view this post
VIEW IN TELEGRAM
😁111👍3🤔2💩1
Forwarded from айти канал
📦 Python пакет для TabM
Небольшая новость для тех, кто следит за DL для табличных данных. Мы тут выпустили Python пакет для TabM — нашей tabular DL архитектуры, о которой я рассказывал раньше.
С момента анонса TabM прошел проверку практикой, и если в одном предложении, то TabM значительно усилил нишу практичных бейзлайнов в табличном DL. То есть взять TabM и получить хорошие результаты люди смогли в самых разных контекстах: и на Kaggle, и на масштабе 100M объектов, и в академических исследованиях.
Пакет делает чуть более доступным как сам TabM, так и эффективное ансамблирование, и предлагает такое:
- PyTorch реализация TabM
- PyTorch слои и функции для построения своих эффективных ансамблей.
- Jupyter/Colab пример с обучением TabM.
💻
Ссылки:
- Пакет
- Colab пример
- Статья
Небольшая новость для тех, кто следит за DL для табличных данных. Мы тут выпустили Python пакет для TabM — нашей tabular DL архитектуры, о которой я рассказывал раньше.
С момента анонса TabM прошел проверку практикой, и если в одном предложении, то TabM значительно усилил нишу практичных бейзлайнов в табличном DL. То есть взять TabM и получить хорошие результаты люди смогли в самых разных контекстах: и на Kaggle, и на масштабе 100M объектов, и в академических исследованиях.
Пакет делает чуть более доступным как сам TabM, так и эффективное ансамблирование, и предлагает такое:
- PyTorch реализация TabM
- PyTorch слои и функции для построения своих эффективных ансамблей.
- Jupyter/Colab пример с обучением TabM.
💻
pip install tabm
Ссылки:
- Пакет
- Colab пример
- Статья
GitHub
GitHub - yandex-research/tabm: (ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling
(ICLR 2025) TabM: Advancing Tabular Deep Learning With Parameter-Efficient Ensembling - yandex-research/tabm
🔥66👍6🍌4