I want to continue on my mission to bring about AI that’s safe and beneficial to humanity. I’m announcing the launch of Babuschkin Ventures, which supports AI safety research and backs startups in AI and agentic systems that advance humanity and unlock the mysteries of our universe. Please reach out at ventures@babuschk.in if you want to chat. The singularity is near, but humanity’s future is bright!
Хорошее начинание
X (formerly Twitter)
Igor Babuschkin (@ibab) on X
Today was my last day at xAI, the company that I helped start with Elon Musk in 2023. I still remember the day I first met Elon, we talked for hours about AI and what the future might hold. We both felt that a new AI company with a different kind of mission…
55🌚75👍21❤10🔥5🤔3
Хорошая книга про engineering management - elegant puzzle от Will Larson.
Если книга про staff engineer, на мой взгляд, подходит только на то, чтобы растащить графики типичных архетипов или дать почитать начинающим стаффам, то эта книга уже гораздо получше.
Все последовательно, и почти со всем согласен, читаешь, как будто про себя подробно подумал. Рекомендую.
В дополнение рекомендую его-же статью Writers who operate. Чтобы что-то советовать, лучше работать в индустрии сейчас, а не опираться на исторический опыт, который резко может стать менее актуальным
Если книга про staff engineer, на мой взгляд, подходит только на то, чтобы растащить графики типичных архетипов или дать почитать начинающим стаффам, то эта книга уже гораздо получше.
Все последовательно, и почти со всем согласен, читаешь, как будто про себя подробно подумал. Рекомендую.
В дополнение рекомендую его-же статью Writers who operate. Чтобы что-то советовать, лучше работать в индустрии сейчас, а не опираться на исторический опыт, который резко может стать менее актуальным
Invalidation events happen in industry (e.g. move from ZIRP to post-ZIRP management environment) but it’s difficult for non-operators to understand implications with conviction
6👍110❤25🔥10✍5🤔2🙏2❤🔥1
Задачка из реальной жизни
Что хуже: Senior data engineer, который предлагает делать мониторинг пайплайнов через Cursor (не создать систему мониторинга через Курсор,
а использовать сам Курсор для мониторинга)
или
Senior engineer, которому в 2025 году нужно объяснять, почему важно писать юнит-тесты?
Что хуже: Senior data engineer, который предлагает делать мониторинг пайплайнов через Cursor (не создать систему мониторинга через Курсор,
а использовать сам Курсор для мониторинга)
или
Senior engineer, которому в 2025 году нужно объяснять, почему важно писать юнит-тесты?
2😁284🤔49🤣34😱14🗿12😭7🔥6❤2🍌1🍓1
По итогам прошедшего ICML 2025 ребята из Х5 решили собраться чтобы:
- обсудить наиболее актуальные доклады;
- как эти технологии можно внедрить в бизнес;
- оценить их потенциал, плюсы, минусы и особенности.
Из приятного, среди выступающих, есть те люди, которых я в свое время нанимал в только создаваемую командую и они все еще там. Например - Максим Павлов. Как-же раскидала нас жизнь
Когда: в среду, 27 августа, 19:00 Где: «Сфера X5», Парк Горького
Регистрация по ссылке.
- обсудить наиболее актуальные доклады;
- как эти технологии можно внедрить в бизнес;
- оценить их потенциал, плюсы, минусы и особенности.
Из приятного, среди выступающих, есть те люди, которых я в свое время нанимал в только создаваемую командую и они все еще там. Например - Максим Павлов. Как-же раскидала нас жизнь
Когда: в среду, 27 августа, 19:00 Где: «Сфера X5», Парк Горького
Регистрация по ссылке.
x5-tech-event.timepad.ru
ИИнсомния: I see ML / События на TimePad.ru
Мы в X5 Tech | AI держим руку на пульсе технологий, поэтому предлагаем собраться 27 августа в 19:00 в Парке Горького, чтобы обсудить научные открытия в области искусственного интеллекта в кругу единомышленников.
💩59👍39😴15🤡10❤4🔥1
Прочитал статью, которой поделился Игорь, The Platonic Representation Hypothesis
Человека по Платону мы уже видели, но теперь ученые заметили, что модели начинают делать удивительно похожие друг на друга репрезентации.
-
-
В целом интересная гипотеза. Из практического применения, возможно, в будущем модели смогут обмениваться не токенами, либо можно будет вводить метрику алайнмента между разными моделями на основе сходства репрезентаций.
#ArticleReview
Человека по Платону мы уже видели, но теперь ученые заметили, что модели начинают делать удивительно похожие друг на друга репрезентации.
We hypothesize that this convergence is driving toward a shared statistical model of reality, akin to Plato’s concept of an ideal reality.
-
What has led to this convergence? Will it continue? And ultimately, where does it end?
-
Also closely related to our hypothesis is the “Anna Karenina scenario” described by Bansal et al. (2021), referring to the possibility that all well-performing neural nets represent the world in the same way
В целом интересная гипотеза. Из практического применения, возможно, в будущем модели смогут обмениваться не токенами, либо можно будет вводить метрику алайнмента между разными моделями на основе сходства репрезентаций.
#ArticleReview
2🔥37❤13🤯10👍5🤔2🤣2
Revolut to allow staff to sell shares at $75bn valuation
В 2020 году передо мной стоял выбор: пойти директором в Revolut или стаффом в Facebook.
Долго думал, было 3 личных встречи с Николаем Сторонским, CEO Revolut, последняя пришлась на мой день рождения.
В итоге пошёл в Facebook.
Только начальный грант, который был в оффере революта, при указанной оценке стоил бы сейчас 15 млн долларов.
До сих пор не знаю, правильно ли поступил.
В 2020 году передо мной стоял выбор: пойти директором в Revolut или стаффом в Facebook.
Долго думал, было 3 личных встречи с Николаем Сторонским, CEO Revolut, последняя пришлась на мой день рождения.
В итоге пошёл в Facebook.
Только начальный грант, который был в оффере революта, при указанной оценке стоил бы сейчас 15 млн долларов.
До сих пор не знаю, правильно ли поступил.
Ft
Revolut to allow staff to sell shares at $75bn valuation
Move will offer windfall for staff at UK’s most valuable fintech
🫡253🤯109😭46🤣27❤20🔥14🌚4😱1🤮1🥱1
Тренируюсь по новой программе в зале уже около 5 месяцев.
Ничего, кроме программы, не менял.
Результаты налицо, как в массе (набрал 3–4 кг), так и в силовых. И это на моём уровне тренированности (21 год непрерывных тренировок).
Планирую через 3–4 недели жать лёжа 180 кг на 5 раз.
В субботу пожал 175 на 5. Жму как качок, без моста и техники. До этого долго был на плато около 160
На тренажёрах беру все веса и сверху накидываю ещё 2 гантели, жду когда порвётся тросс
Paul Carter — автор методики, дарю, гуглится легко, советую читать его инстаграм.
Большинство принципов указано в стриме
https://youtu.be/lpQIrmFl3tM
В программе они просто максимизированы
Ничего, кроме программы, не менял.
Результаты налицо, как в массе (набрал 3–4 кг), так и в силовых. И это на моём уровне тренированности (21 год непрерывных тренировок).
Планирую через 3–4 недели жать лёжа 180 кг на 5 раз.
В субботу пожал 175 на 5. Жму как качок, без моста и техники. До этого долго был на плато около 160
На тренажёрах беру все веса и сверху накидываю ещё 2 гантели, жду когда порвётся тросс
Paul Carter — автор методики, дарю, гуглится легко, советую читать его инстаграм.
Большинство принципов указано в стриме
https://youtu.be/lpQIrmFl3tM
В программе они просто максимизированы
2🔥338👍61❤40😱10👏8🥱8💅6⚡1🥰1🙏1👌1
Получил три приглашения на ужин в палату лордов по разным поводам, на сентябрь, октябрь и ноябрь:
House of Lords Dinner on Supporting Growth with AI
House of Lords Dinner: Managing OT Cyber Risk
House of Lords Dinner: Surviving & Thriving a Data Breach
И даже думал пойти, но в итоге deal breaker-ом оказался следующий пункт: Allow 30 minutes for search and screening.
House of Lords Dinner on Supporting Growth with AI
House of Lords Dinner: Managing OT Cyber Risk
House of Lords Dinner: Surviving & Thriving a Data Breach
И даже думал пойти, но в итоге deal breaker-ом оказался следующий пункт: Allow 30 minutes for search and screening.
5🔥166🤔41😁28🤡19❤10👏7🌚2😱1
Читаю What makes Claude Code so damn good (and how to recreate that magic in your agent)!?
Вижу там такую фразу
Вспоминаю великую книгу и приведенную там цитату, про фундаментальную теорему software engineering:
Одна и та-же мысль повторяется везде
Вижу там такую фразу
I highly doubt your app needs a multi-agent system. With every layer of abstraction you make your system harder to debug, and more importantly you deviate from the general-model-improvement trajectory.
Вспоминаю великую книгу и приведенную там цитату, про фундаментальную теорему software engineering:
We can solve any problem by introducing an extra level of indirection. Except for the problem of too many levels of indirection.
Одна и та-же мысль повторяется везде
minusx.ai
What makes Claude Code so damn good (and how to recreate that magic in your agent)!?
Claude Code is the most delightful AI agent/workflow I have used so far. Not only does it make targeted edits or vibe coding throwaway tools less annoying, ...
4😁114❤37👍12🤡8🔥4🗿2
По собственному опыту и тому, что прочитал в ряде источников, складывается ощущение, что retrieval через эмбеддинги в RAG проигрывает битву BM25 и regexp.
Правда, почему-то люди называют это всё RAG, хотя обсуждают только retrieval-часть.
Правда, почему-то люди называют это всё RAG, хотя обсуждают только retrieval-часть.
💯78👍33🤔25😁14👀9❤5🔥4🌭2🙏1💊1
Собеседовал кандидата на финальном техинтервью. Из плюсов — наконец-то годный staff engineer, впервые за долгое время. Из минусов — кандидат сидел голый
2😁842🌭178🤣115👀44❤12🤡7😭5🤔3🥴3🤨3🤝1
Теперь понятно, на что бывшие продакт менеджеры из Open AI получили 2 млрд долларов при оценке в 12.
Чтобы зафиксировать random seed и сделать его batch-invariant
Чтобы зафиксировать random seed и сделать его batch-invariant
Thinking Machines Lab
Defeating Nondeterminism in LLM Inference
Reproducibility is a bedrock of scientific progress. However, it’s remarkably difficult to get reproducible results out of large language models.
For example, you might observe that asking ChatGPT the same question multiple times provides different results.…
For example, you might observe that asking ChatGPT the same question multiple times provides different results.…
1😁145🔥18❤8👍3👎1
Примерно 6 лет назад, после конференции в Яндексе, мы с Сергеем Марковым сидели в баре и пили напитки: он пиво, я воду.
А теперь мы даже вместе не можем встретиться после конференции, а он по-прежнему выступает, в ближайшее время будет здесь https://aiboost2025.ru - собеседник он отличный, так что рекомендую
А теперь мы даже вместе не можем встретиться после конференции, а он по-прежнему выступает, в ближайшее время будет здесь https://aiboost2025.ru - собеседник он отличный, так что рекомендую
aiboost2025.ru
AI Boost | SURF
Конференция про реальное ускорение разработки с помощью ИИ
🤣99👍36❤12🤔10🔥4🤝4
Думал, что перечитываю курс Виктора Кантора про МЛ и его любимый Manifold Learning, а нет, это 12-млрдный стартап думающих машин - Modular Manifolds
Много думал.
Много думал.
Thinking Machines Lab
Modular Manifolds
A geometric framework for co-designing neural net optimizers with manifold constraints.
1🤣69🔥36❤15💯7😁5👍3👎2
Forwarded from Сиолошная
Чуть более полугода назад у нас с Валерой был стрим про высказывание CEO Anthropic, мол, через полгода модели будут писать 90% кода. На стриме, как мне кажется, я очень хорошо описал некоторые из важных оговорок при оценке подобного рода высказываний:
— есть разница «могут» и «делают»
— это может быть применимо к определённым языкам программирования, а не всем
— часть подходов к разработке придётся пересмотреть, чтобы было проще интегрировать ИИ-инструменты
— это может быть применимо к свежим проектам, а не 15+ годичной давности
— это может быть применимо к проектам до определённого размера, а не кодовой базе всего Фейсбука, например
Сами Anthropic сейчас говорят, что Claude Code написан их же моделями на 90%.
Большинство заявлений о том, что «90% кода написано ИИ», исходят от разработчиков моделей / продавцов ИИ-инструментов, поэтому многие (не я) их отметают.
Aider, АИ-ассистент для программирования с открытым исходным кодом, который я как раз упоминал на стриме, от релиза к релизу то и дело перешагивает планки 75-80%. Неплохо!
И вот наткнулся на блог Armin Ronacher, создателя Flask, Jinja, Click и других крупных популярны проектов. Цитаты из поста (но рекомендую прочитать оригинал целиком):
— Что касается инфраструктурного компонента, который я начал разрабатывать в своей новой компании, то, пожалуй, больше 90% моего кода написано с помощью ИИ. Я не хочу вас убеждать — просто поделюсь тем, что узнал. Отчасти потому, что я подошел к этому проекту иначе, чем в своих первых экспериментах.
— Сервис написан на Go с небольшим количеством зависимостей. Сейчас в нём около 40 000 строк, включая Go, YAML, Pulumi и несколько специальных SDK-прослоек.
— Я установил высокую планку, особенно в плане надёжности работы. Я уже работал с подобными системами и знал, чего хочу.
— Я уделяю пристальное внимание основам архитектуры системы, структуре кода и взаимодействию с базами данных. Я невероятно самоуверен. Поэтому есть вещи, которые я не позволяю ИИ делать. Я начинал проект традиционным способом: проектирование системы, схема, архитектура. На этом этапе я не позволяю ИИ писать с нуля, а просто включаю его в свой цикл рассуждений. Это помогает мне видеть типовые ошибки, даже если я не доверяю LLM.
— Для кода, сгенерированного и поддерживаемого ИИ, я теперь получаю стек, который выглядит примерно так, как мне часто хотелось, но было слишком сложно сделать вручную.
— Не могу не подчеркнуть, насколько плохим может быть код агентов, если не быть осторожным. Хотя они понимают архитектуру системы и то, как что-то построить, они не могут смотреть на всю картину целиком. Вам постоянно нужно вносить правильную информацию в контекст.
— Легко создавать системы, которые кажутся правильными, но при использовании ведут себя неправильно. Вот пример: я попросил его создать ограничитель лимитов. Он «работал», но не имел джиттера и использовал неудачные решения по хранению данных. Легко исправить, если знаешь ограничители лимитов, но опасно, если не знаешь.
— Для меня это дошло до того, что я уже не представляю, как можно работать по-другому. Да, я, вероятно, смог бы обойтись без ИИ. Но я бы построил другую систему, потому что мне пришлось бы идти на другие компромиссы. Такой подход открывает возможности, которые я обычно пропускаю или откладываю.
— Исследование + разработка вместо «исследование, а разработка потом»: на некоторые вещи, на понимание которых у меня ушел бы день или два, теперь уходит 10–15 минут.
— Пишет ли ИИ 90% кода? Не знаю. Знаю только, что для меня в этом проекте ответ уже точно «да». В то же время, для меня ИИ не владеет кодом. Я всё равно проверяю каждую строчку, формирую архитектуру и несу ответственность за то, как всё это работает.
===
(обратите внимание, что ни о каком вайб-кодинге речи не идёт: только вдумчивая работа, где, как мне кажется, по сравнению с обычным процессом мозги приходится напрягать даже больше — пока LLM работает, ты думаешь)
— есть разница «могут» и «делают»
— это может быть применимо к определённым языкам программирования, а не всем
— часть подходов к разработке придётся пересмотреть, чтобы было проще интегрировать ИИ-инструменты
— это может быть применимо к свежим проектам, а не 15+ годичной давности
— это может быть применимо к проектам до определённого размера, а не кодовой базе всего Фейсбука, например
Сами Anthropic сейчас говорят, что Claude Code написан их же моделями на 90%.
Большинство заявлений о том, что «90% кода написано ИИ», исходят от разработчиков моделей / продавцов ИИ-инструментов, поэтому многие (не я) их отметают.
Aider, АИ-ассистент для программирования с открытым исходным кодом, который я как раз упоминал на стриме, от релиза к релизу то и дело перешагивает планки 75-80%. Неплохо!
И вот наткнулся на блог Armin Ronacher, создателя Flask, Jinja, Click и других крупных популярны проектов. Цитаты из поста (но рекомендую прочитать оригинал целиком):
— Что касается инфраструктурного компонента, который я начал разрабатывать в своей новой компании, то, пожалуй, больше 90% моего кода написано с помощью ИИ. Я не хочу вас убеждать — просто поделюсь тем, что узнал. Отчасти потому, что я подошел к этому проекту иначе, чем в своих первых экспериментах.
— Сервис написан на Go с небольшим количеством зависимостей. Сейчас в нём около 40 000 строк, включая Go, YAML, Pulumi и несколько специальных SDK-прослоек.
— Я установил высокую планку, особенно в плане надёжности работы. Я уже работал с подобными системами и знал, чего хочу.
— Я уделяю пристальное внимание основам архитектуры системы, структуре кода и взаимодействию с базами данных. Я невероятно самоуверен. Поэтому есть вещи, которые я не позволяю ИИ делать. Я начинал проект традиционным способом: проектирование системы, схема, архитектура. На этом этапе я не позволяю ИИ писать с нуля, а просто включаю его в свой цикл рассуждений. Это помогает мне видеть типовые ошибки, даже если я не доверяю LLM.
— Для кода, сгенерированного и поддерживаемого ИИ, я теперь получаю стек, который выглядит примерно так, как мне часто хотелось, но было слишком сложно сделать вручную.
— Не могу не подчеркнуть, насколько плохим может быть код агентов, если не быть осторожным. Хотя они понимают архитектуру системы и то, как что-то построить, они не могут смотреть на всю картину целиком. Вам постоянно нужно вносить правильную информацию в контекст.
— Легко создавать системы, которые кажутся правильными, но при использовании ведут себя неправильно. Вот пример: я попросил его создать ограничитель лимитов. Он «работал», но не имел джиттера и использовал неудачные решения по хранению данных. Легко исправить, если знаешь ограничители лимитов, но опасно, если не знаешь.
— Для меня это дошло до того, что я уже не представляю, как можно работать по-другому. Да, я, вероятно, смог бы обойтись без ИИ. Но я бы построил другую систему, потому что мне пришлось бы идти на другие компромиссы. Такой подход открывает возможности, которые я обычно пропускаю или откладываю.
— Исследование + разработка вместо «исследование, а разработка потом»: на некоторые вещи, на понимание которых у меня ушел бы день или два, теперь уходит 10–15 минут.
— Пишет ли ИИ 90% кода? Не знаю. Знаю только, что для меня в этом проекте ответ уже точно «да». В то же время, для меня ИИ не владеет кодом. Я всё равно проверяю каждую строчку, формирую архитектуру и несу ответственность за то, как всё это работает.
===
(обратите внимание, что ни о каком вайб-кодинге речи не идёт: только вдумчивая работа, где, как мне кажется, по сравнению с обычным процессом мозги приходится напрягать даже больше — пока LLM работает, ты думаешь)
Telegram
Сиолошная
Если вдруг пропустили стрим, то появилась его запись.
Обсуждение, как мне кажется, вышло достаточно интересным (особенно если промотать сразу минуту на пятнадцатую) — и на самом стриме зрителей было много до конца, и на записи уже много просмотров, и @itbeard…
Обсуждение, как мне кажется, вышло достаточно интересным (особенно если промотать сразу минуту на пятнадцатую) — и на самом стриме зрителей было много до конца, и на записи уже много просмотров, и @itbeard…
6👍179❤50🔥15🤡9💯4🙏2
Примерно 10 лет назад Оксана написала мне в личку после конференции: «Псс, не хочешь ли пособеседоваться в Яндекс?» И тут закрутилось. (Из забавного: руководитель всей аналитики Яндекса, Лёша Долотов, случайно добавил меня в адресаты, когда давал отзыв HR на меня.)
Нынче Оксана — один из лидеров NewHR и попросила меня поделиться ссылкой на их опросник, так как результаты опроса открытые и полезны для всех, то я, конечно же, согласился.
Итак:
▶️ Ссылка на опросник тут ◀️
Нынче Оксана — один из лидеров NewHR и попросила меня поделиться ссылкой на их опросник, так как результаты опроса открытые и полезны для всех, то я, конечно же, согласился.
Итак:
Мы снова запустили наше ежегодное исследование рынка аналитиков 🙂
В прошлом году ты нам здорово помог с промо опросника и мы бесконечно тебе благодарны ❤️
В этом году нам хочется еще больше данных) и может быть в этот раз у тебя тоже получится рассказать об исследовании своим подписчикам?
Что исследуем?
👉 Зарплаты и их динамика
👉 Рейтинг работодателей для аналитиков
👉 Где и как работают аналитики
👉 Как меняется зона ответственности аналитиков
👉 Как аналитики ищут работу и выбирают работодателя.
👉 Чему учатся аналитики
👉 Каких экспертов котируют
▶️ Ссылка на опросник тут ◀️
Alchemer
Исследование рынка аналитиков (NEWHR, 2025)
Исследование рынка аналитиков (NEWHR, 2025).
🥱16❤7🔥5⚡1