Forwarded from proVenture (проВенчур)
🔥🔥🔥 Отчет по рынку AI на 456 страниц от Stanford!
Да, огромный отчет, просто качайте его из сообщения ниже и читайте.
Никаких саммари привести просто невозможно, там 8 глав про technical performance, R&D, responsible AI, economy, science, policy, education and public opinion. Читайте интересные вам.
На что хочется обратить ваше внимание?
1/ 44.48% научных публикаций по AI в 2024 году было сделано исследователями из Азии (это отдельно East Asia и South Asia) и только 10.31% из Северной Америки. 🇨🇳 Китай против 🇺🇸 США в основном. 🇪🇺 Европа, кстати, выше США с 18.15%.
2/ Из всех публикаций только ~5.4% касаются Generative AI. В лидерах Machine Learning с ~75.7%.
3/ По количеству патентов на душу населения 🇺🇸 США и 🇨🇳 Китай идут очень близко и с 5.20 патентов и 6.08 занимают 4 и 3 место, соответственно. На первом месте 🇰🇷 Южная Корея с 17.27, далее 🇱🇺 Люксембург с 15.31.
4/ Однако по количеству заметных AI моделей 🇺🇸 США сильно впереди 🇨🇳 Китая – 40 против 15. Забавно, что моделей все же не так много, потому что на 3-м месте и далее страны с 1-й моделью (у 🇮🇱 Израиля, например, столько же, сколько у 🇸🇦 Саудовской Аравии).
5/ На Github 4.32М опенсорсных AI проектов.
6/ AI Agents пока еще не очень точные – самая топовая модель GPT-4o имеет success rate всего 36.2%.
7/ Всего в 2024 году зафиксировано 233 крупных инцидента с AI (типа как когда система определения лица определило неверного человека и его арестовали, или автономное авто совершило аварию).
8/ От 1.25% всех вакансий в 🇳🇱 Нидерландах до 3.27% всех вакансий в 🇸🇬 Сингапуре требуют AI skills.
9/ Где больше всего талантов в области AI?
Топ 3:
🇮🇱 Израиль 1.98%
🇸🇬 Сингапур: 1.64%
🇱🇺 Люксембург: 1.44%
Топ-3 страны по миграции AI талантов на 10,000 Linkedin members:
🇱🇺 Люксембург: 8.92%
🇨🇾 Кипр: 4.67%
🇦🇪 ОАЭ: 4.13%
10/ Всего в 2024 году появилось более 2,000 AI компаний, которые еще и привлекли венчурное финансирование.
Это только капля в море. Читайте отчет, данных куча.
@proVenture
#ai #research
Да, огромный отчет, просто качайте его из сообщения ниже и читайте.
Никаких саммари привести просто невозможно, там 8 глав про technical performance, R&D, responsible AI, economy, science, policy, education and public opinion. Читайте интересные вам.
На что хочется обратить ваше внимание?
1/ 44.48% научных публикаций по AI в 2024 году было сделано исследователями из Азии (это отдельно East Asia и South Asia) и только 10.31% из Северной Америки. 🇨🇳 Китай против 🇺🇸 США в основном. 🇪🇺 Европа, кстати, выше США с 18.15%.
2/ Из всех публикаций только ~5.4% касаются Generative AI. В лидерах Machine Learning с ~75.7%.
3/ По количеству патентов на душу населения 🇺🇸 США и 🇨🇳 Китай идут очень близко и с 5.20 патентов и 6.08 занимают 4 и 3 место, соответственно. На первом месте 🇰🇷 Южная Корея с 17.27, далее 🇱🇺 Люксембург с 15.31.
4/ Однако по количеству заметных AI моделей 🇺🇸 США сильно впереди 🇨🇳 Китая – 40 против 15. Забавно, что моделей все же не так много, потому что на 3-м месте и далее страны с 1-й моделью (у 🇮🇱 Израиля, например, столько же, сколько у 🇸🇦 Саудовской Аравии).
5/ На Github 4.32М опенсорсных AI проектов.
6/ AI Agents пока еще не очень точные – самая топовая модель GPT-4o имеет success rate всего 36.2%.
7/ Всего в 2024 году зафиксировано 233 крупных инцидента с AI (типа как когда система определения лица определило неверного человека и его арестовали, или автономное авто совершило аварию).
8/ От 1.25% всех вакансий в 🇳🇱 Нидерландах до 3.27% всех вакансий в 🇸🇬 Сингапуре требуют AI skills.
9/ Где больше всего талантов в области AI?
Топ 3:
🇮🇱 Израиль 1.98%
🇸🇬 Сингапур: 1.64%
🇱🇺 Люксембург: 1.44%
Топ-3 страны по миграции AI талантов на 10,000 Linkedin members:
🇱🇺 Люксембург: 8.92%
🇨🇾 Кипр: 4.67%
🇦🇪 ОАЭ: 4.13%
10/ Всего в 2024 году появилось более 2,000 AI компаний, которые еще и привлекли венчурное финансирование.
Это только капля в море. Читайте отчет, данных куча.
@proVenture
#ai #research
Про графовые сетки в рекомендациях порадовало. Люблю, когда в рекомендашках прикручивают штуки, красивые сами по себе, а они еще и прокрашиваются в эксперименте
Forwarded from AI.Insaf
Сходил сегодня на Датафест в Яндексе, где были только доклады про внутренние продукты. Что послушал:
• Спрос Яндекс Лавки: смесь Prophet и бустингов с дальнейшим разделением на продукты, регионы и там, где это улучшало метрики. TimeGPT не используем, так как в Prophet легко добавить выходные дни.
• У очень многих людей (2% или 20%) есть две колонки Алисы, и пришлось научиться понимать, к какой обращаются, и ещё учесть, что может быть несколько пользователей (мультиаккаунтинг). Во второй задаче ожидаемо лучше всего работает, когда человек сам об этом говорит.
• Большой доклад по рекомендациям в Яндекс Лавке. Суть в том, что работает двухбашенный подход с трансформером user-items, косинусные расстояния, которые передаются в бустинги, но дополнительно туда добавляются и сами запросы пользователей, и текущая корзина. И вот они попробовали это всё заменить графовой сеткой (PinSage + TwHIN, где ребра товар-корзина), иииии.... метрики упали. Что не понял, это что при первом запуске бизнес метрики упали, и только когда модель дофитили на результатах 1го запуска - метрики позеленели, это бага или фича? Сейчас же до 20% GMV - за счет рекомендаций
• Экран отписки от Плюса – метрика средней выручки с сохранившихся на экране пользователей с вычетом затрат на сохранение. Ранжирование не работает, так как лучше всего сохраняет скидка на подписку, предиктивно с оттоком не начинали, всё на бустингах
• Активно используют VLM для нейро и оффлайн эмбедингов для поиска картинок. Но интересно что нейро пока не научились монетизировать
Если выше это доклады из бизнесовой секции, то еще была 2я техническая, но слишком техническая. Например «Быстрая аппроксимация матрицы Фишера с помощью факторизации Кронекера» 🫡
P.S. Конференция растет, сидр уже давно, а вот кальяны — это что-то новое. И даже был квиз. Доклады можно посмотреть и в записи потом, а так главное там это живое общение
• Спрос Яндекс Лавки: смесь Prophet и бустингов с дальнейшим разделением на продукты, регионы и там, где это улучшало метрики. TimeGPT не используем, так как в Prophet легко добавить выходные дни.
• У очень многих людей (2% или 20%) есть две колонки Алисы, и пришлось научиться понимать, к какой обращаются, и ещё учесть, что может быть несколько пользователей (мультиаккаунтинг). Во второй задаче ожидаемо лучше всего работает, когда человек сам об этом говорит.
• Большой доклад по рекомендациям в Яндекс Лавке. Суть в том, что работает двухбашенный подход с трансформером user-items, косинусные расстояния, которые передаются в бустинги, но дополнительно туда добавляются и сами запросы пользователей, и текущая корзина. И вот они попробовали это всё заменить графовой сеткой (PinSage + TwHIN, где ребра товар-корзина), иииии.... метрики упали. Что не понял, это что при первом запуске бизнес метрики упали, и только когда модель дофитили на результатах 1го запуска - метрики позеленели, это бага или фича? Сейчас же до 20% GMV - за счет рекомендаций
• Экран отписки от Плюса – метрика средней выручки с сохранившихся на экране пользователей с вычетом затрат на сохранение. Ранжирование не работает, так как лучше всего сохраняет скидка на подписку, предиктивно с оттоком не начинали, всё на бустингах
• Активно используют VLM для нейро и оффлайн эмбедингов для поиска картинок. Но интересно что нейро пока не научились монетизировать
Если выше это доклады из бизнесовой секции, то еще была 2я техническая, но слишком техническая. Например «Быстрая аппроксимация матрицы Фишера с помощью факторизации Кронекера» 🫡
P.S. Конференция растет, сидр уже давно, а вот кальяны — это что-то новое. И даже был квиз. Доклады можно посмотреть и в записи потом, а так главное там это живое общение
Forwarded from Продакт аналитикс
Дорогие друзья!
Спешу сообщить, что серия эфиров на ютуб канале Продакт Аналитикс продолжается, а посему имею удовольствие анонсировать следующий эфир, который состоится уже завтра, 29 мая в 18:00 по московскому времени .
На этот раз нашим гостем будет многоуважаемый AI и ML эксперт, ex- CDO МТС, ex-CDS Яндекс. Такси , ex-ABBYY, автор канала Кантор AI, автор курсов MLInside , а также известный многим как автор специализации на Coursera ‘Машинное обучение и анализ данных’ от МФТИ и Яндекса Виктор Кантор 💎
О чем будем говорить:
• Куда ведут нас современные тренды AI/ML и как остаться на гребне волны
• С какими запросами приходит бизнес и какие софт- и хард-навыки нужны, чтобы стать классным топ-менеджером и удержаться на своей позиции
• Как пришла идея создания школы и чему актуально учить сейчас
• Насколько сильно отличается жизнь топ-менеджера и предпринимателя
Ваши вопросы , как и всегда, приветствуются, так что смело направляйте их в комментарии 👇
До встречи 🤗
Спешу сообщить, что серия эфиров на ютуб канале Продакт Аналитикс продолжается, а посему имею удовольствие анонсировать следующий эфир, который состоится уже завтра, 29 мая в 18:00 по московскому времени .
На этот раз нашим гостем будет многоуважаемый AI и ML эксперт, ex- CDO МТС, ex-CDS Яндекс. Такси , ex-ABBYY, автор канала Кантор AI, автор курсов MLInside , а также известный многим как автор специализации на Coursera ‘Машинное обучение и анализ данных’ от МФТИ и Яндекса Виктор Кантор 💎
О чем будем говорить:
• Куда ведут нас современные тренды AI/ML и как остаться на гребне волны
• С какими запросами приходит бизнес и какие софт- и хард-навыки нужны, чтобы стать классным топ-менеджером и удержаться на своей позиции
• Как пришла идея создания школы и чему актуально учить сейчас
• Насколько сильно отличается жизнь топ-менеджера и предпринимателя
Ваши вопросы , как и всегда, приветствуются, так что смело направляйте их в комментарии 👇
До встречи 🤗
Выложили первую часть разговора с Валерой Бабушкиным :)
Разговор у нас на мой взгляд не вполне типичный для видео в интернете: не хайпуем ни на чем, не устраиваем шоу, не цитируем мемы, не рассказываем ничего с карикатурными воплями «вау, ничего себе, представляешь!», в общем просто спокойно разговариваем. Возможно охваты от этого пострадают, но я получил большое удовольствие от общения, и надеюсь, многие из вас тоже получат удовольствие от видео.
Приятного просмотра :)
Разговор у нас на мой взгляд не вполне типичный для видео в интернете: не хайпуем ни на чем, не устраиваем шоу,
Приятного просмотра :)
YouTube
Карьера в топовых компаниях мира | Валерий Бабушкин 1 часть
Валерий Бабушкин — Эксперт по машинному обучению, Senior директор по Data & AI в BP (British Petroleum). Он Грандмастер по соревнованиям Kaggle и автор книги Machine Learning System Design. Валерий имеет уникальный опыт в Data Science: он был вице-президентом…
В тему Валеры: кто смотрел интервью, знает, что мы познакомились вживую лет семь назад на Матемаркетинге (конференция такая для менеджеров, аналитиков, ну и вообще много для кого еще). Матемаркетинг проходит осенью, а весной у тех же организаторов есть Aha Conf
Так вот в этом году она проходит уже сегодня и завтра, сегодня в 15:45 выступаю со своим докладом («Задачи, за которые компании платят сейчас и будут платить дальше») и оба дня будут доклады по ML на партнерских сессиях школы MLinside и Aha. Так что спустя семь лет я наконец-то иду на Матемаркетинг и Aha со своей собственной компанией как партнер, а не только как спикер :)))
После конфы поделюсь впечатлениями здесь. Надеюсь все пройдет норм, но ощущения немного как перед первым выступлением))
P.S.: Если вдруг кто-то хочет залететь в последний момент - промокод MLINSIDE дает скидку 20%
Так вот в этом году она проходит уже сегодня и завтра, сегодня в 15:45 выступаю со своим докладом («Задачи, за которые компании платят сейчас и будут платить дальше») и оба дня будут доклады по ML на партнерских сессиях школы MLinside и Aha. Так что спустя семь лет я наконец-то иду на Матемаркетинг и Aha со своей собственной компанией как партнер, а не только как спикер :)))
После конфы поделюсь впечатлениями здесь. Надеюсь все пройдет норм, но ощущения немного как перед первым выступлением))
P.S.: Если вдруг кто-то хочет залететь в последний момент - промокод MLINSIDE дает скидку 20%
ahaconf.ru
AHA!25
Большая техническая конференция о product-science, машинном обучении и продуктовой аналитике
This media is not supported in your browser
VIEW IN TELEGRAM
Есть классная возможность устроиться аналитиком в Яндекс за выходные
7–8 июня Яндекс проводит Weekend Offer Analytics. До 3 июня оставьте заявку на участие, 7 июня пройдите два технических собеседования, а 8 июня познакомьтесь с командами и получите офер.
В мероприятии участвует 12 команд: Алиса и Умные устройства, Игры, R&D, Рекламные технологии, Поиск и Суперапп, Безопасность, Коммерческий департамент, Автономный транспорт, Ecom-сценарии Поиска, Качество Поиска, Международный Поиск, Карты. Вы сможете пообщаться с менеджерами и выбрать проект, который покажется самым интересным.
Узнать подробности и зарегистрироваться можно здесь.
Реклама. ООО "Яндекс". ИНН 7736207543
7–8 июня Яндекс проводит Weekend Offer Analytics. До 3 июня оставьте заявку на участие, 7 июня пройдите два технических собеседования, а 8 июня познакомьтесь с командами и получите офер.
В мероприятии участвует 12 команд: Алиса и Умные устройства, Игры, R&D, Рекламные технологии, Поиск и Суперапп, Безопасность, Коммерческий департамент, Автономный транспорт, Ecom-сценарии Поиска, Качество Поиска, Международный Поиск, Карты. Вы сможете пообщаться с менеджерами и выбрать проект, который покажется самым интересным.
Узнать подробности и зарегистрироваться можно здесь.
Реклама. ООО "Яндекс". ИНН 7736207543
Forwarded from Midov trip
Важно помнить, что Product-Market Fit (PMF) можно не только найти, но и потерять.
Можно посмотреть на востребованность StackOverflow, главной площадки где разработчики спрашивают вопросы и получают ответы.
С выпуска ChatGPT, количество вопросов, которые люди задают кратно снизилось.
P.s. хотел отдельно поделиться классным графиком, но тут прилетел релевантный кадр с сегодняшнего выступления:)
Можно посмотреть на востребованность StackOverflow, главной площадки где разработчики спрашивают вопросы и получают ответы.
С выпуска ChatGPT, количество вопросов, которые люди задают кратно снизилось.
P.s. хотел отдельно поделиться классным графиком, но тут прилетел релевантный кадр с сегодняшнего выступления:)
🔥🔥🔥Никита как всегда прекрасен: одной цитатой из классики (в конце поста) учит эффективной работе с любым бизнес-заказчиком. Мотаем на ус!
Forwarded from Дата канальи — про «специалистов» в данных / ML / AI
Сегодня попал в Сити на один форум и вынужден был слушать в панели экспертования манагеров-каналий про рекомы, чуть руку не сломал борцовским приемом «фейспалм» 🤦♂️.
Все эти «на самом дела» и прочие «здравые смыслы», и «я 5 лет в отрасли и знаю что нужно пользователю» 🤦♂️.
Ни намека на метрики и A/B, зато вопросы. В духе: А как сделать так чтобы рекомендации были социально справедливыми? Знаете ответ? «А давайте снимать только хороший, патриотический контент».
Прям в стиле песни Захар Борисовича
Для таких вот у меня есть коробок вполне публичных примеров (а после беседы с пиар-службой кейсы теперь приходится фильтровать — заметили как их стало меньше в канале? — правда, большая часть просто ушла в отложку в 2026й)
Итак, канальи думали что SJM чем короче тем лучше, и вообще одной красной кнопки «купить» достаточно.
Ха раз
Ха второй раз
Добавление доп шагов к форме регистрации или к процессу покупки — увеличивает конверсии а не уменьшает!В их конкретных кейсах!
Другие канальи решили что если показывать что продукт популярен в соцсетях (social proof) то конверсия будет больше, но увы
А здесь вообще в одной статье собраны противоположные результаты : в одном продукте перфомят длинные тексты, в другом короткие. В одном продают простые заголовки, в другом сложные.
Пользователи охотнее делятся шортсами или длинными?
Надо проверять именно в вашем сервисе, а мб вообще в конкретной категории.
Смотрите с опаской на тех кто «знает как думает пользователь».
PS и самое вкусное, для тех кто не читал Ходжу Насреддина
На платформе Unbounce провели A/B-тест: Get MY free 30-day trial против Get YOUR 30-day trial
Результат, ожидаемо, на картинке к посту
Однажды Насреддин увидел толпу возле пруда, что рядом с мечетью. Подойдя поближе, он увидел, что в пруду тонет мулла. Люди кричали ему: "Дайте руку, почтеннейший, дайте руку! ", но тот только булькал и руки не протягивал. Тогда Насреддин подбежал и закричал: "Нате руку, почтеннейший, нате! " -- и мулла схватился. Когда люди спросили Ходжу, как ему удалось спасти муллу, он ответил:
-- Глупцы! Разве можно говорить мулле "Дайте"! Он понимает только "Нате"!
Все эти «на самом дела» и прочие «здравые смыслы», и «я 5 лет в отрасли и знаю что нужно пользователю» 🤦♂️.
Ни намека на метрики и A/B, зато вопросы. В духе: А как сделать так чтобы рекомендации были социально справедливыми? Знаете ответ? «А давайте снимать только хороший, патриотический контент».
Прям в стиле песни Захар Борисовича
Для таких вот у меня есть коробок вполне публичных примеров (а после беседы с пиар-службой кейсы теперь приходится фильтровать — заметили как их стало меньше в канале? — правда, большая часть просто ушла в отложку в 2026й)
Итак, канальи думали что SJM чем короче тем лучше, и вообще одной красной кнопки «купить» достаточно.
Ха раз
Ха второй раз
Добавление доп шагов к форме регистрации или к процессу покупки — увеличивает конверсии а не уменьшает!
Другие канальи решили что если показывать что продукт популярен в соцсетях (social proof) то конверсия будет больше, но увы
А здесь вообще в одной статье собраны противоположные результаты : в одном продукте перфомят длинные тексты, в другом короткие. В одном продают простые заголовки, в другом сложные.
Пользователи охотнее делятся шортсами или длинными?
Надо проверять именно в вашем сервисе, а мб вообще в конкретной категории.
Смотрите с опаской на тех кто «знает как думает пользователь».
PS и самое вкусное, для тех кто не читал Ходжу Насреддина
На платформе Unbounce провели A/B-тест: Get MY free 30-day trial против Get YOUR 30-day trial
Результат, ожидаемо, на картинке к посту
-- Глупцы! Разве можно говорить мулле "Дайте"! Он понимает только "Нате"!
Вот такое потрясающее предложение получил вчера, а теперь еще и сегодня с другого аккаунта. Можете не перечитывать, вы не ошиблись: хотят денег с гостя 😂😂😂
Переслал друзьям поржать, так оказалось, что сейчас такая схема развода есть и некоторые блогеры ведутся и расстаются со своими честно заработанными потом и кровью)))
Переслал друзьям поржать, так оказалось, что сейчас такая схема развода есть и некоторые блогеры ведутся и расстаются со своими честно заработанными потом и кровью)))
Появилась вторая часть моего разговора с Валерием Бабушкиным
YouTube
"Никогда на Руси джуны хорошо не жили" | Валерий Бабушкин 2 часть
Валерий Бабушкин — один из ведущих экспертов в области машинного обучения, Senior Director по Data & AI в BP (British Petroleum), Kaggle Competitions Grandmaster, автор книги Machine Learning System Design. Валерий возглавлял направление машинного обучения…
Forwarded from Вакансии друзей Жени Козлова
Please open Telegram to view this post
VIEW IN TELEGRAM
Вот конкретные механизмы, которые пионеры AI упоминают в своих выступлениях и интервью:
🔴 Йошуа Бенжио беспокоится о появлении автономных агентов, способных ставить собственные цели и оптимизировать их вне рамок, заданных человеком.
Речь не о злом ИИ, а об ИИ, у которого цели не совпадают с нашими.
🟠 Джеффри Хинтон делает акцент на внезапности и необратимости появления ИИ, способного манипулировать людьми лучше самих людей — например, под видом помощника или советника.
ИИ, способный сам обучать себя, писать код, копировать себя в облаке и обманывать системы контроля может "выйти из-под контроля" даже без злого умысла.
Возможная перспектива - армия дешёвых цифровых агентов, которые могут распространять фейки и дестабилизировать общество или внедряться в стратегические решения на уровне стран.
🟢 Янн ЛеКун — скептик экзистенциальных угроз, но признаёт возможность злоупотреблений ИИ со стороны людей (не самого ИИ) и считает это основным вектором риска.
Он опасается не «восстания машин», а усиления уже существующих систем давления и неравенства с помощью ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
Если как-то пропускать через себя опасения грандов, то меня заставляют считать AI в перспективе 5-10 лет не менее опасным, чем оружие массового поражения, два сценария, которые выглядят реалистично уже сейчас:
1. Автоматизация войны
ИИ сегодня — это конечно не «сознание» и не «разум», а оптимизатор целей в сложной среде. Если дать такому оптимизатору доступ к дронам, спутникам, системам логистики и связи — он быстро научится побеждать. И никто не захочет от этого отказаться, если так можно выиграть войну за часы, а не за месяцы.
Не нужно большой фантазии, чтобы понять, что дальше может пойти не так:
- ИИ будет выстраивать военную стратегию с минимизацией времени/стоимости конфликта — в ущерб человеческой жизни.
- Критическая инфраструктура противника (не обладающего аналогичными методами защиты) будет уничтожаться почти мгновенно. За этим будут следовать анархия, голод и мародёрство
Всё это не «восстание машин». Это целенаправленное использование ИИ в агрессивных целях.
2. Переобучение, которого никто не заметит
Второй сценарий — медленный, незаметный и, возможно, уже начался.
ИИ-системы сегодня — это черные ящики с тысячами гиперпараметров. Мы не всегда понимаем, почему они принимают решения, хотя и стараемся вести ресерч в направлении интерпретации прогнозов. Однако переобученная модель может:
1) оптимизировать целевую функцию в ущерб безопасности,
2) научиться скрывать нежелательные паттерны от проверки (опять же для лучшей оптимизации целевой функции, когда получение обратной связи включено в процесс обучения).
Со временем ИИ будет управлять:
💰 финансовыми потоками,
💊 медицинскими системами,
⚡️ энергосетями,
🚚 логистикой,
🤖 автоматическим принятием решений в критических инфраструктурах.
И если в этот момент где-то «просочится» оверфиттинг — результат может быть фатальным. Не потому что ИИ захотел зла, а потому что мы плохо валидацировали его работу.
Мы будем пытаться защищаться: строить каскады из других ИИ, оставлять rule-based проверки. Но чем опаснее контур, тем опаснее любая ошибка. И даже если в 99.9999% случаев всё работает нормально, оставшиеся 0.0001% в критических зонах могут стоить нам очень дорого.
Please open Telegram to view this post
VIEW IN TELEGRAM