Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
- Telegram Web
Telegram Web
Конференция от Яндекса: Data-Driven

Мне предложили написать, и я с радостью согласился. 20 сентября Яндекс организует конференцию Data-Driven. Я бы сказал, что мероприятие для аналитиков, но и DS тоже может быть интересно. Сейчас поймете почему.

Мероприятие организуется Поиском и Рекламными технологиями Яндекса. А в этих областях аналитика традиционно сложная, и граница между аналитиками и DS размывается. Например, аналитики могут придумывать алгоритмы, а DS-ы разрабатывать метрики.

Доклады поделили на два трека:

- для продуктовых, data-аналитиков и data scientists
- для data-инженеров, системных и BI-аналитиков

Сетка еще формируется и состоит из докладов Яндекса (на мой взгляд это плюс). Из анонсированного обратил внимание на доклад про end-to-end качество Алисы и о том как устроен бизнес рободоставки.

По опыту Practical ML Яндекс круто организует свои ивенты. Всем рекомендую обратить внимание.

Реклама. ООО "Яндекс". ИНН 7736207543

Ссылка для регистрации
👍12🔥6😐1
Есть ли разница между DS инженером и AI исследователем

Илон Маск написал, что отменяет в xAI должность researcher. Теперь все будут engineer.

Ян Лекун (один из главных авторитетов в ML рисерче) написал длинный пост в линкедин с критикой.


Мне лично кажется деление на researcher и engineer разумным. Саму работу в DS я бы поделил на 3 категории

- Разработка прикладных решений. Делают DS инженеры 👷
- Разработка экспериментальных решений. Тоже делают DS инженеры 👷
- Создание новых технологий и методов. Делают исследователи 🧑‍🔬

💊 Этими тремя группами удобно оперировать с точки зрения управления ресурсами компании. Вы балансируете, сколько человек работают над результатом здесь и сейчас, а сколько работают на средний и далекий горизонт. Теперь по поводу ролей.

Цель инженера - создать рабочее решение. Цель исследователя - создать новую технологию и опубликовать статью. Давайте разберемся, почему я поделил работу между инженерами и исследователями как написал выше.

- По поводу прикладных решений вопросов нет. Это абсолютно инженерная работа. Новые методы изобретать не нужно, а нужно уметь из существующих собрать рабочее решение, сделать файн-тюн, добавить эвристики итд.

- По экспериментальным решениям менее однозначно. В процессе могут появиться новые методы и архитектуры моделей, но это не основной продукт, это не делается специально (в здоровых командах 🤒). Главное - именно собрать рабочее решение, поэтому работа инженерная.

- А вот в целенаправленном создании новых методов работа не инженерная. Неоднозначность тут вызывается тем, что в AI значительная часть исследований - корпоративная. Корпоративная среда не хочет сухих открытий 💰, она хочет внедрений. Но пилотирование новой модели - это не исследовательская работа, это уже другая задача. Если создан интересный метод, помочь его протестировать должен DS инженер. По крайней мере так это реализовано у нас в нашем небольшом рисерче монетизации.

Итого, я бы не отказывался от разделения инженера и исследователя

Характер работы и требуемые навыки и правда слишком разные. Если инженера можно подвинуть с прикладных решений на экспериментальные, то рисерчера как правило никуда не подвинуть.

#management@big_ledovsky
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍123
Субботний пост про overemployment

🩸 В начале августа была волна обсуждения в соцсетях про увольнение сотрудника Rutube за то, что состоял в ИТ-«секте» «Осознанная меркантильность», где учат работать на нескольких работах одновременно

Помню, что приехал в Киргизию, настраивался на поход, отдыхал и читал тг. На этот случай я наткнулся в канале Тимлид очевидность, потом оттуда перешел еще в пару каналов итд. Было любопытно, можете повторить мой путь.

Моя реакция на оверэмплоймент (утаиваемый) - жесткий красный флаг. Но тут я посмотрел подкаст Мастридера с основателем сообщества. И знаете. Так я его послушал. Да вроде и не такое зло он несет. Мой флаг остался красный, но чуть-чуть пожелтел.

Я разделяю один его поинт. Средний сотрудник не топ-тир компании работает не очень эффективно. Если работать как следует, можно тот же объем работы делать за 4 часа.

И частично разделяю другой. Рынок труда уравнивает людей и за x2 продуктивность нельзя получить x2 компенсацию.
Моя корректировка: в краткосроке. В долгосроке в хорошей компании вы сможете пробиться действительно высоко

Согласны? 🤔

#career@big_ledovsky
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13😈3😱1
Вышел мой большой доклад про ранжирование продвижения

Вышло видео моего доклада с IML 2025: «Как мы ранжируем платные объявления в поиске и ленте рекомендаций Авито».
В нём я подвожу итоги 2,5 лет работы моей команды над алгоритмами размещения платных объявлений, над которыми мы работали вместе с коллегами и всеми, кто нам помогал.

Это рассказ не только про наши текущие алгоритмы. Это еще про наш путь и про эволюцию нашей мысли.

YouTube
VK

А слайды выкладывал в одном из прошлых постов
24🔥19
Какие DS конференции будут в сентябре

Сентябрь традиционно очень богатый на конференеции

Ozon E Code. 13-14 сентября. DS часть 14-го. Точно пойду. Помимо традиционной части с докладами, мы еще участвуем в Ozon E Cup, у нас будет питчинг решений.

AI Conf. 26 сентября. Скорее всего не пойду. Не влезает в график, плюс конфа платная. Билетов от компании у меня в этот раз нет, а бюджет на обучение я планирую потратить на другое. Короче, так сильно мне на нее не хочется.

Practical ML. 27 сентября. Хочу пойти. Честно говоря поздно подал заявку, надеюсь что пришлют приглашение. Если нет, может быть по связям напрошусь.

Если будете на E Code, пишите, встретимся!

upd: Yandex Neuro Scale 24 сентября. Видел эту конфу, но она чисто про AI инфру, и даже не рассматривал ее

тогда можно и Data Driven 20 сентября включить, про которую я писал, которая больше для аналитиков
🔥11👍71
🍜 Что происходит на рынке DS

Пару мыслей по поводу отчета dev crowd, который вышел в августе.

Мне было приятно приятно увидеть, что Авито продвинулся с пятого на второе место в рейтинге работодателей. Я участвую в рабочей группе DS PR. Этот год мы системно вкладывались в наш DS бренд. Короче, мы большие молодцы 🔥

Что насторожило. Большая часть DS-ов работает в крупных компаниях. Это ожидаемо. Но при этом, лишь у 20% респондентов результат измеряется в бизнес-метриках. Больше половины не видят прямого влияния на бизнес.

Как так? Вроде DS уже зрелая функция, во многих компаниях существует лет 10. И большинство людей не видят влияния на бизнес. Вопрос риторический.

#career@big_ledovsky
👍5🔥53💯2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
11🔥6
Ну вот, нарешали на 3 место. Жаль Мишу Каменщикова и Рому Снеткова онлайн не подключили.
🔥58🏆156🤩2
Пятничная атмосфера. Вместо мониторингов - фильмы про дикую природу 😃

ps. А вообще мониторинги на телевизорах - это для самоуспокоения. Все проблемы должны обрабатываться на алертах дежурными
😁168🔥2
Почему рекомедации популярнее поиска?

С интересом читаю посты ребят, кто сейчас на конфе RecSys (например Кирилла Хрыльченко и Никиту Зелинского). Если вы специализируйтесь на рекомендациях, наверное следите тоже.

Мне не дает покоя вопрос, почему в DS сообществе рекомендации сейчас так популярны, а поиск как будто нет?

Да, в рекомендациях есть прикольные трансформерные модели. Но и в поиске есть DSSM модели. С точки зрения пользы бизнесу - и поиск, и рекомендации приносят сравнимые аплифты метрик.

💎 Почему так? У кого какие мнения?

Моя версия Это как горные лыжи и сноуборд. Поиск просто вышел из моды
Please open Telegram to view this post
VIEW IN TELEGRAM
😁9🔥31
Сегодня на Practical ML

Уже третий раз на этой конференции. Она опять круто сделана. Качество докладов очень высокое.

Мы и в этот раз с докладом. Ходили с ребятами поддержать Антона с его выступлением про DL CTR.

И, конечно, подходите познакомится и пообщаться! Буду очень рад 🙂
🔥205👍3
Как нас с другом приняли за ***

Предыстория. Приехали мы в командировку в СПб, чтобы посидеть вместе с сейлзами и послушать, как они общаются с клиентами.

Я обожаю все, что касается общения с клиентами. На такое у нас кстати берут не только менеджеров, но и обычных дата сайнтистов. Но к теме

Мы с Денисом заходим в отель. Отель шикарный, исторический - нам открывают дверь швейцары, интерьер с вензелями, вид на Исакий. Мы даем паспорта. Мой паспорт что-то долго смотрят и ничего не говорят. Берут паспорт Дениса и говорят - нашли вашу бронь.

Спрашивают - вы вдвоем? А к Денису должна приехать жена. Он говорит - да, вдвоем, до выходных. Нам улыбаются и начинают оформлять 😅

Я понимаю, что что-то не так. Проверяю бронь и понимаю, что у меня другой отель. К счастью он в соседнем доме. Я об этом говорю, возникает неловкая пауза, мы с Денисом заливаемся смехом, а ресепшионист нет 😂 Я забираю паспорт и поспешно ретируюсь.

Совет: внимательнее проверяйте отель в который вы заселяетесь 😀
😁442🔥1
Поиск и LLM. Как сломался data-driven подход

Из разговоров на кухне . Я уже давно перестал пользоваться традиционным поиском, таким как Яндекс и Google, и перешел на ChatGPT. Это глобальный тренд. ChatGPT и его аналоги существенно лучше работают. Кто-то использует Perplexity, например

Что мне меньше нравится в обычном поиске - это качество источников. Вводишь условно «как лучше спать», тебе выходят статьи из комсомольской правды. А ChatGPT даст саммари и подкрепит ссылками на рецензируемые статьи с PubMed. Это конечно круто.

Необычность ситуации в том, что поиск - зрелая индустрия. В технологических гигантах сотни людей годами качают метрики качества поиска. Например, релевантность или конверсию в клик в ранжировании. И тут такой заметный скачок в пользовательском восприятии.

Почему так произошло? У меня одно объяснение. Традиционные метрики поиска на самом деле паршивые. Они недостаточно хорошо отражают пользовательское качество. Надеюсь не сильно расстроил читателей, который обучают ML модели в поиске на эти метрики (я сам из них 🤷‍♂). Может быть поисковикам стоит начать показывать две выдачи слева и справа как ChatGPT?

#tech@big_ledovsky
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥71
Собеседование в прямом эфире: ML system design
13 октября | 18:30 мск

Что будет на стриме:
1️⃣ Разберём ML system design кейс, который ещё в недавнем прошлом предлагали на реальных собеседованиях.

2️⃣ Поговорим про компетенции, которые в Авито ждут от DS-инженеров.

3️⃣ Разберём результаты по итогам решения кейса и ответим на ваши вопросы.

Кто будет на стриме:
👤 Интервьюеры — Саша Ледовский, руководитель DS команд монетизации Авито и Максим Каширин, руководитель Data Science направления в модерации Авито.

👤 Кандидат —Дмитрий Савелко, LLM-инженер в R&D команде банка Точка.

Больше информации про событие и регистрация на Timepad.
Пришлём вам ссылку с напоминанием за 5 минут до старта 🚀
🔥17👍62🤡1
2025/10/11 07:09:38
Back to Top
HTML Embed Code: