Telegram Web
Собеседование МЛ в Яндексе

Специально для вас, товарищи, мы устроились в Яндекс, чтобы собрать материалы.

Здесь вы найдете pdf файлы, в которых описаны, как проходит собеседование, какие типичные вопросы задают, red флаги, оценка грейда и многое другое.

В pdf файлах есть так называемый грейд, и вот как идет расценка в Яндексе:

-13 грейд это стажер
-14 грейд это джун
-15 грейд это мидл
-16 грейд это мидл+
-17 грейд это синиоры.

Все кандидаты должны пройти АА секцию - это собеседование по алгоритмам. Нужно будет решить 1-2 задачи.

-Открываем MLP pdf, видим что собеседование состоит из двух частей: алгоритмы и мл. Вопросы по мл достаточно классические (разбираем их в @zadachi_ds).
Также написаны типичные вопросы по мл, которые задаются стажером.
Прошу отнестись к вопросам серьезно, от этого будет зависит пройдете ли на следующий этап.
Важно: ссылки на femida не открываются, так как доступ ограничен для яндексоидов.

-Если вы стажер то скорее всего будет еще один алгособес.

-Далее для кандитов 15 и выше грейда предусмотрен собес по его направлению. В pdf будут файлы по nlp, cv asr, recsys, там вы можете ознакомиться с типичными вопросами, оценками, рэд флагами.
Важно: Если вы стажер, то вам тоже будут полезны эти файлы, так как на финалах команды задают такие же вопросы (но оценивают легче)

Теперь расскажу как я сам готовился к собеседованию по NLP и устроился в Яндекс.

-Сначала открыл MLP pdf и понял какие типичные вопросы задают по метрикам, линейной регрессии, ансамбли, нейронки и тд.
Далее прочитал хендбук шада, и порешал от туда задачи
На собесе действительно много спрашивали про метрики, дисбаланс класса, лог регресии, ансамбли.

-Так как я хотел на NLP ознакомился я с nlp pdf, далее поспрашивал у людей, и узнал что часто спрашивают BERT, трансформеры, Seq2Seq, я их повторил и к дополнение посмотрел GPT WEEK, там я выписал для себя трюки которым рассказал лектор, так же выписал какие то хайповые вещи оттуда.
Собес в команды по NLP разный, но они все любят трансформеры.

@postypashki_old
Поступашки объявляют набор на курс по АВ тестам!

Мечтаешь стать крутым аналитиком или дата сайентистом и с легкостью тащить собесы, но тебе не хватает фундамента? Хочешь овладеть знаниями и навыками для работы в крупной компании такой, как Яндекс, ВК, Сбер, Авито или Тинькофф? Тогда тебе к нам!

Курс заточен под практику, вся теория будет разобрана на конкретных задачах и кейсах, которые встречаются на работе и собесах. На курсах вас ждут пет проекты и мини проекты, которые пойдут в ваше портфолио, разбор реальных тестовых заданий бигтехов, разбор майского контеста на стажировку в Т-банк, разбор реальных технических вопросов с собесов!

Курс стартует 04.05 и длится 5 недель, каждую неделю по 2 урока, более 40 часов материалов с последующим доступом к записям и ДЗ с проверкой! На семинарах общаются с каждым учеником (можете посмотреть на то, как проходят семинары вот здесь ). Ежедневная связь, сильное окружение, помощь в составлении анкеты, резюме, пробные собесы, контесты, персональные рекомендации, инсайды и домашнее задание с проверкой, код ревью с разбором от преподавателя! Все будет еще круче, чем на всех прошлых курсах (отзывы тут).

Программа и Подробности.

📊 Цена очень низкая! Всего 8'500 рублей за курс

Для вопросов и покупок пишем администратору.
Please open Telegram to view this post
VIEW IN TELEGRAM
Яндекс_ml.pdf
106.3 KB
🎁 Публикуем разбор отборочного контекста на стажировку в яндекс по ML. Успейте пройти, у вас уже есть готовые решения, остаётся дело за малым!

Ещё больше разборов и полезных материалов на канале:
@ProdAnalysis
В новом ролике поймем, куда идти работать и кто предлагает наилучшие условия труда! Смотрим! Смотрим!

https://youtu.be/hokZyZvh0Ts
Поступашки объявляют запись на майские экспресс курсы к отборочным ШАДа!

Вы в целом понимаете как работать почти со всеми темами, но что-то все равно западает? Вы хотите отточить свои навыки решения задач до бритвенной остроты в кратчайшие сроки и научиться оформлять на полный балл? Хотите провести майские выходные с пользой? Тогда майский интенсив - это то, что вам нужно! Лекции со всей необходимой систематизированной теорией, семинары (на которых вы не просто сидите в чате, а имеете возможность отвечать, как на живом уроке), домашние задачи, разбор домашних задачек, куратор Владислав, который готовит в ШАД десяток лет, все что может вам потребоваться для полной подготовки к первому, второму этапу и собеседованию!
Цены самые доступные:

- алгоритмы 6000
- дискретная математика 6000
- теория вероятностей 6000
- линейная алгебра 6000
- математический анализ 6000

Сегодня и завтра отдаем интенсивы по скидке, с субботы (мск) продажа идет по зачеркнутой цене.

Начинаем уже в это воскресение! Первые лекции уже доступны, поэтому торопитесь

После семинара доступна запись. В роли куратора сам Владислав, который поможет заполнить анкету, поможет в абсолютно в любом вопросе, задаче. В конце курса вас ждет пробный экзамен, разбор реального контеста ШАДа 2025 года и персональное собеседование, как в ШАДе! А также разведка по каждому этапу, инсайды и персональные рекомендации.

Программа и Подробности.

Записаться и задать вопросы можно тут: @menshe_treh
разбор_ШАР.pdf
106.4 KB
Совсем чуть-чуть осталось времени до конца отбора ШАР, если вдруг вы откладывали до последнего, то у вас есть шанс ещё пройти, публикуем разбор ШАР!

Больше разборов на нашем курсе по а/б тестам.

@postypashki_old
Без этого ты сольешь ШАД

Ну что, товарищи, первый этап уже завтра: 29 апреля -5 мая. Много раз упомянал, что в программу первого этапа входит теор мин любого экзамена, зачета, во всех заданиях просто зашифрована простая идея или комбинация идей, все решается обычно в шага три.
Но что же делать, когда от волнения кровь стучит в виске и трясутся руки, и своей память просто не веришь? Конечно же нужно обложиться вольфрамом, гуглом и любимыми методичками, лекциями, где информация проверена, а нужный пример решения ищется в 2 клика мышки. О наиболее удачных методичках и пойдет речь.

Линейная алгебра
Как необходимый теоретический материал советую лекции Мануйлова, как мне кажется это лучшее, что есть для ШАДа и магистратур.
Примеры решения задач советую смотреть в Гайфулине. Писался для подготовки к зачетам мехмата, поэтому в нем разобраны все стандартные задачи.
В дополнении можно посоветовать Канунникова, где разбираются продвинутые задачи начал алгебры. Также Тимашева 1ый семестр, где аналогично Каннуникову, и 2ый семестр, где уже разбираются более теоретические задачки линала из того же Кострикина.
Время от времени в вариантах первого этапа возникают задачи по ангему, здесь же советую семинары Пенского.

Теория вероятностей
Как всегда посоветую книжечку для экономистов и семинары Сердобольской, которые отлично дополнят друг друга. Также советую, уже ставшей классикой зачеты Кондратенко, где собраны все типовые задачи, но без хорошей теоретической прокачки подступиться к ним будет непросто, ибо решения зачастую короткие.

Математический анализ
Однозначно семинары Скубачевского. Если чего-то не хватает, как например дифференцирование интеграла по параметру, то смотрим задачники Виноградовой.

Конечно мир не стоит на месте и постоянно появляются все новые и новые пособия. Если здесь не нашли своих фаворитах, то обязательно делитесь ими в комментариях!
Также для приобретения всех необходимых знаний и навыков для поступления в ШАД/магистратуры советую наши майские экспресс курсы.

@postypashki_old
Поступашки продолжают набор на курс по дискретной математике!

Мечтаешь поступить в ШАД или магистратуру? Или просто хочешь тащить собесы, но не хватает фундамента? Тогда тебе к нам!

На курсе будет разобрана специфика задач, ВСЕ идеи и подходы, используемые составителями. А также тебя ждёт пробный экзамен!

Как всегда лекции со всей необходимой систематизированной теорией, семинары (на которых вы не просто сидите в чате, а имеете возможность отвечать, как на живом уроке), домашние задачи, разбор домашних задачек, куратор и еще куча всяких плюшек!

Цена самая доступная: 6000р 4500р за курс, при покупке на одного человека.
Сегодня и завтра отдаем курс по скидке, со среды (мск) продажа идет по зачеркнутой цене.
При покупке любого курса серии дискретная математика обойдет в 3500р. (скидки не суммируются).
А при покупке двух и более курсов серии сегодня и завтра, дискретная математика в подарок!

Начинаем уже в эту пятницу! Первые лекции уже доступны, поэтому торопитесь.

После семинара доступна запись. Кураторы помогут заполнить анкету, помогут в абсолютно в любом вопросе, задаче. Вас ждет пробный экзамен, разбор реального контеста ШАДа 2025 года и персональное собеседование, как в ШАДе! А также разведка по каждому экзамену, инсайды и персональные рекомендации.

Программа и Подробности.

Для записи и вопросов: @menshe_treh

Также не забываем про другие курсы к ШАД и магистратурам
Эти пет проекты должен сделать каждый аналитик

1. Работа с данными
В любом новом продукте придется выстраивать аналитические процессы. Но для начала нужно просто привести данные к удобному виду. Так данные могут храниться как минимум не оптимально: например, есть база данных VK с одной таблицей, где хранятся посты и авторы этих постов. Скорее всего, постов будет намного больше, чем авторов, поэтому разумно создать новую таблицу, переместить туда посты, а из исходной удалить. Помимо такого не оптимального хранения, данные могут быть банально грязные: аномалии, дубликаты и пропуски, неудобный тип переменных. Для "очистки" данные пригодятся статистические методы и визуализация. Также уже на этом этапе можно формулировать какие-то гипотезы. Для выполнения такого задания достаточно открыть jupyter notebook взять любой сырой датасет c того же kaggle, имитирующий "большие данные", там же по запросу в духе "Exploratory Data Analysis" можно посмотреть примеры других пользователей.

2. Дашборды
Результаты предыдущей работы с данными нужно предоставить в удобном виде. Согласитесь, что ко всем важным показателям нашего продукта должен быть простой и быстрый доступ. Странно было бы если всей команде каждый раз приходилось писать запрос, чтобы узнать сколько у продукта пользователей. Поэтому выстраивание аналитики начинается с выведения ключевых метрик как DAU, WAU, MAU. Целевая задача состоит в визуализации и презентации, также можно повыдумывать свои метрики и сформулировать какие-то гипотезы, глядя на графики. Например, видим пик активных пользователей (маркетологи закупили рекламу), а потом видим отток — давайте посмотрим на retention и оценим насколько реклама эффективна. Также придется найти данные и настроить рабочее окружение, наиболее удачным для новичков мне кажется: ClickHouse, Redash, Superset, GitLab. Они интерактивны, к каждому есть туториал. На работе могут быть другие инструменты, но их освоения тоже не составит проблем.

3. AB тест
Здесь и пригодятся все гипотезы, сформулированные в предыдущих проектах: теперь их можно проверить. Сначала планируем эксперимент: рассчитываем необходимое кол-во пользователей, подобираем методы проверки. Огромный простор для воображения: можно подобрать более чувствительные метрики, можно потестить систему сплитования, можно использовать методы понижения дисперсии. Но лучше начать с самого простого: хоть как-то выбрать пользователей, разделить на тест и контроль и использовать t-тест, Манна - Уитни, проинтерпретировать результат + прикрутить все рабочее окружение из второго проекта. Если получится что-то рабочее, то прикручиваем хэширование с солью, АА-тест, бутстреп, cuped, бакетное преобразование и тд. Примеры AB тестов всякого качества можно посмотреть на том же kaggle, github.
А если хотите разобраться в теории и практики АВ тестирование, то советую наш курс, на который только сегодня в честь первого мая дейсвует скидка 30%!

4. Пайплан
Обычно данные хранятся в разных системах и в разных формах, аналитику нередко приходится перетаскивать данные в хранилище и выдавать их в виде графиков и табличек. Для имитации чего-то подобного можно взять данные из одной базы данных, возможно, эти источником будет также являться Kafka, положить в Hadoop, и поместить данные в другую базу данных, используя преобразования Spark, и запустить это все дело через Airflow.

5. Система алертов
На работе придется писать отчеты, поэтому лучше автоматизировать этот процесс через тг бота. Создаем, пишем скрипт для сборки отчета по выбранной бд. Подумайте, какие метрики выбрать, за какой период и как лучше представить отчет. Автоматизируйте отправку отчета с помощью Airflow. В дополнение к отчетам можно реализовать поиск аномалий: детектировать необычное поведения метрик и отправлять в чат. Выбираем метрики, срезы, частоту для мониторинга, метод детектирования. Методы можно разделить на статистические (правило трех сигм) и на основе мл алгоритмов (DBSCAN, LOF). Как всегда для начала реализовываем самое простое.

@postypashki_old
Полный цикл отбора в Яндекс (Аналитика 2025)

Сейчас студенты наших курсов проходят отборы в Яндекс, продолжаем радовать вас инсайдами и актуальными вопросами.
Кстати до 3 мая только для наших подписчиков действует скидка на курс по АВ тестам 30%!

Вступительный контест
Здесь просто взял решения из разбора, который выложили на курсах, переписал логику немного, также попросил гптшку поменять решения и закинул в контест.

Аналитическая секция

В начале интервьювер представился, прорекламил свою команду и попросил рассказать о себе в двух словах. Затем мы перешли к задачам.
Алгоритмическая задача:
Дан массив чисел и значение x, требуется найти минимальный по длине подотрезок массива, такой, что количество уникальных значений на этом отрезке >= x.
Задачка простенькая на два указателя (+хешмапа). Здесь интервьювер максимально задушнил и асимптотику просил пояснить подробно, ссылаясь ещё на работу хешмапы, начал выяснять как работает лист внутри и почему добавление O(1). Я выстоял. Задачку решил довольно быстро.
АБ:
На удивление ни единой задачки на ТВ не было, сразу перешли к дизайну АБ и критериям. В принципе здесь всё стандартно, просто обычный кейс, поспрашивал сколько человек разумно брать в эксперимент и какой критерий подойдёт, пытался вытянуть из меня идею применения CUPED ((P.S. кстати на новом курсе по тестам будет даже разбираться и cuped, и стратификация, и прочие заумные методы)), я даже вспомнил про его существование, но объяснил интервьюверу, что пока обошел мимо.
Метрики/unit экономика:
Дали кейс и попросили посчитать unit экономику, здесь справился быстро и без нареканий.

Алгоритмическая секция
Первая задача: баян на мердж двух отсортированных односвязанных списков.
Вторая задача: дана матрица (каждый элемент 0 или 1) и требуется найти подматрицу максимальной площади состоящую только из 1. Тоже известная задача.
У интервьювера было 0 замечаний к решению, халявы решил в сумме менее чем за 15 минут, так и закончился ласт алгособес и пригласили далее на финалы.

Интервью с командами
В основном на финале были пустые разговоры про мотивацию и прочее + задавали вопросы на продуктовое мышление. В двух командах были простенькие sql запросы. В третьей же задали целый ряд задач:
1. У нас есть два варианта рекомендательной системы. В A-группе конверсия 10% (на 1000 пользователей), в B-группе — 12% (на 1000). Достаточно ли этого, чтобы считать разницу значимой? Как проверить? Что делать, если выборка небольшая?
2. Компания запускает голосового ассистента для банка. Какие метрики стоит отслеживать в первые 3 месяца? Как понять, что продукт успешен?
Далее простенькие задачки на sql и итоговая болтовня.

По итогу меня взяли в последнюю команду. Подводя итоги, могу рассказать свой бэкграунд. Естественное ни о какой нормальной математики на БИ ВШЭ говорить и нельзя, всё я ботал сам, либо по курсам (но хочу отметить, что на собеседованиях естественно и не смогут проверить в полной мере твои харды, так что это легко можно и замаскировать). Курс алгосов в БИ относительно нормальный, для прохождения собесов с головой хватит (конечно тут говориться про именно знание тем, а не умение пользоваться алгоритмическим аппаратом, последнее естественно нужно будет тренить самому/либо у вас сразу пойдут простенькие задачи с собесов). Сама прога посредственная на БИ (но для аналитика собственно ничего трудного в проге и не нужно знать). SQL я выучил на курсах поступашек, как и прочую гуманитарщину, связанную с продкутовой частью. Что касается АБ, также базовые навыки изучил на курсах и сам ещё почитал другие материалы. Резюмируя, в принципе всё что мне понадобилось для отбора, я выучил за месяц и никаких особых хардов и не нужно, чтобы попасть на стажировку.

@postypashki_old
Первый этап ШАД 2025.pdf
3.7 MB
Выкладываем все задания отборочного этапа ШАД 2025 года! Сегодня последний день, чтобы подать заявку! Отбор получился самым сложным за все время, чтобы обмануть сомнительный интеллект.

Это им удалось, чатгпт выдает что-то неадекватное. Надеяться можно только на наши курсы, где УЖЕ ВЫЛОЖЕН РАЗБОР ШАДА 2025 года. Разбор только на наших курсах, только сегодня (4 мая) скидка 30%!

@postypashki_old
Т-банк открыл контест на летнюю стажировку. Задания уже лежат тут, там же их можно обсудить вместе с админом. И конечно разбор соответствующих контестов будет на нашем курсе по АВ тестам и экспресс курсе по алгоритмам как приятный бонус, так что присмотритесь к ним.

Стажировка в Т-банке - самая крупная стажировка после Яндекса по количеству мест. В целом решает не сколько баллы за экзамены, сколько "ваш социальный рейтинг", анкета — подробней смотрим здесь. После контестов зовут на собес: он дикая халява, если хоть немного пробовали вкатиться в специальность.

@postypashki_old
Почему ты должен попасть на стажировку в Т-банк

Сейчас открыто куча мест на кучу направлений. В посте разберемся, что может предложить существенного желтый банк и почему, товарищи, вы просто не имеете право упустить свой шанс.

Процесс отбора

В ролике уже выяснили, что для прохода на собеседование нужно решить контест (чей разбор будет на наших курсах) на "хор" и написать хорошую анкету. Собеседование стандартное, если знаете теорию специальности и поделали какие-то проекты, то проход обеспечен. То есть отбор в сравнении с другими массовыми стажками достаточно прозрачен, хоть и есть моменты лотереи, но зато не нужно проходить кучу отборов как в Яндексе или Авито.

Деньги
Платят прилично: 80-100 тыс (в зависимости от вакансии и уровня индексации к тому времени). Это звучит неплохо, если вспомнить, что в каких-то местах платят и 60 тыс. К тому же, это лишь на время стажировки, а в штат берут всех, кто хоть как-то старался первое время и удовлетворял ментора, который сам под конец стажировки уже забивает на подопечных (выгорает). В штате на позицию джуна можно рассчитывать на 150 тыс. В зависимости от вакансии и уровня инфляции к тому времени).

Условия труда
Два компота уже не взять, но все равно обеды есть, спортзал и сауна есть, ДМС и стомотология есть: сделаете себе зубы (покрывает до 50% разрушения зуба). К тому же, наконец-то выйдете из дома и начнете общаться с людьми, найдете друзей, очень много молодых ребят, и вторую половинку. В командах отличная атмосфера, ребятки ходят на всякие тусовки во внерабочее время (там бары, караоке, клубы, кальяны, квесты, квизы).

Статус
Он такой один. Будете использовать актуальные инструменты и технологические стеки, будете заниматься реально работающими проектами, которых много и можно выбрать на свой вкус, а если не понравится, то сменить. Процессы тоже выстроены нормально, реально чему-то научитесь. Можно расти как вертикально, так и горизонтально. В общем будет не стыдно добавить опыт работы в свое резюме, если захотите сменить контору. А так в компании есть 1-2 ежегодных ревью, по итогам которых могут поднять зп. Повышение для джунов происходит раз в пол года, а для мидлов и выше раз в год.

Если о чем-то забыли, то обязательно пишем в комментариях.
@postypashki_old
Media is too big
VIEW IN TELEGRAM
Вот и разбор математики на стажировку в Тинькофф! Разобрали первые 3 задачи, а разбор оставшихся будет только на нашем курсе по АВ тестам.
Будьте очень внимательны к ответам ChatGPT, на этот раз задачи составлен таким образом, чтобы обмануть нейросеть.Тех, кто введет этот неправильный ответ, система будет банить (это не байт).

@postypashki_old
Тест на знaние SQL.pdf
1 MB
Вот и разбор теста на знание SQL стажировки в Т-банк. А разбор SQL задач и экзамена по математике уже на нашем курсе по AB тестам, на который только сегодня дарим 30% скидку!

@ProdAnalysis
Media is too big
VIEW IN TELEGRAM
Вот и разбор алгоримтов на стажировку в Тинькофф! Коды тут. Разобрали первые 3 задачи, а разбор оставшихся будет только на нашем майском экспресс курсе по алгоритмам.
Будьте очень внимательны к ответам ChatGPT, на этот раз задачи составлены таким образом, чтобы обмануть нейросеть. Тех, кто воспользуется таким решением, система будет банить (это не байт).

@postypashki_old
2025/06/14 06:32:08
Back to Top
HTML Embed Code: