Вопросы с собеседования ДомКлика

Ebout Data Science | Дима Савелко

Вопросы с собеседования ДомКлика

Продолжение предыдущего поста

⭐️

Classic ML

💪

✨

Что на выходе даёт логистическая регрессия?
- Вероятность классов. тык, тык, мегатык

✨

Какая функция оптизируется в логистической регрессии ?
- лог лосс, опять тык, тык, мегатык

✨

Опиши работу алгоритма дерева ?
Шаг 1: Начинаем построение с корня
Шаг 2: Ищем лучший предикат и смотрим на новые разбиения
Шаг 3: Проваливаемся в новые вершины
Шаг 4: Если выполнен критерий останова, то даем прогноз
Шаг 5: Иначе - для выбранной вершины повторяем Шаги 2-5
тык, тык

✨

Что мы получаем на выходе листа при задачи классификации и при задачи регрессии ?
- при задачи классификации возвращается вероятность - доля классов, в задачах регрессии среднее от значений, опять тык, тык

Краткий ликбез по вопросам ниже:
Смещение - говорит о том, насколько точно модель предсказывает выборку, если смещение маленькое, то модель хорошо подстроилась под выборку, если смещение большое, то она не очень подстроилась под неё
Разброс - насколько хорошо модель генерилизировалась на данных, другими словами, насколько не чувствительна к изменению данных.. Маленький разброс - модель имеет обобщающую способность, большой разброс - модель плохо обобщает.

✨

Что изменится будет, если из леса решений сломалось одно дерево ?
- У каждого дерева в лесе малое смещение, но большой разброс. За счёт бустрапа выборки и усреднения деревьев мы уменьшаем разброс. При удалении дерева увеличится разброс ансамбля, так мы удалили один элемент усреднения.

✨

Что изменится , если из бустинга сломалось одно дерево ?
- Каждое дерево в ансамбле имеет высокое смещение, но маленький разброс, так как мы обучаем деревья маленькой глубины - они имеют хорошую обобщающую способность. При обучении бустинга на каждом шаге модель пытается улучшить свои предсказания, уменьшая остатки предыдущих моделей. Это необходимо для уменьшения смещения и улучшения качества предсказаний.

Deep Learning

💪

💪💪

✨

Что такое TF-IDF, расскажи формулу ?
- Кратко говоря, TF-IDF - это вектор предложения, лучше тык на базу

✨

Что такое функция активации ? И зачем она нужна ?
- Функция активации - нелинейное преобразование, поэлементно применяющееся к пришедшим на вход данным. Благодаря функциям активации нейронные сети способны порождать более информативные признаковые описания, преобразуя данные нелинейным образом. Тык

✨

Что будет лучше для длинной последовательности: LSTM или GRU ?
- LSTM (Long Short-Term Memory) и GRU (Gated Recurrent Unit), уже название говорит само за себя. LSTM имеет под собой более сложную архитектуру, чем GRU, что помогает ей запоминать больше, Тык

Итог:
Как БлицОпрос - норм, 3 Валерия Бабушкина из 5 Валериев Бабушкинов
Оценка:

😯

😯/😯

😯

Please open Telegram to view this post

VIEW IN TELEGRAM

🍌8🥰1

www.tgoop.com/eboutdatascience/102

3.18K viewsedited Mar 8, 2024 at 08:23

tgoop.com/eboutdatascience/102

Create: 2024-03-08
Last Update: 2025-10-15 21:46:06

Вопросы с собеседования ДомКлика

Продолжение предыдущего поста ⭐️

Classic ML 💪
✨ Что на выходе даёт логистическая регрессия?
- Вероятность классов. тык, тык, мегатык
✨ Какая функция оптизируется в логистической регрессии ?
- лог лосс, опять тык, тык, мегатык
✨ Опиши работу алгоритма дерева ?
Шаг 1: Начинаем построение с корня
Шаг 2: Ищем лучший предикат и смотрим на новые разбиения
Шаг 3: Проваливаемся в новые вершины
Шаг 4: Если выполнен критерий останова, то даем прогноз
Шаг 5: Иначе - для выбранной вершины повторяем Шаги 2-5
тык, тык
✨ Что мы получаем на выходе листа при задачи классификации и при задачи регрессии ?
- при задачи классификации возвращается вероятность - доля классов, в задачах регрессии среднее от значений, опять тык, тык

Краткий ликбез по вопросам ниже:
Смещение - говорит о том, насколько точно модель предсказывает выборку, если смещение маленькое, то модель хорошо подстроилась под выборку, если смещение большое, то она не очень подстроилась под неё
Разброс - насколько хорошо модель генерилизировалась на данных, другими словами, насколько не чувствительна к изменению данных.. Маленький разброс - модель имеет обобщающую способность, большой разброс - модель плохо обобщает.
✨ Что изменится будет, если из леса решений сломалось одно дерево ?
- У каждого дерева в лесе малое смещение, но большой разброс. За счёт бустрапа выборки и усреднения деревьев мы уменьшаем разброс. При удалении дерева увеличится разброс ансамбля, так мы удалили один элемент усреднения.
✨ Что изменится , если из бустинга сломалось одно дерево ?
- Каждое дерево в ансамбле имеет высокое смещение, но маленький разброс, так как мы обучаем деревья маленькой глубины - они имеют хорошую обобщающую способность. При обучении бустинга на каждом шаге модель пытается улучшить свои предсказания, уменьшая остатки предыдущих моделей. Это необходимо для уменьшения смещения и улучшения качества предсказаний.

Deep Learning 💪💪💪
✨ Что такое TF-IDF, расскажи формулу ?
- Кратко говоря, TF-IDF - это вектор предложения, лучше тык на базу
✨ Что такое функция активации ? И зачем она нужна ?
- Функция активации - нелинейное преобразование, поэлементно применяющееся к пришедшим на вход данным. Благодаря функциям активации нейронные сети способны порождать более информативные признаковые описания, преобразуя данные нелинейным образом. Тык
✨ Что будет лучше для длинной последовательности: LSTM или GRU ?
- LSTM (Long Short-Term Memory) и GRU (Gated Recurrent Unit), уже название говорит само за себя. LSTM имеет под собой более сложную архитектуру, чем GRU, что помогает ей запоминать больше, Тык

Итог:
Как БлицОпрос - норм, 3 Валерия Бабушкина из 5 Валериев Бабушкинов
Оценка: 😯 😯 😯/😯 😯 😯 😯 😯

Telegram News

Вопросы с собеседования ДомКлика