DS_INTERVIEW_LIB Telegram 1099
➡️ В вашей задаче класс «положительный» встречается крайне редко. Модель даёт 99% accuracy — но приносит ноль пользы.

Это ситуация дисбаланса классов, и такая высокая accuracy — иллюзия: модель просто всегда предсказывает «отрицательный» класс.

Важно:
➡️ Перейти к метрикам, чувствительным к редкому классу: F1, precision/recall, ROC AUC, PR AUC.
➡️ Попробовать балансировку: undersampling/oversampling, генерация данных (например, SMOTE).
➡️ Использовать взвешенные лоссы или кастомные метрики, чтобы усилить «наказание» за ошибки на редком классе.
➡️ Рассмотреть другой подход — например, не классификацию, а ранжирование, если цель — находить top-N полезных примеров.
➡️ Проконсультироваться с бизнесом: возможно, важна high precision, а recall можно жертвовать — или наоборот.

Библиотека собеса по Data Science
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍1



tgoop.com/ds_interview_lib/1099
Create:
Last Update:

➡️ В вашей задаче класс «положительный» встречается крайне редко. Модель даёт 99% accuracy — но приносит ноль пользы.

Это ситуация дисбаланса классов, и такая высокая accuracy — иллюзия: модель просто всегда предсказывает «отрицательный» класс.

Важно:
➡️ Перейти к метрикам, чувствительным к редкому классу: F1, precision/recall, ROC AUC, PR AUC.
➡️ Попробовать балансировку: undersampling/oversampling, генерация данных (например, SMOTE).
➡️ Использовать взвешенные лоссы или кастомные метрики, чтобы усилить «наказание» за ошибки на редком классе.
➡️ Рассмотреть другой подход — например, не классификацию, а ранжирование, если цель — находить top-N полезных примеров.
➡️ Проконсультироваться с бизнесом: возможно, важна high precision, а recall можно жертвовать — или наоборот.

Библиотека собеса по Data Science

BY Библиотека собеса по Data Science | вопросы с собеседований


Share with your friend now:
tgoop.com/ds_interview_lib/1099

View MORE
Open in Telegram


Telegram News

Date: |

A new window will come up. Enter your channel name and bio. (See the character limits above.) Click “Create.” The imprisonment came as Telegram said it was "surprised" by claims that privacy commissioner Ada Chung Lai-ling is seeking to block the messaging app due to doxxing content targeting police and politicians. Ng was convicted in April for conspiracy to incite a riot, public nuisance, arson, criminal damage, manufacturing of explosives, administering poison and wounding with intent to do grievous bodily harm between October 2019 and June 2020. Public channels are public to the internet, regardless of whether or not they are subscribed. A public channel is displayed in search results and has a short address (link). As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail.
from us


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM American