tgoop.com/dsproglib/6495
Create:
Last Update:
Last Update:
📌 Промт дня: анализ важности признаков после обучения модели
После того как вы обучили модель (особенно если это ансамблевый метод вроде Random Forest или градиентного бустинга), важно понять, какие признаки влияют на предсказания.
Это помогает:
— интерпретировать модель,
— упростить её (feature selection),
— обнаружить «лишние» или дублирующие признаки.
Промт:
Проанализируй важность признаков обученной модели. Выполни следующие шаги:
— Извлеки и отсортируй признаки по степени важности.
— Построй barplot с топ-10 признаками.
— Проверь, есть ли признаки с нулевой или близкой к нулю важностью — возможно, их можно удалить.
— Если модель поддерживает SHAP / permutation importance — добавь соответствующую визуализацию.
— Сформулируй гипотезы: почему те или иные признаки оказались важны? Как это согласуется с предметной областью?
Рекомендованные инструменты:
model.feature_importances_
— в sklearn-моделях, XGBoost, LightGBMeli5
, shap
, sklearn.inspection.permutation_importance
— для глубокой интерпретацииseaborn.barplot
, matplotlib
— для наглядных графиковБиблиотека дата-сайентиста #буст