ASISAKOV_CHANNEL Telegram 80
Как из 6000 признаков выбрать 10 наиболее нужных для модели?

Допустим, мы нагенерили много признаков с использованием техник, описанных в посте выше. Что делать дальше? Неужели нам потом надо тянуть в модель их все и собирать для них отдельные витрины? С 6к признаков такого бы не хотелось.
То есть изначально вопрос стоит вот так: «Имеем 6000 фичей, как сократить?»
1. L1 регуляризация
2. PCA
3. RFE (recursive feature elimination)
4. Feature importance (permutation, SHAP, split (for GB), entropy (for GB), mutual info) -> feature stepwise selection
5. Проверка на статистическую значимость коэффициентов при признаке
6. Проверка на взаимокорреляцию фич друг с другом и на корреляцию с таргетом
7. Проверка по VIF, PSI

Если нужно, в других постах могу раскрыть все эти вещи подробнее

#ml
3👍3🔥2



tgoop.com/asisakov_channel/80
Create:
Last Update:

Как из 6000 признаков выбрать 10 наиболее нужных для модели?

Допустим, мы нагенерили много признаков с использованием техник, описанных в посте выше. Что делать дальше? Неужели нам потом надо тянуть в модель их все и собирать для них отдельные витрины? С 6к признаков такого бы не хотелось.
То есть изначально вопрос стоит вот так: «Имеем 6000 фичей, как сократить?»
1. L1 регуляризация
2. PCA
3. RFE (recursive feature elimination)
4. Feature importance (permutation, SHAP, split (for GB), entropy (for GB), mutual info) -> feature stepwise selection
5. Проверка на статистическую значимость коэффициентов при признаке
6. Проверка на взаимокорреляцию фич друг с другом и на корреляцию с таргетом
7. Проверка по VIF, PSI

Если нужно, в других постах могу раскрыть все эти вещи подробнее

#ml

BY asisakov


Share with your friend now:
tgoop.com/asisakov_channel/80

View MORE
Open in Telegram


Telegram News

Date: |

The optimal dimension of the avatar on Telegram is 512px by 512px, and it’s recommended to use PNG format to deliver an unpixelated avatar. Content is editable within two days of publishing Read now Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name.
from us


Telegram asisakov
FROM American