DSPROGLIB Telegram 6551
📌 Промт дня: как обрабатывать пропущенные значения в данных

Пропуски в данных — не просто шум, а важный сигнал. Как вы их обработаете — влияет на всё: от качества модели до честности метрик.

🎯 Вот промт, который можно дать ChatGPT, чтобы продумать стратегию:
У меня есть датафрейм с пропущенными значениями. Помоги:

– Проанализировать, в каких признаках есть пропуски и сколько их
– Разделить признаки на числовые и категориальные
– Предложить разумные стратегии для каждого типа (например: среднее, медиана, мода, отдельная категория, KNN, IterativeImputer)
– Добавить индикаторные признаки “was\_missing”, если это может быть полезно
– Проверить, связаны ли пропуски с целевой переменной
– Посоветовать визуализации, чтобы увидеть структуру пропусков (heatmap, matrix и т.п.)
– Указать, какие признаки стоит удалить из-за большого числа пропусков


💡 Подходит для ChatGPT в режиме кода или анализа пайплайна. Используйте этот промт, чтобы сэкономить время и продумать работу с пропусками системно.

Библиотека дата-сайентиста #буст



tgoop.com/dsproglib/6551
Create:
Last Update:

📌 Промт дня: как обрабатывать пропущенные значения в данных

Пропуски в данных — не просто шум, а важный сигнал. Как вы их обработаете — влияет на всё: от качества модели до честности метрик.

🎯 Вот промт, который можно дать ChatGPT, чтобы продумать стратегию:

У меня есть датафрейм с пропущенными значениями. Помоги:

– Проанализировать, в каких признаках есть пропуски и сколько их
– Разделить признаки на числовые и категориальные
– Предложить разумные стратегии для каждого типа (например: среднее, медиана, мода, отдельная категория, KNN, IterativeImputer)
– Добавить индикаторные признаки “was\_missing”, если это может быть полезно
– Проверить, связаны ли пропуски с целевой переменной
– Посоветовать визуализации, чтобы увидеть структуру пропусков (heatmap, matrix и т.п.)
– Указать, какие признаки стоит удалить из-за большого числа пропусков


💡 Подходит для ChatGPT в режиме кода или анализа пайплайна. Используйте этот промт, чтобы сэкономить время и продумать работу с пропусками системно.

Библиотека дата-сайентиста #буст

BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение


Share with your friend now:
tgoop.com/dsproglib/6551

View MORE
Open in Telegram


Telegram News

Date: |

Telegram has announced a number of measures aiming to tackle the spread of disinformation through its platform in Brazil. These features are part of an agreement between the platform and the country's authorities ahead of the elections in October. The main design elements of your Telegram channel include a name, bio (brief description), and avatar. Your bio should be: During a meeting with the president of the Supreme Electoral Court (TSE) on June 6, Telegram's Vice President Ilya Perekopsky announced the initiatives. According to the executive, Brazil is the first country in the world where Telegram is introducing the features, which could be expanded to other countries facing threats to democracy through the dissemination of false content. Activate up to 20 bots Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation.
from us


Telegram Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
FROM American