tgoop.com/dsproglib/6441
Create:
Last Update:
Last Update:
📊 Промт дня: быстрый разведочный анализ (EDA) нового датасета
Перед тем как приступить к построению моделей или визуализаций, важно понять, с какими данными вы работаете. Разведочный анализ (Exploratory Data Analysis, EDA) помогает выявить структуру, качество и ключевые особенности датасета — это фундамент любого проекта в области аналитики и машинного обучения.
Промт:
Выполни экспресс-EDA (Exploratory Data Analysis) на pandas DataFrame. Проанализируй следующие аспекты:
• Определи типы переменных (числовые, категориальные и пр.).
• Проверь наличие и долю пропущенных значений по столбцам.
• Рассчитай базовые статистики (среднее, медиана, стандартное отклонение и т.д.).
• Оцени распределения признаков и выдели потенциальные выбросы.
• Сформулируй ключевые наблюдения и инсайты, которые могут повлиять на последующую обработку или моделирование данных.
🎯 Цель — получить общее представление о структуре, качестве и особенностях данных до начала построения моделей или визуализаций.
Поддерживается использование специализированных инструментов:
pandas_profiling
/ ydata-profiling
— для автоматического отчета,sweetviz
— для визуального сравнения датасетов,seaborn
и matplotlib
— для точечных визуализаций распределений и корреляций.Библиотека дата-сайентиста #буст