tgoop.com/PythonPortal/4223
Last Update:
Шпаргалка по визуализации данных на Python для EDA
1. Одновариативный анализdf.hist()
— гистограмма числовых колонокsns.boxplot(data=df, y='col')
— боксплот распределенияsns.kdeplot(data=df['col'])
— график плотностиdf['col'].value_counts().plot(kind='bar')
— столбчатая диаграмма частот
2. Двухвариативный анализsns.scatterplot(data=df, x, y)
— диаграмма рассеянияsns.regplot(data=df, x, y)
— рассеяние + линия регрессииsns.barplot(x, y, data=df)
— сравнение категорий по значениямsns.violinplot(data=df, x, y)
— распределение по категориямsns.boxplot(x, y, data=df)
— сравнение распределений
3. Многовариативный анализsns.pairplot(df)
— матрица scatter-графиковsns.heatmap(df.corr(), annot=True)
— тепловая карта корреляцийsns.jointplot(data=df, x='x', y='y')
— scatter + распределениеplt.scatter(x, y, c=z)
— scatter с цветом по переменнойsns.scatterplot(data=df, x=x, y=y, hue='z')
— scatter с цветовой категорией
4. Временные рядыdf.plot(x='date', y='value')
— базовый временной графикdf.rolling(window).mean().plot()
— скользящее среднееseasonal_decompose(df['col'])
— разложение временного рядаsns.lineplot(data=df, x='date', y='value')
— временной ряд с интервалами
5. Текстовый анализWordCloud().generate(text)
— облако словFreqDist(words).plot()
— частотный графикsns.barplot(x=words, y=frequencies)
— частоты слов в столбиках
6. Кастомизацияplt.title('Заголовок')
— заголовокplt.xlabel('ось X') / plt.ylabel('ось Y')
— подписи осейplt.xticks(rotation=45)
— поворот подписейplt.tight_layout()
— авторасстановкаplt.figure(figsize=(10, 6))
— размер графика
7. Сохранение и показplt.show()
— показать графикplt.savefig('график.png')
— сохранитьplt.close()
— закрыть окно графика