tgoop.com/PythonPortal/4124
Last Update:
Самые используемые команды Python для очистки данных.df.head()
– первые строкиdf.info()
– информация о DataFramedf.describe()
– статистика числовых данныхdf.isnull().sum()
– количество пропущенных значенийdf.dropna()
– удаление строк с пропускамиdf.fillna(value)
– заполнение пропусковdf.drop_duplicates()
– удаление дубликатовdf.rename(columns={'old': 'new'})
– переименование колонокdf.astype({'col': 'type'})
– изменение типа данныхdf.replace({'old': 'new'})
– замена значенийdf.reset_index()
– сброс индексаdf.drop(['col'], axis=1)
– удаление колонокdf.loc['label', 'col']
– выбор по меткеdf.iloc[]
– выбор по индексуdf[df['col'] > value]
– фильтрацияdf.groupby('col').agg('mean')
– группировка и агрегацияdf.sort_values('col', ascending=False)
– сортировкаdf.value_counts()
– количество уникальных значенийdf.apply()
– применение функцииdf.pivot_table(values, index, columns)
– сводная таблицаpd.concat([df1, df2])
– объединение DataFramepd.merge(df1, df2, on='key')
– слияние по ключуdf1.join(df2)
– объединение по индексуdf1.append(df2)
– добавление строк