PYTHONPORTAL Telegram 4124
Самые используемые команды Python для очистки данных.

Инспекция данных

df.head() – первые строки
df.info() – информация о DataFrame
df.describe() – статистика числовых данных

Обработка пропущенных данных

df.isnull().sum() – количество пропущенных значений
df.dropna() – удаление строк с пропусками
df.fillna(value) – заполнение пропусков

Очистка и трансформация данных

df.drop_duplicates() – удаление дубликатов
df.rename(columns={'old': 'new'}) – переименование колонок
df.astype({'col': 'type'}) – изменение типа данных
df.replace({'old': 'new'}) – замена значений
df.reset_index() – сброс индекса
df.drop(['col'], axis=1) – удаление колонок

Выбор и фильтрация данных

df.loc['label', 'col'] – выбор по метке
df.iloc[] – выбор по индексу
df[df['col'] > value] – фильтрация

Агрегация и анализ данных

df.groupby('col').agg('mean') – группировка и агрегация
df.sort_values('col', ascending=False) – сортировка
df.value_counts() – количество уникальных значений
df.apply() – применение функции
df.pivot_table(values, index, columns) – сводная таблица

Объединение данных

pd.concat([df1, df2]) – объединение DataFrame
pd.merge(df1, df2, on='key') – слияние по ключу
df1.join(df2) – объединение по индексу
df1.append(df2) – добавление строк

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥42🤯2



tgoop.com/PythonPortal/4124
Create:
Last Update:

Самые используемые команды Python для очистки данных.

Инспекция данных

df.head() – первые строки
df.info() – информация о DataFrame
df.describe() – статистика числовых данных

Обработка пропущенных данных

df.isnull().sum() – количество пропущенных значений
df.dropna() – удаление строк с пропусками
df.fillna(value) – заполнение пропусков

Очистка и трансформация данных

df.drop_duplicates() – удаление дубликатов
df.rename(columns={'old': 'new'}) – переименование колонок
df.astype({'col': 'type'}) – изменение типа данных
df.replace({'old': 'new'}) – замена значений
df.reset_index() – сброс индекса
df.drop(['col'], axis=1) – удаление колонок

Выбор и фильтрация данных

df.loc['label', 'col'] – выбор по метке
df.iloc[] – выбор по индексу
df[df['col'] > value] – фильтрация

Агрегация и анализ данных

df.groupby('col').agg('mean') – группировка и агрегация
df.sort_values('col', ascending=False) – сортировка
df.value_counts() – количество уникальных значений
df.apply() – применение функции
df.pivot_table(values, index, columns) – сводная таблица

Объединение данных

pd.concat([df1, df2]) – объединение DataFrame
pd.merge(df1, df2, on='key') – слияние по ключу
df1.join(df2) – объединение по индексу
df1.append(df2) – добавление строк

👉 @PythonPortal

BY Python Portal




Share with your friend now:
tgoop.com/PythonPortal/4124

View MORE
Open in Telegram


Telegram News

Date: |

Just as the Bitcoin turmoil continues, crypto traders have taken to Telegram to voice their feelings. Crypto investors can reduce their anxiety about losses by joining the “Bear Market Screaming Therapy Group” on Telegram. Step-by-step tutorial on desktop: Hui said the messages, which included urging the disruption of airport operations, were attempts to incite followers to make use of poisonous, corrosive or flammable substances to vandalize police vehicles, and also called on others to make weapons to harm police. Read now Telegram is a leading cloud-based instant messages platform. It became popular in recent years for its privacy, speed, voice and video quality, and other unmatched features over its main competitor Whatsapp.
from us


Telegram Python Portal
FROM American