DSPROGLIB Telegram 6530
⭐️ Чек-лист: как правильно работать с pandas

Работаете с табличными данными?

Эти простые советы сэкономят вам время, память и нервы:

✔️ Используйте векторизацию вместо apply

Быстрее, короче, читаемее:
# Вместо apply
df["log"] = np.log(df["x"])


✔️ Считайте в столбцах, а не в цикле по строкам

Избавьтесь от .iterrows() — векторные операции эффективнее:
df["sum"] = df["a"] + df["b"]


✔️ Используйте `category` для колонок с повторяющимися строками

Существенно уменьшает потребление памяти:
df["country"] = df["country"].astype("category")


✔️ Загружайте только нужные данные

Не тратьте ресурсы на лишние строки и столбцы:
pd.read_csv("big.csv", usecols=["col1", "col2"], nrows=100_000)


✔️ Сохраняйте данные одним вызовом, а не в цикле

Сначала собираем — потом записываем:
df.to_csv("result.csv", index=False)


✔️ Контролируйте использование памяти

Проверяйте «тяжёлые» столбцы
df.memory_usage(deep=True)


Библиотека дата-сайентиста #буст
Please open Telegram to view this post
VIEW IN TELEGRAM



tgoop.com/dsproglib/6530
Create:
Last Update:

⭐️ Чек-лист: как правильно работать с pandas

Работаете с табличными данными?

Эти простые советы сэкономят вам время, память и нервы:

✔️ Используйте векторизацию вместо apply

Быстрее, короче, читаемее:

# Вместо apply
df["log"] = np.log(df["x"])


✔️ Считайте в столбцах, а не в цикле по строкам

Избавьтесь от .iterrows() — векторные операции эффективнее:
df["sum"] = df["a"] + df["b"]


✔️ Используйте `category` для колонок с повторяющимися строками

Существенно уменьшает потребление памяти:
df["country"] = df["country"].astype("category")


✔️ Загружайте только нужные данные

Не тратьте ресурсы на лишние строки и столбцы:
pd.read_csv("big.csv", usecols=["col1", "col2"], nrows=100_000)


✔️ Сохраняйте данные одним вызовом, а не в цикле

Сначала собираем — потом записываем:
df.to_csv("result.csv", index=False)


✔️ Контролируйте использование памяти

Проверяйте «тяжёлые» столбцы
df.memory_usage(deep=True)


Библиотека дата-сайентиста #буст

BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение




Share with your friend now:
tgoop.com/dsproglib/6530

View MORE
Open in Telegram


Telegram News

Date: |

A new window will come up. Enter your channel name and bio. (See the character limits above.) Click “Create.” Polls How to create a business channel on Telegram? (Tutorial) Choose quality over quantity. Remember that one high-quality post is better than five short publications of questionable value. With the sharp downturn in the crypto market, yelling has become a coping mechanism for many crypto traders. This screaming therapy became popular after the surge of Goblintown Ethereum NFTs at the end of May or early June. Here, holders made incoherent groaning sounds in late-night Twitter spaces. They also role-played as urine-loving Goblin creatures.
from us


Telegram Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
FROM American