tgoop.com/eduopenbio/28
Create:
Last Update:
Last Update:
В прошлых постах мы рассказали, как в pandas можно работать с электронными таблицами. Но что делать, если осваивать такой функционал сложно и страшно? Для начала можно работать с файлами CSV — в анализе данных и биоинформатике чаще всего используют их. Методы pd.read_csv и df.to_csv похожи на аналогичные методы для Excel, но имеют меньше параметров, потому что сам формат проще.
✔️ Открытие файла CSV:
df = pd.read_csv(”my_csv_file.csv”)
✔️ Сохранение фрейма данных в файл csv:
df.to_csv(”my_resulting_file.csv”)
В биоинформатике можно годами работать в pandas только с форматом CSV. Методы работы с файлами Excel пока используются относительно редко, но с распространением Python и методов data science они будут становиться всё актуальнее.
CSV может также выручить, когда используется “альтернативный” софт для электронных таблиц, в котором поддержка файлов XSLX реализована не в полной мере, например, OpenOffice/LibreOffice (а в Linux – любимой операционной системе биоинформатиков — по умолчанию используются именно они).
Формат файлов ODS не открывается в pandas без использования дополнительных библиотек (как-нибудь расскажем и о них), и сохранение в него также невозможно. Формат CSV может послужить удобным мостиком — любое приложение электронных таблиц умеет его импортировать и сохранять в него данные. Если сохранить данные в файл CSV в pandas, то затем можно его импортировать в таблицу OpenOffice Calc, сохранить её в формате ODS и продолжить работу уже в офисных программах.
📌 В одном из следующих постов мы также расскажем, как интегрировать pandas и базы данных SQL — ещё один рабочий инструмент аналитиков данных. Не переключайтесь!
#openbio_pandas
BY Машинное обучение в биологии и биомедицине | OpenBio.Edu
Share with your friend now:
tgoop.com/eduopenbio/28