tgoop.com/proglib_academy/2893
Last Update:
Чек-лист: как структурировать Data Science проект
Короче, вот вам такой чек-лист, его сохранили наши ДСеры, пользуйтесь — бесплатно:
📁 data-science-project/
├── 📁 data/
│ ├── 📁 raw/
│ ├── 📁 processed/
│ └── 📁 external/
├── 📁 notebooks/
│ ├── 📄explore_data.ipynb
│ ├── 📄 …
│ ├── 📄 traine.ipynb
│ └── 📄 evaluate.ipynb
├── 📁 src/
│ ├── 📁 data/
│ │ ├── 📄 load_data.py
│ │ ├── 📄 process_data.py
│ │ └── 📄 split_data.py
│ ├── 📁 features/
│ │ └── 📄select_feature.py
│ ├── 📁 models/
│ │ ├── 📄 train.py
│ │ ├── 📄 predict.py
│ │ └── 📄 evaluate.py
│ ├── 📁 visualizations/
│ │ └── 📄 plot_results.py
├── 📁 tests/
│ ├── 📄 test_models.py
│ └── 📄 test_visualise.py
├── 📁 reports/
│ ├── 📁 figures/
│ └── 📄 report.md
├── 📁 docs/
│ └── 📄 README.md
├── 📄 requirements.txt
├── 📄 .gitignore
└── 📄 LICENSE
Пояснение основных директорий:
1️⃣ data/: Хранит данные на разных этапах (необработанные, обработанные, внешние).
2️⃣ notebooks/: Ноутбуки для пошагового эксперимента (например, исследование данных, создание признаков).
3️⃣ src/: Python скрипты для модульных операций:
• data/: Загрузка, очистка и разделение данных.
• features/: Создание и отбор признаков.
• models/: Обучение модели, предсказания и оценка.
• visualizations/: Генерация графиков и визуальных выводов.
4️⃣ tests/: Юнит-тесты для проверки работы скриптов и пайплайнов.
5️⃣ reports/: Финальные отчёты, графики и визуализации.
6️⃣ docs/: Документация проекта и README.
❤️ — ставьте лайк если годно)
Proglib Academy #оффер_мечты