tgoop.com/yet_another_mle/23
Last Update:
Я считаю, что чтение чужого кода - это полезная практика. Так можно узнать другие подходы, подсмотреть что-то хорошее (ну и плохое тоже).
Наткнулся на пару (1, 2) шаблонов для датасаенс проекта.
Они построены вокруг менеджера конфигов hydra и фреймворка для экспериментов pytorch-lightning.
Гидра по идее позволяет красиво решить ситуацию, когда под каждый тип объекта у вас специфичные параметры (например, разные параметры для шедулеров или оптимизаторов). Пробовал её когда-то давно. Не прижилась, но уже не помню почему. Вообще выглядит красиво, когда конфиги разбиты по папкам и лежат в одном месте. Кажется, что гидра в проекте будет способствовать порядку в коде. Каждую модель/оптимизатор/шедулер вы будете класть в отдельное место, а трейнулпы будут унифицированы. Осталось понять, не будет ли эта красота мешать непосредственно вкручивать разнообразные твики 🌝
Лайтнинг же призван облегчить вам жизнь за счет того, что рыба трейнлупа со всякими свистелками в виде distributed learning/mixed precision/подсчета метрик уже реализована за вас. Два года назад решили использовать на работе в проекте. Не понравилось тогда. Было сыро, много мучались с тем, что и в каком формате надо откуда отдать, чтобы передать дальше. Сейчас же слышал лестные отзывы о нем. Думаю, что стоит внимания.
Что сказать, время идет, и фреймворки крепчают. Радует, что их не забросили и активно развивают.
BY Записки MLEшника
Share with your friend now:
tgoop.com/yet_another_mle/23