tgoop.com/hse_cs_opensource/66
Last Update:
rtdl-num-embeddings
Библиотека на python, позволяющая получать эмбеддинги для непрерывных признаков в задачах для табличных данных. Используемые вместо скалярных признаков эмбеддинги улучшают итоговое качество моделей на специфических задачах, при этом не увеличивая вычислительную сложность. В своей работе авторы представляют несколько алгоритмов получения эбмеддингов, а в экспериментальной части показывают состоятельность метода. В частности, сравнивая DL-алгоритмы с классическими подходами, такими как GBDT, на задачах, заточенных под последние. В таком режиме DL методы без использования эмебеддингов уступают классическим, а при использовании обходят их. Библиотека может быть полезна DS-специалистам, дата аналитикам и ML-инженерам.
статья | код
BY Открытый код ФКН ВШЭ

Share with your friend now:
tgoop.com/hse_cs_opensource/66