Открытый код ФКН ВШЭ@hse_cs

Открытый код ФКН ВШЭ

DVAR

В репозитории опубликован код для воспроизведения результатов работы по ускорению персонализации text-to-image моделей при помощи нового критерия ранней остановки обучения. Авторы анализируют динамику тренировки популярных методов кастомизации, таких как Textual Inversion, DreamBooth и Custom Diffusion, и показывают, что стандартные метрики сходимости не отражают реальный прогресс и часто неинформативны. Ключевой вклад работы — введение критерия Deterministic VARiance Evaluation (DVAR), который позволяет автоматически и гораздо раньше завершать обучение без потери качества результатов. DVAR оценивает стабилизацию детерминированной версии loss на фиксированном наборе данных, что позволяет сократить время обучения до 8 раз. Авторы демонстрируют эффективность подхода на 48 концептах и трёх популярных personalization-методах. Эксперименты показывают, что ранняя остановка по DVAR почти не снижает качество генерации, а также предотвращает переобучение и экономит вычислительные ресурсы. Работа будет полезна исследователям и инженерам, работающим с кастомизацией diffusion-моделей, а также разработчикам инструментов для креативных и промышленных задач генерации изображений.

статья | код

GitHub

GitHub - yandex-research/DVAR: Official implementation of "Is This Loss Informative? Faster Text-to-Image Customization by Tracking…

Official implementation of "Is This Loss Informative? Faster Text-to-Image Customization by Tracking Objective Dynamics" (NeurIPS 2023) - yandex-research/DVAR

❤‍🔥6😍3🔥2❤1

www.tgoop.com/hse_cs_opensource/106

481 viewsJun 27 at 09:00

tgoop.com/hse_cs_opensource/106

Create: 2025-06-27
Last Update: 2025-07-25 07:50:30

BY Открытый код ФКН ВШЭ

Share with your friend now:
tgoop.com/hse_cs_opensource/106

Telegram News

DVAR