Машиннное обучение | Наука о данных Библиотека@machinelearning

Машиннное обучение | Наука о данных Библиотека

✔️

AR-GRPO — новый подход к улучшению авторегрессионных моделей генерации изображений с помощью RL

Исследователи представили AR-GRPO, метод интеграции обучения с подкреплением (online RL) в авторегрессионные (AR) модели генерации изображений.
Он адаптирует алгоритм Group Relative Policy Optimization (GRPO), чтобы дообучать обычные AR-модели с учётом специально разработанных функций вознаграждения.

Эти функции оценивают сгенерированные изображения сразу по нескольким параметрам качества:

- Визуальная привлекательность (perceptual quality)
- Реалистичность (realism)
- Семантическое соответствие запросу (semantic fidelity)

В результате модель учится выдавать не только красивые, но и реалистичные картинки, точно отражающие смысл входного описания.

https://arxiv.org/abs/2508.06924

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍2🔥2

www.tgoop.com/machinelearning_books/1124

1.61K viewsAug 13 at 12:03

tgoop.com/machinelearning_books/1124

Create: 2025-08-13
Last Update: 2025-10-28 07:37:07

✔️ AR-GRPO — новый подход к улучшению авторегрессионных моделей генерации изображений с помощью RL

Исследователи представили AR-GRPO, метод интеграции обучения с подкреплением (online RL) в авторегрессионные (AR) модели генерации изображений.
Он адаптирует алгоритм Group Relative Policy Optimization (GRPO), чтобы дообучать обычные AR-модели с учётом специально разработанных функций вознаграждения.

Эти функции оценивают сгенерированные изображения сразу по нескольким параметрам качества:

- Визуальная привлекательность (perceptual quality)
- Реалистичность (realism)
- Семантическое соответствие запросу (semantic fidelity)

В результате модель учится выдавать не только красивые, но и реалистичные картинки, точно отражающие смысл входного описания.

https://arxiv.org/abs/2508.06924

Telegram News

✔️ AR-GRPO — новый подход к улучшению авторегрессионных моделей генерации изображений с помощью RL