Notice: file_put_contents(): Write of 22624 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50
Machinelearning@ai_machinelearning_big_data P.7299
AI_MACHINELEARNING_BIG_DATA Telegram 7299
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 UNO — новый подход к генерации изображений по нескольким референсам от Bytedance

Новый Flux метод, который позволяет переносить и сохранять объекты с одного или нескольких референс изображений.

UNO
способна взять несколько разных объектов или персонажей (их фотографии) и собрать их вместе на одном сгенерированном изображении – все объекты сохраняют свою индивидуальность и детали​

Популярные методы генерации в основном заточены под одного героя, но UNO ломает этот барьер, решая сразу две ключевые проблемы: масштабируемость данных и ограниченность одним субъектом​

Внутри:
🔁 В UNO внедрён специальный механизм позиционных эмбеддингов – Universal Rotary Position Embedding, или по-другому универсальное позиционное кодирование. Зачем это нужно?
Когда модель работает сразу с несколькими визуальными объектами, есть риск перепутать их свойства или положение (так называемая attribute confusion – «путаница атрибутов»). URPE решает эту проблему: оно помогает модели понимать, где какой объект находится и какие черты ему принадлежат, даже если объектов несколько​

Гибкость в разрешениях и форматах. Ещё одна крутая особенность UNO – умение генерировать изображения разного размера и соотношения сторон. Модель обучалась на данных нескольких масштабов, поэтому уверенно чувствует себя и в квадратном формате 512×512, и в нестандартных разрешениях вплоть до 704 пикселей

🔥 Высокая согласованность:
Модель отлично справляется с генерацией персонажей и объектов, сохраняя ключевые особенности сцены — без разрыва между кадрами.

✔️ Проект выложен в open-source:
– Код под Apache 2.0
– Модели под CC BY-NC 4.0
– Поддерживается только некоммерческое использование

🟡 GitHub: https://github.com/bytedance/UNO
🟡Demo: https://huggingface.co/spaces/bytedance-research/UNO-FLUX
🟡 Paper: https://arxiv.org/abs/2504.02160
🟡HF: https://huggingface.co/bytedance-research/UNO

#ByteDance #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍5513🔥10🥱1💘1



tgoop.com/ai_machinelearning_big_data/7299
Create:
Last Update:

🌟 UNO — новый подход к генерации изображений по нескольким референсам от Bytedance

Новый Flux метод, который позволяет переносить и сохранять объекты с одного или нескольких референс изображений.

UNO
способна взять несколько разных объектов или персонажей (их фотографии) и собрать их вместе на одном сгенерированном изображении – все объекты сохраняют свою индивидуальность и детали​

Популярные методы генерации в основном заточены под одного героя, но UNO ломает этот барьер, решая сразу две ключевые проблемы: масштабируемость данных и ограниченность одним субъектом​

Внутри:
🔁 В UNO внедрён специальный механизм позиционных эмбеддингов – Universal Rotary Position Embedding, или по-другому универсальное позиционное кодирование. Зачем это нужно?
Когда модель работает сразу с несколькими визуальными объектами, есть риск перепутать их свойства или положение (так называемая attribute confusion – «путаница атрибутов»). URPE решает эту проблему: оно помогает модели понимать, где какой объект находится и какие черты ему принадлежат, даже если объектов несколько​

Гибкость в разрешениях и форматах. Ещё одна крутая особенность UNO – умение генерировать изображения разного размера и соотношения сторон. Модель обучалась на данных нескольких масштабов, поэтому уверенно чувствует себя и в квадратном формате 512×512, и в нестандартных разрешениях вплоть до 704 пикселей

🔥 Высокая согласованность:
Модель отлично справляется с генерацией персонажей и объектов, сохраняя ключевые особенности сцены — без разрыва между кадрами.

✔️ Проект выложен в open-source:
– Код под Apache 2.0
– Модели под CC BY-NC 4.0
– Поддерживается только некоммерческое использование

🟡 GitHub: https://github.com/bytedance/UNO
🟡Demo: https://huggingface.co/spaces/bytedance-research/UNO-FLUX
🟡 Paper: https://arxiv.org/abs/2504.02160
🟡HF: https://huggingface.co/bytedance-research/UNO

#ByteDance #opensource

BY Machinelearning


Share with your friend now:
tgoop.com/ai_machinelearning_big_data/7299

View MORE
Open in Telegram


Telegram News

Date: |

Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day. Select: Settings – Manage Channel – Administrators – Add administrator. From your list of subscribers, select the correct user. A new window will appear on the screen. Check the rights you’re willing to give to your administrator. Informative Image: Telegram. “Hey degen, are you stressed? Just let it all out,” he wrote, along with a link to join the group.
from us


Telegram Machinelearning
FROM American