Telegram Web
SuperDec: 3D Scene Decomposition with Superquadric Primitives

Компактное представление 3D-сцен с использованием суперквадрических примитивов, разработано при участии Microsoft.

Вместо миллионов гауссиан — сотни примитивов

Модель умеет эффективно раскладывать облака точек объектов на набор суперквадрик, что позволяет получать выразительное, но при этом компактное представление 3D-сцен.

При том еще выполняет неконтролируемую сегментацию частей объектов, выделяя чёткие маски сегментов и группирует объекты по геометрической структуре без аннотаций.

— применимо в робототехнике для планирования пути и захвата объектов

— применимо для контроля генерации и редактирования изображений диффузными моделями, может создавать управляющие сцены

Гитхаб

#video2scene #segmentation3d
👍101🔥1
VEO 3.1 уже доступен в Flow

Есть fast и Quality. генерирует в 720p, предлагает апскейл до 1080p

И тоже не умеет делать лунную походку ((

Но саундтрек прикольный

Спасибо за наводку @m_franz

#image2video #text2video #neuranaut_art
👍7
Демо VEO 3.1 Fast на HuggingFace

Дитя вайбкодинга. Если страница тупит при авторизации, пробуем другой браузер

Выставлять 1080p бесполезно - все равно делает 720p

На бесплатном аккаунте быстро сотворило 5 сек 720p

Потом 10 сек 720p. Что за щедрость такая!

#image2video #text2video
👍9
Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation

Сегментация 3D-объектов с открытым словарём.

На вход принимает RGBD или 3D сцены

Модель из 2024 года, но держит #SOTA на наборах данных ScanNet200 и Replica.

Hаботает в 16 раз быстрее, чем лучшие существующие методы

Использует только 2D-обнаружение объектов на многовидовых RGB-изображениях, без необходимости применять ресурсоёмкие 2D базовые модели вроде Segment Anything (SAM) и CLIP

Код

#segmentation #segmentation3d
🔥5
Wan2.2-I2V-A14B-Moe-Distill-Lightx2v

На днях вышла какая-то непонятная обновка Distill-Lightx2v лоры, без описания. Вернее с описанием о от обычной Distill-Lightx2v

Люди советуют пользоваться версией Kijai

Обсуждение на реддит

Спасибо @rekonkast

#wan22 #lora
👍7
Rex-Omni: Detect Anything via Next Point Prediction

Детектор объектов на изображении на базе Based on Qwen2.5-VL-3B

Помимо прочих обычнх задач детектора определяет ключевые точки (например, 17 суставов у людей и животных), создавая структурированные представления поз.

Гитхаб
HF
Демо

#detection #vlm
👍6🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Появился телеграм-бот, где уже доступен Veo 3.1

Что умеет:
✱ генерация по тексту или текст + картинка;
✱ форматы: 9:16 для шортсов и горизонтальный 16:9;
✱ на старте 1 бесплатная генерация! далее от 49р/шт

#промо
1👍6🥴4😁3🔥2🤷‍♂1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI SeC Nodes

Кастом ноды июльского сегментатора SeC

Новые веса модели - удобно как мы любим, в одном фале. Есть fp16, fp8, bf16, fp32

Туториал от ArtOficial
воркфлоу

#workflow #tutorial #segmentation #video2mask
🔥8👍6
MegaSaM: Accurate, Fast and Robust Structure and Motion from Casual Dynamic Videos

Точная быстрая реконструкция параметров камеры и карт глубины по обычным видеозаписям динамичных сцен. Проект при участии Google Research.

Обрабатывает видео с частотой примерно 0,7 кадра в секунду (на Nvidia A100)

На сайте есть интерактивная галерея результатов

Код

#segmentation
👍4
TrackVLA++: Unleashing Reasoning and Memory Capabilities in VLA Models for Embodied Visual Tracking

Отслеживание объектов на видео.
Когда эту штуку выложат в опенсорс, ее загрузят роботам в мозги чтобы они более лучше нас преследовали

#tracking #research
😁42😱2
Qwen-Image-Edit-Rapid-AIO обновился

Добавили v4 и v5

v4: Сочетание множества редакторов Qwen Edit и базовых ускорителей Qwen, которые, как мне кажется, дают лучшие результаты. Добавлена небольшая коррекция кожи LORA. 4-5 шагов: используйте sa_solver/simple, lcm/beta или euler_a/beta и 6-8 шагов: используйте только lcm/beta или euler_a/beta.

v5: Варианты использования NSFW и SFWW слишком сильно мешали друг другу, поэтому я разделил их, чтобы специализироваться на их вариантах использования. В версии 5 были значительно изменены настройки NSFW LoRa, а также некоторые настройки ускорителя. обычно рекомендуется использовать lcm/beta или er_sde/beta. Пожалуйста, поэкспериментируйте! Хотите получить реалистичный и/или "откровенный" вид без использования входных изображений? Попробуйте lcm/ddim_uniform с моделью NSFW!


#optimization #imageediting #workflow #nsfw
👍11👎1
⚡️ Временный доступ на 24 часа к папке «AI & TECH» открыт!

Вся полезная информация о заработке на ИИ, технологиях в одном папке:

✦ Как жить в мире, где ИИ не заметен, но незаменим?
✦ Готовые схемы автоматизации заявок с помощью ИИ-менеджеров по продажам.
✦ Промпты с невероятным результатом, которые можно продавать по 30.000₽.

Подписывайтесь и прокачивайте свои навыки прямо сейчас с помощью папки c экспертами «AI & TECH»!

ПОДПИСАТЬСЯ

#промо
👎10🥴5😁3🤷‍♂1
#humor из нашего чатика утащил
112😁10👍2
2025/10/17 01:31:04
Back to Top
HTML Embed Code: