SuperDec: 3D Scene Decomposition with Superquadric Primitives
Компактное представление 3D-сцен с использованием суперквадрических примитивов, разработано при участии Microsoft.
Вместо миллионов гауссиан — сотни примитивов
Модель умеет эффективно раскладывать облака точек объектов на набор суперквадрик, что позволяет получать выразительное, но при этом компактное представление 3D-сцен.
При том еще выполняет неконтролируемую сегментацию частей объектов, выделяя чёткие маски сегментов и группирует объекты по геометрической структуре без аннотаций.
— применимо в робототехнике для планирования пути и захвата объектов
— применимо для контроля генерации и редактирования изображений диффузными моделями, может создавать управляющие сцены
Гитхаб
#video2scene #segmentation3d
Компактное представление 3D-сцен с использованием суперквадрических примитивов, разработано при участии Microsoft.
Вместо миллионов гауссиан — сотни примитивов
Модель умеет эффективно раскладывать облака точек объектов на набор суперквадрик, что позволяет получать выразительное, но при этом компактное представление 3D-сцен.
При том еще выполняет неконтролируемую сегментацию частей объектов, выделяя чёткие маски сегментов и группирует объекты по геометрической структуре без аннотаций.
— применимо в робототехнике для планирования пути и захвата объектов
— применимо для контроля генерации и редактирования изображений диффузными моделями, может создавать управляющие сцены
Гитхаб
#video2scene #segmentation3d
👍10❤1🔥1
VEO 3.1 уже доступен в Flow
Есть fast и Quality. генерирует в 720p, предлагает апскейл до 1080p
И тоже не умеет делать лунную походку ((
Но саундтрек прикольный
Спасибо за наводку @m_franz
#image2video #text2video #neuranaut_art
Есть fast и Quality. генерирует в 720p, предлагает апскейл до 1080p
И тоже не умеет делать лунную походку ((
Но саундтрек прикольный
Спасибо за наводку @m_franz
#image2video #text2video #neuranaut_art
👍7
Демо VEO 3.1 Fast на HuggingFace
Дитя вайбкодинга. Если страница тупит при авторизации, пробуем другой браузер
Выставлять 1080p бесполезно - все равно делает 720p
На бесплатном аккаунте быстро сотворило 5 сек 720p
Потом 10 сек 720p. Что за щедрость такая!
#image2video #text2video
Дитя вайбкодинга. Если страница тупит при авторизации, пробуем другой браузер
Выставлять 1080p бесполезно - все равно делает 720p
На бесплатном аккаунте быстро сотворило 5 сек 720p
Потом 10 сек 720p. Что за щедрость такая!
#image2video #text2video
👍9
Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation
Сегментация 3D-объектов с открытым словарём.
На вход принимает RGBD или 3D сцены
Модель из 2024 года, но держит #SOTA на наборах данных ScanNet200 и Replica.
Hаботает в 16 раз быстрее, чем лучшие существующие методы
Использует только 2D-обнаружение объектов на многовидовых RGB-изображениях, без необходимости применять ресурсоёмкие 2D базовые модели вроде Segment Anything (SAM) и CLIP
Код
#segmentation #segmentation3d
Сегментация 3D-объектов с открытым словарём.
На вход принимает RGBD или 3D сцены
Модель из 2024 года, но держит #SOTA на наборах данных ScanNet200 и Replica.
Hаботает в 16 раз быстрее, чем лучшие существующие методы
Использует только 2D-обнаружение объектов на многовидовых RGB-изображениях, без необходимости применять ресурсоёмкие 2D базовые модели вроде Segment Anything (SAM) и CLIP
Код
#segmentation #segmentation3d
🔥5
Wan2.2-I2V-A14B-Moe-Distill-Lightx2v
На днях вышла какая-то непонятная обновка Distill-Lightx2v лоры, без описания. Вернее с описанием о от обычной Distill-Lightx2v
Люди советуют пользоваться версией Kijai
Обсуждение на реддит
Спасибо @rekonkast
#wan22 #lora
На днях вышла какая-то непонятная обновка Distill-Lightx2v лоры, без описания. Вернее с описанием о от обычной Distill-Lightx2v
Люди советуют пользоваться версией Kijai
Обсуждение на реддит
Спасибо @rekonkast
#wan22 #lora
huggingface.co
lightx2v/Wan2.2-I2V-A14B-Moe-Distill-Lightx2v · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍7
Rex-Omni: Detect Anything via Next Point Prediction
Детектор объектов на изображении на базе Based on Qwen2.5-VL-3B
Помимо прочих обычнх задач детектора определяет ключевые точки (например, 17 суставов у людей и животных), создавая структурированные представления поз.
Гитхаб
HF
Демо
#detection #vlm
Детектор объектов на изображении на базе Based on Qwen2.5-VL-3B
Помимо прочих обычнх задач детектора определяет ключевые точки (например, 17 суставов у людей и животных), создавая структурированные представления поз.
Гитхаб
HF
Демо
#detection #vlm
👍6🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Появился телеграм-бот, где уже доступен Veo 3.1
Что умеет:
✱ генерация по тексту или текст + картинка;
✱ форматы: 9:16 для шортсов и горизонтальный 16:9;
✱ на старте 1 бесплатная генерация! далее от 49р/шт
#промо
Что умеет:
✱ генерация по тексту или текст + картинка;
✱ форматы: 9:16 для шортсов и горизонтальный 16:9;
✱ на старте 1 бесплатная генерация! далее от 49р/шт
#промо
1👍6🥴4😁3🔥2🤷♂1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI SeC Nodes
Кастом ноды июльского сегментатора SeC
Новые веса модели - удобно как мы любим, в одном фале. Есть fp16, fp8, bf16, fp32
Туториал от ArtOficial
воркфлоу
#workflow #tutorial #segmentation #video2mask
Кастом ноды июльского сегментатора SeC
Новые веса модели - удобно как мы любим, в одном фале. Есть fp16, fp8, bf16, fp32
Туториал от ArtOficial
воркфлоу
#workflow #tutorial #segmentation #video2mask
🔥8👍6
MegaSaM: Accurate, Fast and Robust Structure and Motion from Casual Dynamic Videos
Точная быстрая реконструкция параметров камеры и карт глубины по обычным видеозаписям динамичных сцен. Проект при участии Google Research.
Обрабатывает видео с частотой примерно 0,7 кадра в секунду (на Nvidia A100)
На сайте есть интерактивная галерея результатов
Код
#segmentation
Точная быстрая реконструкция параметров камеры и карт глубины по обычным видеозаписям динамичных сцен. Проект при участии Google Research.
Обрабатывает видео с частотой примерно 0,7 кадра в секунду (на Nvidia A100)
На сайте есть интерактивная галерея результатов
Код
#segmentation
👍4
TrackVLA++: Unleashing Reasoning and Memory Capabilities in VLA Models for Embodied Visual Tracking
Отслеживание объектов на видео.
Когда эту штуку выложат в опенсорс, ее загрузят роботам в мозги чтобы они более лучше нас преследовали
#tracking #research
Отслеживание объектов на видео.
Когда эту штуку выложат в опенсорс, ее загрузят роботам в мозги чтобы они более лучше нас преследовали
#tracking #research
😁4❤2😱2
Qwen-Image-Edit-Rapid-AIO обновился
Добавили v4 и v5
#optimization #imageediting #workflow #nsfw
Добавили v4 и v5
v4: Сочетание множества редакторов Qwen Edit и базовых ускорителей Qwen, которые, как мне кажется, дают лучшие результаты. Добавлена небольшая коррекция кожи LORA. 4-5 шагов: используйте sa_solver/simple, lcm/beta или euler_a/beta и 6-8 шагов: используйте только lcm/beta или euler_a/beta.
v5: Варианты использования NSFW и SFWW слишком сильно мешали друг другу, поэтому я разделил их, чтобы специализироваться на их вариантах использования. В версии 5 были значительно изменены настройки NSFW LoRa, а также некоторые настройки ускорителя. обычно рекомендуется использовать lcm/beta или er_sde/beta. Пожалуйста, поэкспериментируйте! Хотите получить реалистичный и/или "откровенный" вид без использования входных изображений? Попробуйте lcm/ddim_uniform с моделью NSFW!
#optimization #imageediting #workflow #nsfw
Telegram
Нейронавт | Нейросети в творчестве
Qwen-Image-Edit-Rapid-AIO
Мердж ускорителей, VAE и CLIP #QIE для быстрого редактирования изображений. Если использовать без входных изображений, будет просто создавать изображения по тексту.
Три версии по 29 ГБ каждая
V1: Qwen-Image-Edit-2509 и 4-step…
Мердж ускорителей, VAE и CLIP #QIE для быстрого редактирования изображений. Если использовать без входных изображений, будет просто создавать изображения по тексту.
Три версии по 29 ГБ каждая
V1: Qwen-Image-Edit-2509 и 4-step…
👍11👎1
⚡️ Временный доступ на 24 часа к папке «AI & TECH» открыт!
Вся полезная информация о заработке на ИИ, технологиях в одном папке:
✦ Как жить в мире, где ИИ не заметен, но незаменим?
✦ Готовые схемы автоматизации заявок с помощью ИИ-менеджеров по продажам.
✦ Промпты с невероятным результатом, которые можно продавать по 30.000₽.
Подписывайтесь и прокачивайте свои навыки прямо сейчас с помощью папки c экспертами «AI & TECH»!
ПОДПИСАТЬСЯ
#промо
Вся полезная информация о заработке на ИИ, технологиях в одном папке:
✦ Как жить в мире, где ИИ не заметен, но незаменим?
✦ Готовые схемы автоматизации заявок с помощью ИИ-менеджеров по продажам.
✦ Промпты с невероятным результатом, которые можно продавать по 30.000₽.
Подписывайтесь и прокачивайте свои навыки прямо сейчас с помощью папки c экспертами «AI & TECH»!
ПОДПИСАТЬСЯ
#промо
👎10🥴5😁3🤷♂1
VEO 3.1 завезли в API ноды ComfyUI
А в Google Flow появилась функция редактирования видео.
#news #text2video #image2video #videoediting
А в Google Flow появилась функция редактирования видео.
#news #text2video #image2video #videoediting
🔥10👎1