Нейронавт | Нейросети в творчестве

SuperDec: 3D Scene Decomposition with Superquadric Primitives

Компактное представление 3D-сцен с использованием суперквадрических примитивов, разработано при участии Microsoft.

Вместо миллионов гауссиан — сотни примитивов

Модель умеет эффективно раскладывать облака точек объектов на набор суперквадрик, что позволяет получать выразительное, но при этом компактное представление 3D-сцен.

При том еще выполняет неконтролируемую сегментацию частей объектов, выделяя чёткие маски сегментов и группирует объекты по геометрической структуре без аннотаций.

— применимо в робототехнике для планирования пути и захвата объектов

— применимо для контроля генерации и редактирования изображений диффузными моделями, может создавать управляющие сцены

Гитхаб

#video2scene #segmentation3d

👍10❤1🔥1

1.53K views14:17

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

VEO 3.1 уже доступен в Flow

Есть fast и Quality. генерирует в 720p, предлагает апскейл до 1080p

И тоже не умеет делать лунную походку ((

Но саундтрек прикольный

Спасибо за наводку @m_franz

#image2video #text2video #neuranaut_art

👍7

1.31K views15:11

Нейронавт | Нейросети в творчестве

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Демо VEO 3.1 Fast на HuggingFace

Дитя вайбкодинга. Если страница тупит при авторизации, пробуем другой браузер

Выставлять 1080p бесполезно - все равно делает 720p

На бесплатном аккаунте быстро сотворило 5 сек 720p

Потом 10 сек 720p. Что за щедрость такая!

#image2video #text2video

👍9

1.57K views17:06

Нейронавт | Нейросети в творчестве

Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation

Сегментация 3D-объектов с открытым словарём.

На вход принимает RGBD или 3D сцены

Модель из 2024 года, но держит #SOTA на наборах данных ScanNet200 и Replica.

Hаботает в 16 раз быстрее, чем лучшие существующие методы

Использует только 2D-обнаружение объектов на многовидовых RGB-изображениях, без необходимости применять ресурсоёмкие 2D базовые модели вроде Segment Anything (SAM) и CLIP

Код

#segmentation #segmentation3d

🔥5

1.2K views05:08

Нейронавт | Нейросети в творчестве

Wan2.2-I2V-A14B-Moe-Distill-Lightx2v

На днях вышла какая-то непонятная обновка Distill-Lightx2v лоры, без описания. Вернее с описанием о от обычной Distill-Lightx2v

Люди советуют пользоваться версией Kijai

Обсуждение на реддит

Спасибо @rekonkast

#wan22 #lora

huggingface.co

lightx2v/Wan2.2-I2V-A14B-Moe-Distill-Lightx2v · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍7

1.17K views06:09

Нейронавт | Нейросети в творчестве

Rex-Omni: Detect Anything via Next Point Prediction

Детектор объектов на изображении на базе Based on Qwen2.5-VL-3B

Помимо прочих обычнх задач детектора определяет ключевые точки (например, 17 суставов у людей и животных), создавая структурированные представления поз.

Гитхаб
HF
Демо

#detection #vlm

👍6🔥2

1.34K views07:11

Нейронавт | Нейросети в творчестве

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Появился телеграм-бот, где уже доступен Veo 3.1

Что умеет:
✱ генерация по тексту или текст + картинка;
✱ форматы: 9:16 для шортсов и горизонтальный 16:9;
✱ на старте 1 бесплатная генерация! далее от 49р/шт

#промо

1👍6🥴4😁3🔥2🤷‍♂1

1.1K viewsedited 09:07

Veo3MegaBot

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ComfyUI SeC Nodes

Кастом ноды июльского сегментатора SeC

Новые веса модели - удобно как мы любим, в одном фале. Есть fp16, fp8, bf16, fp32

Туториал от ArtOficial
воркфлоу

#workflow #tutorial #segmentation #video2mask

🔥8👍6

1.23K views11:14

Нейронавт | Нейросети в творчестве

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

MegaSaM: Accurate, Fast and Robust Structure and Motion from Casual Dynamic Videos

Точная быстрая реконструкция параметров камеры и карт глубины по обычным видеозаписям динамичных сцен. Проект при участии Google Research.

Обрабатывает видео с частотой примерно 0,7 кадра в секунду (на Nvidia A100)

На сайте есть интерактивная галерея результатов

Код

#segmentation

👍4

999 views12:16

Нейронавт | Нейросети в творчестве

TrackVLA++: Unleashing Reasoning and Memory Capabilities in VLA Models for Embodied Visual Tracking

Отслеживание объектов на видео.
Когда эту штуку выложат в опенсорс, ее загрузят роботам в мозги чтобы они более лучше нас преследовали

#tracking #research

😁4❤2😱2

1.01K views13:16

Нейронавт | Нейросети в творчестве

Qwen-Image-Edit-Rapid-AIO обновился

Добавили v4 и v5

v4: Сочетание множества редакторов Qwen Edit и базовых ускорителей Qwen, которые, как мне кажется, дают лучшие результаты. Добавлена небольшая коррекция кожи LORA. 4-5 шагов: используйте sa_solver/simple, lcm/beta или euler_a/beta и 6-8 шагов: используйте только lcm/beta или euler_a/beta.

v5: Варианты использования NSFW и SFWW слишком сильно мешали друг другу, поэтому я разделил их, чтобы специализироваться на их вариантах использования. В версии 5 были значительно изменены настройки NSFW LoRa, а также некоторые настройки ускорителя. обычно рекомендуется использовать lcm/beta или er_sde/beta. Пожалуйста, поэкспериментируйте! Хотите получить реалистичный и/или "откровенный" вид без использования входных изображений? Попробуйте lcm/ddim_uniform с моделью NSFW!

#optimization #imageediting #workflow #nsfw

Нейронавт | Нейросети в творчестве

Qwen-Image-Edit-Rapid-AIO

Мердж ускорителей, VAE и CLIP #QIE для быстрого редактирования изображений. Если использовать без входных изображений, будет просто создавать изображения по тексту.

Три версии по 29 ГБ каждая

V1: Qwen-Image-Edit-2509 и 4-step…

👍11👎1

1.13K views14:17

Нейронавт | Нейросети в творчестве

⚡️ Временный доступ на 24 часа к папке «AI & TECH» открыт!

Вся полезная информация о заработке на ИИ, технологиях в одном папке:

✦ Как жить в мире, где ИИ не заметен, но незаменим?
✦ Готовые схемы автоматизации заявок с помощью ИИ-менеджеров по продажам.
✦ Промпты с невероятным результатом, которые можно продавать по 30.000₽.

Подписывайтесь и прокачивайте свои навыки прямо сейчас с помощью папки c экспертами «AI & TECH»!

ПОДПИСАТЬСЯ

#промо

👎10🥴5😁3🤷‍♂1

948 views15:06

Нейронавт | Нейросети в творчестве

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

VEO 3.1 завезли в API ноды ComfyUI

А в Google Flow появилась функция редактирования видео.

#news #text2video #image2video #videoediting

🔥10👎1

928 views16:12

Нейронавт | Нейросети в творчестве

#humor из нашего чатика утащил

1❤12😁10👍2

751 views17:21

2025/10/17 01:31:04
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>