Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Видеоагент(!!!) от Минимакс.
Минимакс, что ты делаешь, прекрати.
И да, это видеоагент, который не только генерит по промпту, а берет на вход идею и наброски, а дальше сам пишет сценарий, генерит и монтирует.
Первый этап уже в бете:
Этап 1: Готовые шаблоны видео-агентов для высококачественных креативных видеороликов. Пользователи просто следуют инструкциям и вводят промпты или изображения — одним щелчком мыши создается готовое видео. Ключевое тут - Шаблоны.
В середине лета(?) будет выпущен:
Этап 2: Полунастраиваемый видеоагент. Пользователи получают возможность редактировать любую часть процесса создания видео: от сценария до визуальных эффектов и закадрового голоса.
Далее:
Этап 3: Полностью автономный, сквозной видеоагент. Полный, интеллектуальный рабочий процесс, который превращает творческую идею в финальное видео с минимальными ручными усилиями.
Этап 1 уже в бете, посмотрите образцы шаблонов вот тут:
https://x.com/MiniMax__AI/status/1935995043430691159
(да, на твитторе можно писать целые статьи)
Что еще известно:
Отход от традиционных рабочих процессов на основе узлов(nodes). Вместо использования жестких цепочек инструментов мы используем вызов инструментов на базе LLM, что позволяет пользователям создавать полноценные видео просто с помощью описаний на естественном языке.
Полный набор инструментов для создания видео. От идеи, поиска ресурсов, раскадровки, монтажа до озвучивания — мы отобрали лучшие инструменты для каждого шага и позволили агенту самостоятельно вызывать их на нужном этапе процесса. Это обеспечивает как гибкость, так и профессиональное качество в каждом коротком видео.
Визуализированные рассуждения и рабочий процесс агента. Пользователи могут просматривать пошаговый мыслительный процесс агента в реальном времени, заглядывая в творческую логику и предлагая интуитивные точки входа для пользовательских правок и тонкой настройки.
Нейромонтаж все ближе!!!
@cgevent
Минимакс, что ты делаешь, прекрати.
И да, это видеоагент, который не только генерит по промпту, а берет на вход идею и наброски, а дальше сам пишет сценарий, генерит и монтирует.
Первый этап уже в бете:
Этап 1: Готовые шаблоны видео-агентов для высококачественных креативных видеороликов. Пользователи просто следуют инструкциям и вводят промпты или изображения — одним щелчком мыши создается готовое видео. Ключевое тут - Шаблоны.
В середине лета(?) будет выпущен:
Этап 2: Полунастраиваемый видеоагент. Пользователи получают возможность редактировать любую часть процесса создания видео: от сценария до визуальных эффектов и закадрового голоса.
Далее:
Этап 3: Полностью автономный, сквозной видеоагент. Полный, интеллектуальный рабочий процесс, который превращает творческую идею в финальное видео с минимальными ручными усилиями.
Этап 1 уже в бете, посмотрите образцы шаблонов вот тут:
https://x.com/MiniMax__AI/status/1935995043430691159
(да, на твитторе можно писать целые статьи)
Что еще известно:
Отход от традиционных рабочих процессов на основе узлов(nodes). Вместо использования жестких цепочек инструментов мы используем вызов инструментов на базе LLM, что позволяет пользователям создавать полноценные видео просто с помощью описаний на естественном языке.
Полный набор инструментов для создания видео. От идеи, поиска ресурсов, раскадровки, монтажа до озвучивания — мы отобрали лучшие инструменты для каждого шага и позволили агенту самостоятельно вызывать их на нужном этапе процесса. Это обеспечивает как гибкость, так и профессиональное качество в каждом коротком видео.
Визуализированные рассуждения и рабочий процесс агента. Пользователи могут просматривать пошаговый мыслительный процесс агента в реальном времени, заглядывая в творческую логику и предлагая интуитивные точки входа для пользовательских правок и тонкой настройки.
Нейромонтаж все ближе!!!
@cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
Embodied Web Agents
Веб агент во плоти
Способен взаимодействовать с физическим миром и одновременно использовать информацию из интернета. Это нужно для решения задач, которые требуют знаний и оцифрованных данных, например, приготовление по онлайн-рецептам или навигация с использованием динамических карт
Код
#agent #robot
Веб агент во плоти
Способен взаимодействовать с физическим миром и одновременно использовать информацию из интернета. Это нужно для решения задач, которые требуют знаний и оцифрованных данных, например, приготовление по онлайн-рецептам или навигация с использованием динамических карт
Код
#agent #robot
ImmerseGen: Agent-Guided Immersive World Generation with Alpha-Textured Proxies
Разработка ByteDance.
Создаёт 3D-миры по текстовым описаниям для виртуальной реальности. Сначала формируется базовая местность, а затем добавляются объекты.
Под капотом агенты, работающие на основе визуальных языковых моделей
Код ждем
#VR #vlm #text2scene #text2world
Разработка ByteDance.
Создаёт 3D-миры по текстовым описаниям для виртуальной реальности. Сначала формируется базовая местность, а затем добавляются объекты.
Под капотом агенты, работающие на основе визуальных языковых моделей
Код ждем
#VR #vlm #text2scene #text2world
Please open Telegram to view this post
VIEW IN TELEGRAM
ComfyUI-SeedVR2_VideoUpscaler
Разводите видеореставратор от ByteDance локально если хвалит VRAM
#videorestoration
Разводите видеореставратор от ByteDance локально если хвалит VRAM
#videorestoration
Spline Path Control v2
Контроль движения сплайнами без лишнего промпинга.
Полученное движение предлагают использовать как управляющее видео для VACE
Народное творчество, сделано в DeepSeek + Google Gemini, пользуйтесь пока не сломалось и пока автор не разорился
Код
Попробовать онлайн
воркфлоу
#workflow #motioncontrol #image2video
Контроль движения сплайнами без лишнего промпинга.
Полученное движение предлагают использовать как управляющее видео для VACE
Народное творчество, сделано в DeepSeek + Google Gemini, пользуйтесь пока не сломалось и пока автор не разорился
Код
Попробовать онлайн
воркфлоу
#workflow #motioncontrol #image2video
Один день не следил за нейронками, потом заходишь в интернет, а там:
тренд на олимпийские игры животных в Hailuo 2
тренд на олимпийские игры животных в Hailuo 2
Media is too big
VIEW IN TELEGRAM
Virtual Community: An Open World for Humans, Robots, and Society
Cоздание интерактивных и масштабируемых симуляций открытых миров, где используются реальные географические данные и компьютерные модели для имитации жизни людей и роботов.
Давайте думать, подсказывайте каксделать-то по красоте это можно использовать?
Код
#world #robot #simulation #interacton #HRI
Cоздание интерактивных и масштабируемых симуляций открытых миров, где используются реальные географические данные и компьютерные модели для имитации жизни людей и роботов.
Давайте думать, подсказывайте как
Код
#world #robot #simulation #interacton #HRI