Один день не следил за нейронками, потом заходишь в интернет, а там:
тренд на олимпийские игры животных в Hailuo 2
тренд на олимпийские игры животных в Hailuo 2
Media is too big
VIEW IN TELEGRAM
Virtual Community: An Open World for Humans, Robots, and Society
Cоздание интерактивных и масштабируемых симуляций открытых миров, где используются реальные географические данные и компьютерные модели для имитации жизни людей и роботов.
Давайте думать, подсказывайте каксделать-то по красоте это можно использовать?
Код
#world #robot #simulation #interacton #HRI
Cоздание интерактивных и масштабируемых симуляций открытых миров, где используются реальные географические данные и компьютерные модели для имитации жизни людей и роботов.
Давайте думать, подсказывайте как
Код
#world #robot #simulation #interacton #HRI
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
MultiTalk: Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation
Новый липсинк. Модель для создания видео с диалогами на основе аудиозаписей.
- несколько говорящих
- до 15 секунд в 480p и 720p
- контроль персонажей текстом
- генерация мультфильмов и видео с пением и другими типами речи
Код
Веса 10 Гб
ComfyUI Kijai перед отпуском сделал
Колаб на A100
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
Новый липсинк. Модель для создания видео с диалогами на основе аудиозаписей.
- несколько говорящих
- до 15 секунд в 480p и 720p
- контроль персонажей текстом
- генерация мультфильмов и видео с пением и другими типами речи
Код
Веса 10 Гб
ComfyUI Kijai перед отпуском сделал
Колаб на A100
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
This media is not supported in your browser
VIEW IN TELEGRAM
Google Magenta RT
модель создания музыки в реальном времени.
Впервые Google представили Magenta еще в 2016 году. С тех пор появился плагин к Ableton кроме всего прочего. И вот новая рилтаймовая модель
Генерирует музыку на ходу по текстовым запросам и/или аудиосэмплам
Модель основана на архитектуре MusicLM и использует блок-авторегрессию для генерации непрерывного потока музыки
Оперирует двухсекундными отрывками, поэтому из сэмпла может забрать только 2 секунды для образца стиля. Задержка 2 секунды - можно уменьшить для большей реактивности.
Собственный контекст - всего 10 секунд, поэтому не рассчитывайте на длинные музыкальные структуры.
Не умеет создавать песни, ибо на лирике не обучался.
Обещают добавить локальный запуск и кастомизацию
Код
HF
Колаб
#text2music #music2music #audio2music #musicediting #realtime #dj
модель создания музыки в реальном времени.
Впервые Google представили Magenta еще в 2016 году. С тех пор появился плагин к Ableton кроме всего прочего. И вот новая рилтаймовая модель
Генерирует музыку на ходу по текстовым запросам и/или аудиосэмплам
Модель основана на архитектуре MusicLM и использует блок-авторегрессию для генерации непрерывного потока музыки
Оперирует двухсекундными отрывками, поэтому из сэмпла может забрать только 2 секунды для образца стиля. Задержка 2 секунды - можно уменьшить для большей реактивности.
Собственный контекст - всего 10 секунд, поэтому не рассчитывайте на длинные музыкальные структуры.
Не умеет создавать песни, ибо на лирике не обучался.
Обещают добавить локальный запуск и кастомизацию
Код
HF
Колаб
#text2music #music2music #audio2music #musicediting #realtime #dj
Ты видел эти нейрофотосессии?
Красиво, как будто Vogue переспал с "Терминатором". И что-то в этом есть: стиль, вау-эффект, и ощущение, что ты безнадёжно отстала.
А если я скажу, что научиться этому можно, даже если не знаешь, что такое prompt?
Или был уже один курс, второй, оплаченные подписки GPT, Midjourney и чувство вины за всё это?
Мысль: "я не такой креативный"?
Когда ты заглянешь в канал: ИИшница | визуал и нейросети ты узнаешь:
✅ где взять идею;
✅ как сделать фотосессию, чтоб у подружек-дизайнеров пошли судороги от зависти;
✅ как и где найти первых клиентов за деньги, а не за лайки.
Аня- не богиня нейроарта и не подружка Сэма Альтмана.
Она просто научилась и теперь учит других.
Без трёхчасовых воркшопов, с понятными пошаговыми уроками и ответами на вопросы.
Удивительное дело: у тех, кто начал- получилось.
Хочешь начать? Забирай бесплатный гайд для новичка, и не говори, что тебя не звали:
👉@sokolovest
#промо
Красиво, как будто Vogue переспал с "Терминатором". И что-то в этом есть: стиль, вау-эффект, и ощущение, что ты безнадёжно отстала.
А если я скажу, что научиться этому можно, даже если не знаешь, что такое prompt?
Или был уже один курс, второй, оплаченные подписки GPT, Midjourney и чувство вины за всё это?
Мысль: "я не такой креативный"?
Когда ты заглянешь в канал: ИИшница | визуал и нейросети ты узнаешь:
✅ где взять идею;
✅ как сделать фотосессию, чтоб у подружек-дизайнеров пошли судороги от зависти;
✅ как и где найти первых клиентов за деньги, а не за лайки.
Аня- не богиня нейроарта и не подружка Сэма Альтмана.
Она просто научилась и теперь учит других.
Без трёхчасовых воркшопов, с понятными пошаговыми уроками и ответами на вопросы.
Удивительное дело: у тех, кто начал- получилось.
Хочешь начать? Забирай бесплатный гайд для новичка, и не говори, что тебя не звали:
👉@sokolovest
#промо
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin add-on for Blender
отвлечемся от потока хайлуовщины.
Deemos выпустили полноценный плагин для Блендера. Создать модель по картинке в один клик, панель ассетов, 3D контролнет, все дела
скачать - впишите в окошко цены 0 или другую сумму которую хотите заплатить
#blender #imageto3d
отвлечемся от потока хайлуовщины.
Deemos выпустили полноценный плагин для Блендера. Создать модель по картинке в один клик, панель ассетов, 3D контролнет, все дела
скачать - впишите в окошко цены 0 или другую сумму которую хотите заплатить
#blender #imageto3d
Media is too big
VIEW IN TELEGRAM
OmniGen2: Exploration to Advanced Multimodal Generation
Новая версия редактора-генератора-персонализатора изображений
Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.
Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их
Код
Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/
С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/
#personalization #imageediting #text2image #image2image #referencing
Новая версия редактора-генератора-персонализатора изображений
Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.
Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их
Код
Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/
С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/
#personalization #imageediting #text2image #image2image #referencing
This media is not supported in your browser
VIEW IN TELEGRAM
11ai
Персональный голосовой ассистент от Elevenlabs с поддержкой #MCP
Интегрируется с perplexity, linear, SlackHQ и др
У меня ссылка не открывается, я же гражданин неправильной страны😡
#assistant #voicemode
Персональный голосовой ассистент от Elevenlabs с поддержкой #MCP
Интегрируется с perplexity, linear, SlackHQ и др
У меня ссылка не открывается, я же гражданин неправильной страны
#assistant #voicemode
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
SongBloom
Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.
Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:
- Постепенное расширение музыкального эскиза от короткого к длинному.
- Уточнение деталей от общих до более тонких.
- Интеграция семантического и акустического контекста для управления процессом генерации.
Код
Веса
#text2music #music #musicediting
Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.
Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:
- Постепенное расширение музыкального эскиза от короткого к длинному.
- Уточнение деталей от общих до более тонких.
- Интеграция семантического и акустического контекста для управления процессом генерации.
Код
Веса
#text2music #music #musicediting
FluxZayn: FLUX LayerDiffuse Extension for Stable Diffusion WebUI Forge
Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)
расширение для Forge
LayerDiffuse-Flux - оригинальный код
Для #ComfyUI есть ComfyUI_FluxLayerDiffuse
#extension #forge #text2image #flux #RGBA
Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)
расширение для Forge
LayerDiffuse-Flux - оригинальный код
Для #ComfyUI есть ComfyUI_FluxLayerDiffuse
#extension #forge #text2image #flux #RGBA