Media is too big
VIEW IN TELEGRAM
SongBloom
Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.
Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:
- Постепенное расширение музыкального эскиза от короткого к длинному.
- Уточнение деталей от общих до более тонких.
- Интеграция семантического и акустического контекста для управления процессом генерации.
Код
Веса
#text2music #music #musicediting
Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.
Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:
- Постепенное расширение музыкального эскиза от короткого к длинному.
- Уточнение деталей от общих до более тонких.
- Интеграция семантического и акустического контекста для управления процессом генерации.
Код
Веса
#text2music #music #musicediting
FluxZayn: FLUX LayerDiffuse Extension for Stable Diffusion WebUI Forge
Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)
расширение для Forge
LayerDiffuse-Flux - оригинальный код
Для #ComfyUI есть ComfyUI_FluxLayerDiffuse
#extension #forge #text2image #flux #RGBA
Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)
расширение для Forge
LayerDiffuse-Flux - оригинальный код
Для #ComfyUI есть ComfyUI_FluxLayerDiffuse
#extension #forge #text2image #flux #RGBA
Forwarded from Psy Eyes
This media is not supported in your browser
VIEW IN TELEGRAM
Горячие опенсорсные девушки!
Контроль пламени с помощью масок в Wan. Залипательно.
А Midjourney так может?
Автор
Контроль пламени с помощью масок в Wan. Залипательно.
А Midjourney так может?
Автор
заработал демоспейс мобильного генератора речи и подкастов vui
По-русски ни бельмес
Демо
#tts #text2speech #voicecloning #conversation #mobile #podcast
По-русски ни бельмес
Демо
#tts #text2speech #voicecloning #conversation #mobile #podcast
Telegram
Нейронавт | Нейросети в творчестве
fluxions AI vui
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст…
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст…
astra.app
"Первый в мире" креативный апскейлер видео от Topaz Labs вышел из стадии раннего доступа и доступен для всех... от $39 в месяц
#upscalevideo #upscale #frameinterpolation
"Первый в мире" креативный апскейлер видео от Topaz Labs вышел из стадии раннего доступа и доступен для всех... от $39 в месяц
#upscalevideo #upscale #frameinterpolation
Claude Code for VSCode
На прошлой неделе Anthropic запустил плагин для интеграции своего инструмента в IDE
Бонус:
Claudia - интерфейс и набор инструментов для Claude Code
Работает на Windows, macOS и Linux.
Опенсорс, запускается локально.
#coding #assistant
На прошлой неделе Anthropic запустил плагин для интеграции своего инструмента в IDE
Бонус:
Claudia - интерфейс и набор инструментов для Claude Code
Работает на Windows, macOS и Linux.
Опенсорс, запускается локально.
#coding #assistant
This media is not supported in your browser
VIEW IN TELEGRAM
Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights
Немножко ресерча, который скоро вдохнет новые силы в LLM
TLDR: LoRa для языковых моделей без дообучения
Проект Drag-and-Drop LLMs (DnD) — это метод, который позволяет быстро адаптировать большие языковые модели к новым задачам без дополнительного обучения. Модель использует текстовые подсказки для создания необходимых параметров и работает быстрее, чем традиционные методы настройки. Это делает её эффективной для решения различных задач, включая математику, кодирование и анализ мультимодальных данных
Код ждем
#llm #research
Немножко ресерча, который скоро вдохнет новые силы в LLM
TLDR: LoRa для языковых моделей без дообучения
Проект Drag-and-Drop LLMs (DnD) — это метод, который позволяет быстро адаптировать большие языковые модели к новым задачам без дополнительного обучения. Модель использует текстовые подсказки для создания необходимых параметров и работает быстрее, чем традиционные методы настройки. Это делает её эффективной для решения различных задач, включая математику, кодирование и анализ мультимодальных данных
Код ждем
#llm #research