Нейронавт | Нейросети в творчестве 7370

SongBloom

Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.

Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:

- Постепенное расширение музыкального эскиза от короткого к длинному.

- Уточнение деталей от общих до более тонких.

- Интеграция семантического и акустического контекста для управления процессом генерации.

Код
Веса

#text2music #music #musicediting

1.2K views10:43

Нейронавт | Нейросети в творчестве

FluxZayn: FLUX LayerDiffuse Extension for Stable Diffusion WebUI Forge

Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)

расширение для Forge
LayerDiffuse-Flux - оригинальный код

Для #ComfyUI есть ComfyUI_FluxLayerDiffuse

#extension #forge #text2image #flux #RGBA

1.2K views13:16

Нейронавт | Нейросети в творчестве

Гудини, что с лицом?

1.1K views18:10

Нейронавт | Нейросети в творчестве

Forwarded from Psy Eyes

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

Горячие опенсорсные девушки!

Контроль пламени с помощью масок в Wan. Залипательно.

А Midjourney так может?

Автор

961 views18:10

Нейронавт | Нейросети в творчестве

ComfyUI Nodes for SongBloom

Ноды вчерашнего генератора музыки

Спасибо @MaxKhtv

#text2music #music #musicediting #comfyui

GitHub

GitHub - fredconex/ComfyUI-SongBloom

Contribute to fredconex/ComfyUI-SongBloom development by creating an account on GitHub.

796 viewsedited 06:30

Нейронавт | Нейросети в творчестве

заработал демоспейс мобильного генератора речи и подкастов vui

По-русски ни бельмес

Демо

#tts #text2speech #voicecloning #conversation #mobile #podcast

0:25

Нейронавт | Нейросети в творчестве

fluxions AI vui

Небольшие разговорные модели речи, которые могут запускаться на устройстве

Это опенсорсный конкурент notebooklm

Голосовая модель 100М параметров

Умеет клонировать голос

модели могут издавать различные неречевые звуки. Добавляйте в текст…

707 views07:07

Нейронавт | Нейросети в творчестве

astra.app

"Первый в мире" креативный апскейлер видео от Topaz Labs вышел из стадии раннего доступа и доступен для всех... от $39 в месяц

#upscalevideo #upscale #frameinterpolation

672 views07:41

Нейронавт | Нейросети в творчестве

2:00

Media is too big

VIEW IN TELEGRAM

Claude Code for VSCode

На прошлой неделе Anthropic запустил плагин для интеграции своего инструмента в IDE

Бонус:
Claudia - интерфейс и набор инструментов для Claude Code

Работает на Windows, macOS и Linux.

Опенсорс, запускается локально.

#coding #assistant

598 views08:11

Нейронавт | Нейросети в творчестве

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Немножко ресерча, который скоро вдохнет новые силы в LLM

TLDR: LoRa для языковых моделей без дообучения

Проект Drag-and-Drop LLMs (DnD) — это метод, который позволяет быстро адаптировать большие языковые модели к новым задачам без дополнительного обучения. Модель использует текстовые подсказки для создания необходимых параметров и работает быстрее, чем традиционные методы настройки. Это делает её эффективной для решения различных задач, включая математику, кодирование и анализ мультимодальных данных

Код ждем

#llm #research

539 views08:41

2025/06/25 12:22:44
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>