Telegram Web
Media is too big
VIEW IN TELEGRAM
SongBloom

Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.

Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:

- Постепенное расширение музыкального эскиза от короткого к длинному.

- Уточнение деталей от общих до более тонких.

- Интеграция семантического и акустического контекста для управления процессом генерации.

Код
Веса

#text2music #music #musicediting
FluxZayn: FLUX LayerDiffuse Extension for Stable Diffusion WebUI Forge

Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)

расширение для Forge
LayerDiffuse-Flux - оригинальный код

Для #ComfyUI есть ComfyUI_FluxLayerDiffuse

#extension #forge #text2image #flux #RGBA
Гудини, что с лицом?
Forwarded from Psy Eyes
This media is not supported in your browser
VIEW IN TELEGRAM
Горячие опенсорсные девушки!

Контроль пламени с помощью масок в Wan. Залипательно.

А Midjourney так может?

Автор
astra.app

"Первый в мире" креативный апскейлер видео от Topaz Labs вышел из стадии раннего доступа и доступен для всех... от $39 в месяц

#upscalevideo #upscale #frameinterpolation
Claude Code for VSCode

На прошлой неделе Anthropic запустил плагин для интеграции своего инструмента в IDE

Бонус:
Claudia - интерфейс и набор инструментов для Claude Code

Работает на Windows, macOS и Linux.

Опенсорс, запускается локально.

#coding #assistant
This media is not supported in your browser
VIEW IN TELEGRAM
Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Немножко ресерча, который скоро вдохнет новые силы в LLM

TLDR: LoRa для языковых моделей без дообучения

Проект Drag-and-Drop LLMs (DnD) — это метод, который позволяет быстро адаптировать большие языковые модели к новым задачам без дополнительного обучения. Модель использует текстовые подсказки для создания необходимых параметров и работает быстрее, чем традиционные методы настройки. Это делает её эффективной для решения различных задач, включая математику, кодирование и анализ мультимодальных данных

Код ждем

#llm #research
2025/06/25 12:22:44
Back to Top
HTML Embed Code: