Warning: file_put_contents(aCache/aDaily/post/ai_machinelearning_big_data/-8041-8042-8043-8044-8045-8046-8041-): Failed to open stream: No space left on device in /var/www/tgoop/post.php on line 50
Machinelearning@ai_machinelearning_big_data P.8045
AI_MACHINELEARNING_BIG_DATA Telegram 8045
📌 ThinkSound: новый video-to-sound инструмент

ThinkSound — духовный наследник mmAudio — который способен генерировать звук к видео с высокой точностью.

Поддерживает chain-of-thought промпты: позволяет по шагам объяснить, как должен звучать объект (например: «это металл, он падает на плитку, должно звучать звонкой эхо»)
Учитывает контекст сцены, физику движения объектов, состав материалов и многое другое
Работает с видео как reasoning-модель, а не просто визуально-аудиофильтр

В демках можно послушать звук шагов на песке, звон разбитого стекла, шум дождя — всё сгенерировано на лету, без записанных сэмплов.

Из минусов - сложно подобрать промпт, но когда получается, то модель выдает годноту.

🟡Github: https://github.com/FunAudioLLM/ThinkSound
🟡Демо: https://thinksound-project.github.io/
🟡Статья: https://arxiv.org/pdf/2506.21448
🟡Проект: https://ThinkSound-Demo.github.io

@ai_machinelearning_big_data

#python #videotosound
Please open Telegram to view this post
VIEW IN TELEGRAM
85👍61🔥27👏9❤‍🔥2😁2😐2



tgoop.com/ai_machinelearning_big_data/8045
Create:
Last Update:

📌 ThinkSound: новый video-to-sound инструмент

ThinkSound — духовный наследник mmAudio — который способен генерировать звук к видео с высокой точностью.

Поддерживает chain-of-thought промпты: позволяет по шагам объяснить, как должен звучать объект (например: «это металл, он падает на плитку, должно звучать звонкой эхо»)
Учитывает контекст сцены, физику движения объектов, состав материалов и многое другое
Работает с видео как reasoning-модель, а не просто визуально-аудиофильтр

В демках можно послушать звук шагов на песке, звон разбитого стекла, шум дождя — всё сгенерировано на лету, без записанных сэмплов.

Из минусов - сложно подобрать промпт, но когда получается, то модель выдает годноту.

🟡Github: https://github.com/FunAudioLLM/ThinkSound
🟡Демо: https://thinksound-project.github.io/
🟡Статья: https://arxiv.org/pdf/2506.21448
🟡Проект: https://ThinkSound-Demo.github.io

@ai_machinelearning_big_data

#python #videotosound

BY Machinelearning





Share with your friend now:
tgoop.com/ai_machinelearning_big_data/8045

View MORE
Open in Telegram


Telegram News

Date: |

Over 33,000 people sent out over 1,000 doxxing messages in the group. Although the administrators tried to delete all of the messages, the posting speed was far too much for them to keep up. The public channel had more than 109,000 subscribers, Judge Hui said. Ng had the power to remove or amend the messages in the channel, but he “allowed them to exist.” Clear Select: Settings – Manage Channel – Administrators – Add administrator. From your list of subscribers, select the correct user. A new window will appear on the screen. Check the rights you’re willing to give to your administrator. The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information.
from us


Telegram Machinelearning
FROM American