tgoop.com/notboring_tech/3827
Last Update:
🤯 Китайцы из Qwen устроили день релизов и за пару часов выложили три нейросети передового уровня — они стали лидерами для большого спектра задач.
Qwen3-TTS-Flash
• Лучшая по стабильности модель для преобразования текста в речь
• Доступно 14 выразительных голосов и поддержка 10 языков, включая русский
• Задержка всего 97 мс (одна десятая секунды!)
Qwen-Image-Edit-2509
• «Убийца» Nano Banana научился редактировать сразу несколько изображений и смешивать их
• Гораздо лучше сохраняет контекст, лица и объекты
• Добавили встроенный ControlNet для изменения поз
Qwen3-Omni
• Мультимодальная модель «всё в одном» — обрабатывает текст, изображения, аудио и видео
• Первое место на 22 из 36 тематических бенчмарках, поддержка 119 языков
• Обрабатывает аудио длиной до 30 минут с задержкой 211 мс
В рядах топовых моделей пополнение — забираем
@notboring_tech