ИИволюция 👾@ai_volution P.1047

AI_VOLUTION Telegram 1047

ИИволюция 👾

OpenAI представила новое поколение аудио-моделей: точнее Whisper 3 и с эмоциями!

Теперь любой разработчик может использовать мощнейшие голосовые модели прямо в API:

Speech-to-Text (доступна в API):

- Новые модели GPT-4o-transcribe и GPT-4o-mini-transcribe значительно превзошли по точности Whisper v3 и другие популярные решения.
- Они показывают лучший результат (более низкий WER) даже при сложных условиях: шумном фоне, акцентах или быстрой речи.
- Идеально подходят для колл-центров, расшифровок встреч и подкастов.

Text-to-Speech (доступна в API):

- Новая модель GPT-4o-mini-tts умеет не просто озвучивать текст, но и выражать эмоции и интонации по вашей инструкции.
- Например, можно попросить модель говорить «как сочувствующий оператор поддержки», профессиональный диктор или даже рассказчик историй.
- Голосовой AI становится максимально естественным и персонализированным.
- Whisper 3 был хорош, но OpenAI подняла планку ещё выше: новые модели дают точность и гибкость, которых раньше не было.

Официальная новость: https://openai.com/index/introducing-our-next-generation-audio-models/

Послушать разные варианты озвучки можно на этой площадке: www.openai.fm

Пора пробовать в проектах!

ИИволюция

www.tgoop.com/ai_volution/1047

3.2K viewsСергей Пахандрин, edited Mar 21 at 05:42

tgoop.com/ai_volution/1047

Create: 2025-03-21
Last Update: 2025-06-29 19:59:41

OpenAI представила новое поколение аудио-моделей: точнее Whisper 3 и с эмоциями!

Теперь любой разработчик может использовать мощнейшие голосовые модели прямо в API:

Speech-to-Text (доступна в API):

- Новые модели GPT-4o-transcribe и GPT-4o-mini-transcribe значительно превзошли по точности Whisper v3 и другие популярные решения.
- Они показывают лучший результат (более низкий WER) даже при сложных условиях: шумном фоне, акцентах или быстрой речи.
- Идеально подходят для колл-центров, расшифровок встреч и подкастов.

Text-to-Speech (доступна в API):

- Новая модель GPT-4o-mini-tts умеет не просто озвучивать текст, но и выражать эмоции и интонации по вашей инструкции.
- Например, можно попросить модель говорить «как сочувствующий оператор поддержки», профессиональный диктор или даже рассказчик историй.
- Голосовой AI становится максимально естественным и персонализированным.
- Whisper 3 был хорош, но OpenAI подняла планку ещё выше: новые модели дают точность и гибкость, которых раньше не было.

Официальная новость: https://openai.com/index/introducing-our-next-generation-audio-models/

Послушать разные варианты озвучки можно на этой площадке: www.openai.fm

Пора пробовать в проектах!

ИИволюция

BY ИИволюция 👾

Share with your friend now:
tgoop.com/ai_volution/1047

Open in Telegram

Telegram News

Date: 2025-06-29|

On Tuesday, some local media outlets included Sing Tao Daily cited sources as saying the Hong Kong government was considering restricting access to Telegram. Privacy Commissioner for Personal Data Ada Chung told to the Legislative Council on Monday that government officials, police and lawmakers remain the targets of “doxxing” despite a privacy law amendment last year that criminalised the malicious disclosure of personal information. Select: Settings – Manage Channel – Administrators – Add administrator. From your list of subscribers, select the correct user. A new window will appear on the screen. Check the rights you’re willing to give to your administrator. Avoid compound hashtags that consist of several words. If you have a hashtag like #marketingnewsinusa, split it into smaller hashtags: “#marketing, #news, #usa. Over 33,000 people sent out over 1,000 doxxing messages in the group. Although the administrators tried to delete all of the messages, the posting speed was far too much for them to keep up. The Standard Channel
from us

Telegram ИИволюция 👾
FROM American