Вылил в свет своего бота по транкрибации аудио/видео контента
Это тюн whisper под русский язык
Датасет для трейна https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0
200к записей трейн 11к записей тест
60 часов на А100
Тюн запущен в боте дошел до 6.3 WER на русском
Так же обновил функционал бота по транскрибу аудио (ограничение там 19мб и примерно 20-30минут аудио)
Что нового!
Cаммари делает 4o-mini
Переработал кнопки вывода и добавил функции
- Скачиваня результата
- Саммари
- Вывода результата в чат с ботом
Еще реализовал закрепление ботом каждой таски(так можно вернутся к аудио и его результату)
Это тюн whisper под русский язык
Датасет для трейна https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0
200к записей трейн 11к записей тест
60 часов на А100
Тюн запущен в боте дошел до 6.3 WER на русском
Так же обновил функционал бота по транскрибу аудио (ограничение там 19мб и примерно 20-30минут аудио)
Что нового!
Cаммари делает 4o-mini
Переработал кнопки вывода и добавил функции
- Скачиваня результата
- Саммари
- Вывода результата в чат с ботом
Еще реализовал закрепление ботом каждой таски(так можно вернутся к аудио и его результату)
🔥11
tgoop.com/neuraldeep/979
Create:
Last Update:
Last Update:
Вылил в свет своего бота по транкрибации аудио/видео контента
Это тюн whisper под русский язык
Датасет для трейна https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0
200к записей трейн 11к записей тест
60 часов на А100
Тюн запущен в боте дошел до 6.3 WER на русском
Так же обновил функционал бота по транскрибу аудио (ограничение там 19мб и примерно 20-30минут аудио)
Что нового!
Cаммари делает 4o-mini
Переработал кнопки вывода и добавил функции
- Скачиваня результата
- Саммари
- Вывода результата в чат с ботом
Еще реализовал закрепление ботом каждой таски(так можно вернутся к аудио и его результату)
Это тюн whisper под русский язык
Датасет для трейна https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0
200к записей трейн 11к записей тест
60 часов на А100
Тюн запущен в боте дошел до 6.3 WER на русском
Так же обновил функционал бота по транскрибу аудио (ограничение там 19мб и примерно 20-30минут аудио)
Что нового!
Cаммари делает 4o-mini
Переработал кнопки вывода и добавил функции
- Скачиваня результата
- Саммари
- Вывода результата в чат с ботом
Еще реализовал закрепление ботом каждой таски(так можно вернутся к аудио и его результату)
BY Neural Deep


Share with your friend now:
tgoop.com/neuraldeep/979