tgoop.com/githubdevs/629
Create:
Last Update:
Last Update:
Chaplin — утилита для визуального распознавания речи по губам (VSR), которая считывает движения ваших губ и мгновенно преобразует их в текст.
Ключевые особенности:
Как это работает? Chaplin использует модель, обученную на наборе данных Lip Reading Sentences 3 (LRS3), что позволяет ему точно интерпретировать чтение по губам.
Установка:
$ git clone https://github.com/amanvirparhar/chaplin
$ cd chaplin
Далее качаем необходимые модели, ссылки на GitHub
Пример использования:
$ sudo uv run --with-requirements requirements.txt --python 3.12 main.py config_filename=./configs/LRS3_V_WER19.1.ini detector=mediapipe
#python #soft #github