Как мы чуть не уничтожили хакатон по МТСЗадача
Нужно сделать сервис для людей с проблемами зрения, который помогал бы им смотреть фильм.
Решение:
У каждого фильма есть свои сцены
1 сцена: ♂️ Американец и Азиат стоят в раздевалке и смотрят на друг друга ♂️
2 сцена: ♂️ Они начинают бороться ♂️
3 сцена: ....
И к каждой сцене я могу сделать текстовое описание, смотря на картинку. Получается задача Scene2Text (Visual Language) и здесь нам помогла модель VinVL, которая и отдаёт описание сцены 🦾
Отделив сцены и дав им описание, мы отправляем всё это дело на фронт, где и склеивается наш ролик 🤖
Решение крутилось на nginx, Flask в Docker-контейнерах
Итог:
Мы заняли никакое место, хоть и постарались учесть и продуктовую и техническую часть. Поэтому запомните, что красивая презентация и внешняя картинка вашего продукта может сыграть ключевую роль 🏆
GitHub, YouTube
🔥8👍4❤2
tgoop.com/eboutdatascience/56
Create:
Last Update:
Last Update:
Как мы чуть не уничтожили хакатон по МТСЗадача
Нужно сделать сервис для людей с проблемами зрения, который помогал бы им смотреть фильм.
Решение:
У каждого фильма есть свои сцены
1 сцена: ♂️ Американец и Азиат стоят в раздевалке и смотрят на друг друга ♂️
2 сцена: ♂️ Они начинают бороться ♂️
3 сцена: ....
И к каждой сцене я могу сделать текстовое описание, смотря на картинку. Получается задача Scene2Text (Visual Language) и здесь нам помогла модель VinVL, которая и отдаёт описание сцены 🦾
Отделив сцены и дав им описание, мы отправляем всё это дело на фронт, где и склеивается наш ролик 🤖
Решение крутилось на nginx, Flask в Docker-контейнерах
Итог:
Мы заняли никакое место, хоть и постарались учесть и продуктовую и техническую часть. Поэтому запомните, что красивая презентация и внешняя картинка вашего продукта может сыграть ключевую роль 🏆
GitHub, YouTube
BY Ebout Data Science | Дима Савелко


Share with your friend now:
tgoop.com/eboutdatascience/56