tgoop.com/datasciencework/281
Last Update:
Компания: Сбер, Intelligent Document Processing
Должность: Middle/Senior/Lead CV Engineer
Вилки:
Middle: 180-250к net (+ годовая премия х5-х7)
Senior: 250-350к net (+ годовая премия х5-х7)
Senior: 300-400к net (+ годовая премия х5-х7)
Город: Москва (офис)
Контакты: @Igeti
Наша команда занимается задачами, связанными с интеллектуальной обработкой документов, созданием систем OCR/HCR, парсингом таблиц и извлечением сущностей и фактов из текстовой информации.
Помимо проектов с обработкой документов, мы также создаем фреймворки для типовых задач в области CV и NLP, которыми пользуются многие команды банка.
У нас открывается новое направление по созданию Fusion моделей для извлечения информации из документов, которые бы использовали общий encoder для решения большинства downstream задач, а также E2E пайплайны для OCR.
Сейчас в пайплайне используются более 30 различных DL моделей - скучно не будет
Стек: DL, CV
Задачи:
- Развитие собственного движка OCR
- Создание моделей распознавания рукописного текста и текста in the wild
- Создание пайплайна тренировки Fusion моделей (генерация синты, подготовка размеченных данных, организация циклов дообучения и доставка моделей в пром)
- Реализация MLOps - работа с MLflow, Kubeflow, DVC
Обязаности:
- Имплементация и обучение моделей OCR, детекции текста, детекции объектов, сегментации и классификации
- Чтение статей и перекладывание SOTA на пром рельсы, в том числе NAS, GAN и self-supervised learning для HCR
- Запуск распределенного обучения на GPU кластере MLSpace (Кристофари)
- Организация циклов дообучения на новых данных (постановка задач разметчикам, запуск crowdsource майнинга данных и т.д)
- Оптимизация моделей для исполнения: квантизация, прунинг и дистилляция моделей. Портирование на Tensorrt и Openvino
- Релизы новых моделей в среды исполнения
Ожидаем от кандидата:
- Отличное знание одного из Pytorch, TF + numpy, Sklearn, pandas
- Опыт разработки/обучения/внедрения одной или нескольких типов моделей: object detection , semantic segmentation, instance segmentation, OCR, text detection, text spotting и т.д.
- Хорошее знание классического CV и OpenCV
- Хорошее знание алгоритмов, python3, ООП, SOLID, git, docker
- Желание изучать новые подходы, модели и технологии
Плюсом будет:
- Хороший профиль на Github
- Медальки на Kaggle
- Опыт в GAN, StyleTransfer, Domain adaptation и NAS
Если вы сильный специалист, но не нашли подходящую вилку – пишите, обсудим.
Для отправки резюме, заполните форму: https://airtable.com/shrlsrEHhgNVg5Xoi
По всем вопросам писать мне в телеграм:telegram: @Igeti
BY Data Science Work

Share with your friend now:
tgoop.com/datasciencework/281