Notice: file_put_contents(): Write of 19820 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50
Data Science Work@datasciencework P.281
DATASCIENCEWORK Telegram 281
Компания: Сбер, Intelligent Document Processing
Должность: Middle/Senior/Lead CV Engineer
Вилки:
Middle: 180-250к net (+ годовая премия х5-х7)
Senior: 250-350к net (+ годовая премия х5-х7)
Senior: 300-400к net (+ годовая премия х5-х7)
Город: Москва (офис)
Контакты: @Igeti


Наша команда занимается задачами, связанными с интеллектуальной обработкой документов, созданием систем OCR/HCR, парсингом таблиц и извлечением сущностей и фактов из текстовой информации.
Помимо проектов с обработкой документов, мы также создаем фреймворки для типовых задач в области CV и NLP, которыми пользуются многие команды банка.

У нас открывается новое направление по созданию Fusion моделей для извлечения информации из документов, которые бы использовали общий encoder для решения большинства downstream задач, а также E2E пайплайны для OCR.
Сейчас в пайплайне используются более 30 различных DL моделей - скучно не будет

Стек: DL, CV

Задачи:
- Развитие собственного движка OCR
- Создание моделей распознавания рукописного текста и текста in the wild
- Создание пайплайна тренировки Fusion моделей (генерация синты, подготовка размеченных данных, организация циклов дообучения и доставка моделей в пром)
- Реализация MLOps - работа с MLflow, Kubeflow, DVC

Обязаности:
- Имплементация и обучение моделей OCR, детекции текста, детекции объектов, сегментации и классификации
- Чтение статей и перекладывание SOTA на пром рельсы, в том числе NAS, GAN и self-supervised learning для HCR
- Запуск распределенного обучения на GPU кластере MLSpace (Кристофари)
- Организация циклов дообучения на новых данных (постановка задач разметчикам, запуск crowdsource майнинга данных и т.д)
- Оптимизация моделей для исполнения: квантизация, прунинг и дистилляция моделей. Портирование на Tensorrt и Openvino
- Релизы новых моделей в среды исполнения

Ожидаем от кандидата:
- Отличное знание одного из Pytorch, TF + numpy, Sklearn, pandas
- Опыт разработки/обучения/внедрения одной или нескольких типов моделей: object detection , semantic segmentation, instance segmentation, OCR, text detection, text spotting и т.д.
- Хорошее знание классического CV и OpenCV
- Хорошее знание алгоритмов, python3, ООП, SOLID, git, docker
- Желание изучать новые подходы, модели и технологии

Плюсом будет:
- Хороший профиль на Github
- Медальки на Kaggle
- Опыт в GAN, StyleTransfer, Domain adaptation и NAS

Если вы сильный специалист, но не нашли подходящую вилку – пишите, обсудим.
Для отправки резюме, заполните форму: https://airtable.com/shrlsrEHhgNVg5Xoi
По всем вопросам писать мне в телеграм:telegram: @Igeti



tgoop.com/datasciencework/281
Create:
Last Update:

Компания: Сбер, Intelligent Document Processing
Должность: Middle/Senior/Lead CV Engineer
Вилки:
Middle: 180-250к net (+ годовая премия х5-х7)
Senior: 250-350к net (+ годовая премия х5-х7)
Senior: 300-400к net (+ годовая премия х5-х7)
Город: Москва (офис)
Контакты: @Igeti


Наша команда занимается задачами, связанными с интеллектуальной обработкой документов, созданием систем OCR/HCR, парсингом таблиц и извлечением сущностей и фактов из текстовой информации.
Помимо проектов с обработкой документов, мы также создаем фреймворки для типовых задач в области CV и NLP, которыми пользуются многие команды банка.

У нас открывается новое направление по созданию Fusion моделей для извлечения информации из документов, которые бы использовали общий encoder для решения большинства downstream задач, а также E2E пайплайны для OCR.
Сейчас в пайплайне используются более 30 различных DL моделей - скучно не будет

Стек: DL, CV

Задачи:
- Развитие собственного движка OCR
- Создание моделей распознавания рукописного текста и текста in the wild
- Создание пайплайна тренировки Fusion моделей (генерация синты, подготовка размеченных данных, организация циклов дообучения и доставка моделей в пром)
- Реализация MLOps - работа с MLflow, Kubeflow, DVC

Обязаности:
- Имплементация и обучение моделей OCR, детекции текста, детекции объектов, сегментации и классификации
- Чтение статей и перекладывание SOTA на пром рельсы, в том числе NAS, GAN и self-supervised learning для HCR
- Запуск распределенного обучения на GPU кластере MLSpace (Кристофари)
- Организация циклов дообучения на новых данных (постановка задач разметчикам, запуск crowdsource майнинга данных и т.д)
- Оптимизация моделей для исполнения: квантизация, прунинг и дистилляция моделей. Портирование на Tensorrt и Openvino
- Релизы новых моделей в среды исполнения

Ожидаем от кандидата:
- Отличное знание одного из Pytorch, TF + numpy, Sklearn, pandas
- Опыт разработки/обучения/внедрения одной или нескольких типов моделей: object detection , semantic segmentation, instance segmentation, OCR, text detection, text spotting и т.д.
- Хорошее знание классического CV и OpenCV
- Хорошее знание алгоритмов, python3, ООП, SOLID, git, docker
- Желание изучать новые подходы, модели и технологии

Плюсом будет:
- Хороший профиль на Github
- Медальки на Kaggle
- Опыт в GAN, StyleTransfer, Domain adaptation и NAS

Если вы сильный специалист, но не нашли подходящую вилку – пишите, обсудим.
Для отправки резюме, заполните форму: https://airtable.com/shrlsrEHhgNVg5Xoi
По всем вопросам писать мне в телеграм:telegram: @Igeti

BY Data Science Work




Share with your friend now:
tgoop.com/datasciencework/281

View MORE
Open in Telegram


Telegram News

Date: |

Telegram desktop app: In the upper left corner, click the Menu icon (the one with three lines). Select “New Channel” from the drop-down menu. As the broader market downturn continues, yelling online has become the crypto trader’s latest coping mechanism after the rise of Goblintown Ethereum NFTs at the end of May and beginning of June, where holders made incoherent groaning sounds and role-played as urine-loving goblin creatures in late-night Twitter Spaces. The administrator of a telegram group, "Suck Channel," was sentenced to six years and six months in prison for seven counts of incitement yesterday. Over 33,000 people sent out over 1,000 doxxing messages in the group. Although the administrators tried to delete all of the messages, the posting speed was far too much for them to keep up. When choosing the right name for your Telegram channel, use the language of your target audience. The name must sum up the essence of your channel in 1-3 words. If you’re planning to expand your Telegram audience, it makes sense to incorporate keywords into your name.
from us


Telegram Data Science Work
FROM American