tgoop.com/airi_research_institute/1036
Last Update:
Искусственный интеллект научился переводить древнеегипетские иероглифы
Группа учёных Института AIRI, ИСП РАН и ИТМО под руководством PhD, ведущего научного сотрудника Ильи Макарова создала систему, которая распознаёт и переводит древнеегипетские иероглифы с высокой точностью. Основой для обучения модели стал “Thesaurus Linguae Aegyptiae”— самое полное собрание древнеегипетских текстов с переводами. Сначала применялись автоматические метрики, затем тексты оценивали профессиональные египтологи из НИУ ВШЭ.
Распознавание иероглифов — сложная задача: вместо алфавита из 30-40 букв система должна «понимать» сотни похожих символов с уникальным значением. Для повышения точности ученые использовали контекстуальные OCR-модели и диффузионные модели, генерирующие реалистичные изображения для расширения обучающего набора.
В ходе проекта создаются новые технологии распознавания рукописных текстов, которые востребованы при создании и обогащении больших языковых моделей в условиях недостатка данных. В перспективе разработку можно будет использовать, например, в мобильных приложениях дополненной реальности.
Разработка уже представлена на международных конференциях SIGGRAPH 2025 и IEEE ISMAR, а несколько научных статей приняты к публикации на ведущих конференциях уровня A*. Система доступна по запросу для специалистов.