Компания Smart Engines решила задачу распознавания российских паспортов на уровне искусственного интеллекта, которую она называет «последней фундаментальной проблемой» в этой сфере. Теперь компьютерное зрение распознает книжку паспорта как трехмерный объект.
В режиме «книжки»
Компания Smart Engines рассказала CNews о решении задачи, которую она называет «последней фундаментальной проблемой» распознавания российского паспорта искусственным интеллектом.
Ее программный продукт Smart ID Engine научился распознавать паспортные данные «на бегу» в режиме «книжки», то есть может в реальном времени считывать информацию под разными углами, в разном освещении, в видеопотоке, на фотографиях. До сих пор, говорят представители компании, распознавание российского паспорта успешно происходило путем его «прижимания» и сканирования на плоскости.
Программа предназначена для автоматического ввода паспортных данных в мобильных приложениях, интернет-решениях и в других системах при дистанционном обслуживании и обработке клиентских документов в отделениях.
По мнению учёных, распознавание именно «книжка» была тем научно-технологическим рубежом, преодолев который, задачу распознавания российского паспорта на уровне искусственного интеллекта можно считать решенной.
В чем проблема российского паспорта
Smart ID Engine позволяет извлекать данные из более 1600 типов удостоверяющих документов 210 юрисдикций на более чем 100 языках мира. Однако российский паспорт – уникальный документ с точки зрения распознавания, только примерно еще в паре стран мы сталкивались с необходимостью применения этой технологии, говорит генеральный директор Smart Engines Владимир Арлазаров. Во многих странах паспорта реализованы в виде пластиковых ID-карточек и не требуют применения «книжной» технологии распознавания. В иностранных паспортах нужно распознавать только одну страницу, в отличие от случая с российским, где требуется распознать несколько страниц: с основными данными, регистрации, сталкиваться с рефлексами на защитной пленке, ручным заполнением и т.п.
«Наши учёные и инженеры решили ряд фундаментальных проблем, связанных как с особенностями распознавания видеопотока и фотографий документов, так и со спецификой самого паспорта. Это и создание технологий распознавания символов редких шрифтов и нестандартных пропорций, алгоритмы межкадровой интеграции, учитывающие ошибки систем автофокусировки и возникновение зашкаливающих бликов на защитной плёнке, программно-аппаратная оптимизация искусственного интеллекта для работы на устройствах с ограниченной производительностью, распознавание паспортов с рукописным заполнением, устойчивая работа в полутьме на грани видимости и, наконец, распознавание «книжки» паспорта как трёхмерного объекта», — говорит Владимир Арлазаров.
Толчком для реализации заявленной функциональности стали условия пандемии, когда люди оказались ограничены в получении государственных и банковских услуг, и были вынуждены получать их исключительно в онлайн-режиме с помощью мобильных устройств. При этом старые технологии распознавания требовали от пользователей дополнительных и неудобных манипуляций с документами. Например, для корректного считывания разворот книжки паспорта необходимо аккуратно сфотографировать или расположить перед сканером определённым образом. Теперь пользователи или выездные сотрудники могут делать фотографии или распознавать паспорта на видео, показывая документы камере телефона или планшета так, как им удобно. Для внесения данных при обслуживании клиентов в отделениях можно показать и сфотографировать документ обычной веб-камерой. Новая функциональность Smart ID Engine будет доступна в ближайшее время начиная с версии 1.4.0.
Продукт оптимизирован для архитектур ARM, x86, SPARC, MIPS, «Эльбрус» и совместим с операционными системами iOS, Android, МОС «Аврора», «РЕД ОС», «Эльбрус», Linux, Windows и macOS. Разработчикам мобильных, десктопных и серверных приложений поставляется комплект SDK, содержащий документацию API и примеры интеграции на разных языках программирования.
Безопасность SDK
В отличие от сервисной модели распознавания, при которой фотографии и сканы паспортов передаются на внешний сервис, комплект поставки SDK позволят встраивать библиотеки Smart ID Engine в приложения других организаций, которые обрабатывают паспортные данные самостоятельно. Например, банки, страховые компании и госструктуры. Полная автономность распознавания обеспечивает соблюдение международных и национальных стандартов безопасности при обработке персональных данных.
Бизнес
Решение не требует сетевого соединения, не передаёт и не хранит персональные данные клиентов. Все вычисления выполняются на устройстве пользователя: в телефоне, компьютере или сервере. Программа не собирает данные для повышения качества распознавания или обучения нейронных сетей. Высокая точность и надёжность достигается исключительно за счет алгоритмов искусственного интеллекта, изображения документов пользователей ни в каком виде не передаются в сторонние сервисы для ручного извлечения данных верификаторами. По словам Владимира Арлазарова, cледующим научно-технологическим рубежом в безопасном распозновании паспортных данных станет определение подлинности предъявляемых документов.
В России технологии компьютерного зрения от Smart Engines применяют в «Билайне», МТС, «Мегафоне», группе «Тинькофф», Альфа-Банке, Газпромбанке, «Почта Банке», Райффайзенбанке, Росбанке, «Альфастраховании» и в ряде государственных ведомств. За рубежом ими пользуются Dukascopy Bank, Emirates NBD, Oman Arab Bank, BioCollections Worldwide, Blockpass IDN, Caribbean Airlines, iDenfy, NEC, Tessi, Travizory, VerifyMyAge.