Журнал "Системы Безопасности" № 5‘2022

С овместный технический комитет (ISO/IEC JTC 1) ISO (Международной организации по стандартизации) и IEC (Международной элек- тротехнической комиссии) и, в частности, Тех- нический подкомитет 37, который работает над новым стандартом ISO/IEC 24358, выделяют ряд технических проблем, в значительной сте- пени влияющих на количество ошибок работы систем распознавания. Данный стандарт будет определять свойства биометрических подсистем сбора изображений лиц следующего поколения, предназначенных для повышения пригодности фотографий для автоматического распознавания лиц, уменьше- ния изменчивости этих фотографий, улучшения поддержки идентификации человеческого лица и предотвращения фальсификации и незакон- ной модификации фотографий. Основные проблемы систем распознавания лиц Специалисты выделяют следующие основные проблемы. 1. Большинство изображений лиц собираются с помощью камер, которые не распознают лица. Это контрастирует с ситуацией с биомет- рическими данными по отпечаткам пальцев и радужной оболочке глаза, когда датчики позволяют точно определить тип изображе- ния, которое следует собрать. В итоге некото- рые изображения включают два лица, воз- можно от кого-то на заднем плане или от рисунка футболки. Такие случаи могут подо- рвать узнаваемость. 2. Фотографии собираются без какой-либо оценки качества, полагаясь только на фото- графа. 3. Оценка качества отделена от момента получе- ния фото. Во многих случаях фотография собира- ется и позже отправляется на внутренний сервер, где она оценивается по качеству. Если обнаружи- вается низкое качество (человеческим или авто- матическим способом), повторный сбор изобра- жений лиц начинается через несколько часов или дней и с дополнительными расходами. 4. Плохое предьявление. Основные причины неудачи в распознавании возникают из-за того, что субъекты не демонстрируют прямое, ней- тральное выражение лица, с открытыми глаза- ми, без очков, их лица не находятся в правиль- ном положении. 5. Доверие к повышению точности распознава- ния лиц. Алгоритмы распознавания лиц тща- тельно исследованы, а повышение точности подтверждено документально. Тем не менее нет подобных исследований в области улучшения качества изображения лица. 6. Автоматизированное и ручное распознава- ние лиц работают с разными типами изображе- ний. Людям нужны фото с высоким разрешени- ем, тогда как автоматизированные алгоритмы в основном построены на стандартизированных фронтальных видах с относительно низким раз- решением. Давайте попробуем оценить, чем грозит использование систем распознавания лиц без попыток устранения вышеперечисленных про- блем. Проблема 1. Оценка рисков ошибок На рынке биометрии по лицу давно и прочно установился негласный стандарт оценки эталон- ного качества в виде тестов, проводимых Национальным институтом стандартов и техно- логий (NIST) при Министерстве торговли США. Это самый известный и независимый тест с закрытым датасетом. Практически все круп- ные производители систем распознавания в нем принимают участие и по праву гордятся своими результатами в нем. Алгоритмы теста проверяются на скорость и точность работы по нескольким разным фотобазам. Эти базы условно разделены по качеству лица на фото и имеют достаточно широкий разброс ошибок, в зависимости от набора данных. Например, ошибки FNMR (false non-match rate) одного и того же алгоритма на базе VISA Photos и WILD Photos при одном и том же FMR (false match rate) могут различаться на порядки. На какой уровень ошибок тогда ориентироваться условному банку при оценке рисков оказания услуг, связанных с распознаванием лиц? Проблема 2. Оценка точности на собственном датасете Хорошо иметь многомиллионные датасеты для тестов. Но как быть компании, которая владеет своим набором данных? Как оценить работу конкретного алгоритма в конкретных условиях? Как понять, какой уровень ошибок здесь и сей- час? Добавим к этому понимание того, что каче- ство алгоритма зависит от расы и демографиче- ских групп. Ответ прост: собрать свой тестовый набор данных, провести разметку и построить ROC-кривые. Но такая работа может занять не один месяц, при этом маловероятно, что размер базы фото позволит оперировать оценкой оши- бок десять в минус шестой степени. Общие рекомендации для владельцев систем распознавания 1. Ищите быстрые и многоплатформенные системы оценки качества фото. Идеально, если оценка сразу даст прогноз по уровню ошибок сравнения. Тогда часть вышеописанных про- блем и задач решится автоматически. Подоб- ных систем на рынке немного, но они есть. 2. Отдавайте предпочтение производителям, которые предлагают встроенный механизм тестирования на собственных датасетах заказ- чика, а в идеале могут передать часть датасета для разбавления собственной базы фото. И да, вы опять будете удивлены, насколько немного таких предложений. 3. Не экономьте на фронтальных компонентах получения фото. Селфи клиента, снятое одним кадром, – не лучшая идея, если вы хотите рабо- тать с качественной базой. Ошибки распознавания лиц неизбежны, но уро- вень этих ошибок можно прогнозировать и опти- мизировать. Хорошего вам распознавания! n www.secuteck.ru октябрь – ноябрь 2022 БИОМЕТРИЧЕСКИЕ СИСТЕМЫ С И С Т Е М Ы К О Н Т Р О Л Я И У П Р А В Л Е Н И Я Д О С Т У П О М 63 Ваше мнение и вопросы по статье направляйте на ss @groteck.ru Михайло Павлюк Коммерческий директор ООО "Тридиви" www.itsec.ru Малоизвестные ошибки систем распознавания лиц Как с ними жить и как избежать Компании, которые используют или собираются использовать системы распознава- ния лиц, знают, что системы допускают ошибки. Они могут не сопоставить известного пользователя – ложное отрицание, они могут неправильно связать разных пользова- телей – ложное срабатывание. Подобные интерпретации возникают из-за многих факторов, например от свойств входных фотографий или даже от демографической группы распознаваемых лиц