PublicatioЖурнал "Системы Безопасности" № 2‘2018

Слева расположено фото высокого качества, которое используется для выдачи виз, а справа – фото из реальной жизни, качество которого существенно ниже. Выбирая алгоритм распо- знавания на основании тестов, нужно быть уве- ренным, что они проводились на той базе, которая максимально близка к реальным усло- виям. Результаты разных алгоритмов и разных баз очень сильно отличаются. На рис. 4 красным показан алгоритм, продемонстрировавший лучший результат на базе Visa, а синим – лучший результат на базе Wild. На базе Wild (рис. 5) красный алгоритм – в числе худ- ших, а синий проигрывает красному на базе Visa. В зависимости от природы данных, с которыми приходится работать, для проекта будет подхо- дить либо красный, либо синий алгоритм. Но главный вывод таков: чтобы получить высокий результат, нужно стремиться к улучшению каче- ства изображения. Скорость работы алгоритмов распознавания На рис. 6 показана зависимость ложного пропуска от скорости работы. Любой заказчик хочет, чтобы алгоритмы работали как можно быстрее и точнее, то есть находились в левом нижнем углу графика. Однако все достойные алгоритмы "живут" в правом углу. За точность всегда приходится платить временем: для более высокой точности необходимы более сложные алгоритмы, которые требуют большего времени на вычисления. При измерении скоро- сти вычисления надо учитывать, что любой алгоритм распознава- ния проводит две опе- рации: 1. Вычисление био- метрического шабло- на (фотография пре- вращается в набор цифр, который уни- кально характеризует человека). 2. Сравнение двух биометрических шаб- лонов между собой. При этом скорость сравнения очень высо- кая и измеряется в наносекундах (10–9 с), а скорость вычисления б и о м е т р и ч е с к о г о шаблона – в миллисе- кундах. Посмотрим, во что это выливается в реальных кейсах. Примеры расчета скорости работы алгоритма Рассмотрим два алгоритма (табл. 1) с раз- ными скоростями вычисления биометриче- ских шаблонов и их сравнения. У алгоритма 1 быстрее вычисляется биомет- рический шаблон, но медленнее происходит сравнение, у алгоритма 2 ситуация обрат- ная. Результаты обоих алгоритмов по време- ни в двух типичных кейсах показаны в табл. 2. В кейсе № 1 имеется огромная база, в кото- рой нужно найти человека. Кейс № 2 отно- сится к общественной безопасности (напри- мер, в метро поставили камеру, мимо кото- рой проходят 10 тыс. человек, в базе розы- ска 1 тыс. человек). В обоих кейсах количество сравнений оди- наковое – 10 млн. Но из-за того что поста- новка задачи и время вычисления биомет- рических шаблонов разные, получаются совершенно противоположные результаты. В кейсе № 1 лучший результат показывает 2-й алгоритм (быстрее в 12 раз), а в кейсе № 2 – 1-й алгоритм (быстрее в 4–5 раз). В зависимости от того, какую задачу необхо- димо решить, следует обращать внимание на те или иные характеристики алгоритма распознавания. Например, при работе с большими базами, которые известны зара- нее, вычисление биометрических шаблонов происходит раньше, и в базе хранятся не фотографии, а уже готовые шаблоны, что приводит к существенной экономии вре- мени. Зависимость скорости от платформы и режима обработки Тесты NIST не покрывают все многообразие ситуаций, происходящих в мире. Кроме большого количества алгоритмов, суще- ствуют и разные вычислительные платфор- мы, на которых эти алгоритмы можно запус- кать, а именно центральные процессоры Intel либо графические процессоры NVIDIA (табл. 3). В силу того, что все современные алгоритмы построены на глубоких нейронных сетях, которые на GPU работают намного быстрее, чем на CPU, получается очень большая раз- ница в скорости работы. К сожалению, тесты NIST ограничены CPU, в них участвуют и гра- фические ускорители, но устаревшие, кото- рые не показывают всю прелесть их исполь- зования. В табл. 3 представлены результаты исследования на самых последних вычисли- тельных платформах. Как мы видим, если происходит единичная обработка изображения, то использование графического ускорителя дает выигрыш от 10 до 4 раз, что не так впечатляюще. В слу- чае же если используется пакетный режим обработки в графических ускорителях, за 1 с можно обрабатывать 300 лиц, а на центральном – всего 1 лицо в 1 с. Это важ- ный фактор, который следует иметь в виду при выборе системы, так как если для дости- жения желаемой точности нужно построить целый дом из серверов, то такой проект не "взлетит" – скорее всего, просто не хватит бюджета. Если ту же самую задачу можно решить с помощью достаточно компактных серверов на базе графических ускорителей, то такой проект будет абсолютно реализуем. Цифры из табл. 3 мы не видели ни в одном тесте и ни на одном конкурсе – они находят- ся за скобками, так как слишком сложно проводить подобные вычисления. Но имен- но эти показатели будут влиять на работу системы при внедрении в реальных усло- виях, особенно когда речь идет о больших проектах, где такие вопросы, как размер пространства для вычислительной платфор- мы, ее энергопотребление и др., являются принципиально важными. n апрель – май 2018 www.secuteck.ru БИОМЕТРИЧЕСКИЕ СИСТЕМЫ С И С Т Е М Ы К О Н Т Р О Л Я И У П Р А В Л Е Н И Я Д О С Т У П О М n w w w . a l l - o v e r - i p . r u 98 Рис. 6. Взаимосвязь скорости построения шаблона и FRR Таблица 1. Скорости вычисления шаблонов и их сравнения у алгоритмов 1 и 2 Таблица 2. Суммарная скорость работы алгоритмов 1 и 2 Таблица 3. Производительность вычисления шаблонов в режиме пакетной обработки Ваше мнение и вопросы по статье направляйте на ss @groteck.ru