PublicatioЖурнал "Системы Безопасности" № 2‘2018

Какой алгоритм лучше? Глядя на несколько алгоритмов, графики кото- рых представлены на рис. 2, как определить, как из них хороший, а какой нет? Назвать плохим можно только один алгоритм – обозначенный зеленым цветом. Он проходит выше всех, не пересекается с другими ни в какой области, соответственно, смысла его рассматривать нет, только если он не обладает другими замечательными особенностями (например, является бесплатным). Если же рассматривать алгоритмы красного и синего цвета, то здесь ситуация тонкая: в зави- симости от того, в какой области ошибок лож- ного принятия нужно работать, лучшим будет один или другой. Для низких ошибок лучше будет синий, для высоких ошибок – красный. Т акого понятия, как "лучший в мире алгоритм", не существует – все зависит от той задачи, кото- рую необходимо решить, а зна- чит сам пользователь должен ответственно и внимательно под- ходить к выбору алгоритма За последние несколько лет в технологиях распознавания лиц случился технологиче- ский прорыв. Если раньше традиционные алгоритмы были построены на том, что рас- ставлялись биометрические точки (уголки глаз, уголки носа), между ними измерялись расстояния и далее разработчики старались придумать уникальные метрики, характери- зующие человека (на тот момент между собой соревновались две компании-лидера – Cognitec и NEC), то сейчас ситуация карди- нально изменилась. Все лучшие алгоритмы построены на базе глубоких нейронных сетей, и хорошая новость для нас заключа- ется в том, что лучшие алгоритмы разраба- тываются в России и в Китае. Понимание того, по каким принципам сделана та или иная система распознавания, позволяет с высокой вероятностью не рассматривать старые решения, которые изжили себя. Как определить процент ложных срабатываний Возникает вопрос: как понять, в какой области ошибок ложного срабатывания работать, когда поставлена конкретная задача? Логика здесь очень простая. Для начала нужно просчитать, какое количество событий будет происходить в единицу времени, например в час, а затем понять, ошибка какого из двух типов более критична для решения поставленной задачи. Рассмотрим на конкрет- ных ситуациях. ур. 1 FAR = [допустимое количе- ство ложных срабатываний в единицу времени]/[количество лиц, фиксируемых в единицу вре- мени]*[размер эталонной базы] Пример 1. "Массовое" распознавание в реальном времени Если система устанавливается в метрополи- тене, где база розыска насчитывает порядка 10 тыс. лиц и количество проходов людей в час составляет около 1 тыс., то количество сравнений – 10 млн. Если ошибка ложного срабатывания выбрана как 1%, то это при- ведет к 100 тыс. ложных срабатываний в час. Очевидно, что такой системой нельзя пользоваться ни при каких обстоятельствах: ошибка ложного срабатывания в такой ситуации должна быть как минимум на 4–6 порядков ниже. Под другую задачу требования к ошибке лож- ного срабатывания могут быть существенно ниже. ур. 2 FRR = [допустимое количе- ство ложных отказов в единицу времени]/[количество лиц, фикси- руемых в единицу времени]*[раз- мер эталонной базы] Пример 2. Поиск по базе данных В качестве альтернативной задачи рассмотрим ситуацию, когда по фотографии необходимо найти человека в большой базе данных паспор- тов ФМС. В этом случае ошибка ложного при- нятия уже большого значения не имеет. Важно, чтобы лицо, имеющееся в базе, появилось в первой сотне результатов, которые возвраща- ет система распознавания, и дальше их можно пересмотреть вручную и найти интересующего человека. При этом работа происходит в суще- ственно меньшей области ошибок ложного сра- батывания. Пример 3. Аутентификация пользователя в СКУД В этом случае ложное срабатывание опреде- ляет вероятность проникновения постороннего человека в охраняемое помещение, чего допу- стить нельзя. Мы должны установить его на минимум, даже несмотря на то, что человек, имеющий права, не получит доступ. Но это будет означать лишь то, что ему будет необхо- димо просто еще раз повторить попытку авто- ризации. Зависимость результатов от исходных данных Алгоритмы по-разному работают на различных исходных данных. На рис. 3 показан пример результатов тестов NIST, где используются базы с разными назва- ниями и разным качеством изображений. www.secuteck.ru апрель – май 2018 БИОМЕТРИЧЕСКИЕ СИСТЕМЫ w w w . a l l - o v e r - i p . r u n С И С Т Е М Ы К О Н Т Р О Л Я И У П Р А В Л Е Н И Я Д О С Т У П О М 97 Рис. 4. Результаты алгоритмов на базе Visa ("хорошие" фото) Рис. 5. Результаты алгоритмов на базе Wild ("плохие" фото) Рис. 3. Качество фотографий в различных базах NIST