Журнал "Системы Безопасности" № 4‘2024

Н а сегодняшний день распознавание лиц представляет собой одно из наиболее активно развивающихся и востребованных направлений компьютерного зрения, хотя может сложиться мнение, что данная проблема успешно решена несколько лет назад [1, 2]. Эта технология находит широкое применение в самых разных сферах, от систем безопасности и контроля доступа до развлекательных прило- жений и социальных сетей. По мере роста популярности и распространения систем распо- знавания лиц они становятся все более значи- мой частью нашей повседневной жизни. Ключевую роль в успехах распознавания лиц играют достижения в области глубокого обуче- ния. Современные нейронные сети демонстри- руют высокую точность и эффективность в зада- чах обнаружения, идентификации и верифика- ции личности по изображениям или видео [3, 4]. Тем не менее развитие этой технологии сопровождается появлением новых вызовов и угроз. Злоумышленники постоянно разраба- тывают все более изощренные атаки [5], направленные на обход или введение в заблуж- дение систем распознавания лиц, что ставит перед исследователями дополнительные цели повышения их надежности и устойчивости. Отличие распознавания лиц от классификации изображений Задача распознавания лиц имеет несколько отличий от традиционной классификации изоб- ражений, распространенной в компьютерном зрении. Во-первых, крайне редко встречаются ситуации, когда весь кадр изображения зани- мает только лицо. Часто требуется распознава- ние лиц на значительном удалении от камеры, поэтому первым этапом в такой системе являет- ся не распознаватель, а обнаружитель лиц. Во- вторых, в отличие от традиционных классифи- кационных задач, при распознавании лиц достаточно много классов, но мало примеров на каждый из них. В связи с этим необходима предобработка для приведения всех лиц в "нор- мальное состояние". Более того, система долж- на уметь определять "все лица", которые не при- надлежали ее обучающей выборке как "неизвестные". Это требует использования мет- рических систем. Фактически нейронная сеть кодирует изображения всех эталонных лиц с предобученными весами, затем те же веса используются для кодировки новых данных. Кодировка представляет собой вектор, и, дей- ствительно, можно рассчитать расстояние между любым эталонным вектором и вектором для текущего изображения. Вводя определен- ный порог на близость векторов, отсекаем все "неизвестные лица". Такой подход удобен и не требует нового обучения при удалении лиц из базы или их добавлении. Метрическая система распознавания лиц представлена на рис. 1. Различия алгоритмов моделей обнаружения и распознавания лиц Для определения близости двух векторов, как правило, чаще применяется косинусное сход- ство. На рис. 2 показаны некоторые примеры из бенчмарка Labelled Faces in the Wild (LFW) [6]. Для этого набора данных с рис. 2 нами был про- веден сравнительный анализ различных совре- менных моделей нейронных сетей для распозна- вания лиц. Результаты сравнения производитель- ности и доли верных распознаваний представле- ны в табл. 1, все эксперименты выполнены в среде Google Colab в вычислительной среде CPU. Из табл. 1 видно, что наиболее оптимальной в плане скорости и точности является модель FaceNet. Выше нами рассмотрена задача идентификации лиц. Однако ей всегда предше- ствует задача обнаружения, которая в компью- терном зрении считается более сложной. Полу- чая на вход изображение, модель детекции должна предоставить на выход координаты ограничивающих прямоугольников для каждо- го обнаруженного на снимке лица. Для тести- рования таких моделей лучше подходит датасет WIDER Faces [7]. Примеры изображений из этого набора данных представлены на рис. 3. www.secuteck.ru август – сентябрь 2024 БИОМЕТРИЧЕСКИЕ СИСТЕМЫ  С И С Т Е М Ы К О Н Т Р О Л Я И У П Р А В Л Е Н И Я Д О С Т У П О М 59 Никита Андриянов Доцент кафедры искусственного интеллекта Финансового университета при Правительстве Российской Федерации Рис. 1. Структурная схема метрического распознавателя лиц О производительности и надежности распознавания лиц искусственным интеллектом Для решения задачи распознавания лиц сейчас практически везде применяются ней- росетевые технологии. В этой статье мы рассмотрим классическую схему работы метрических систем распознавания лиц и State of the Art (SotA) – так называемые передовые технологии, представим сравнение современных алгоритмов обнаруже- ния и распознавания лиц, выявим потенциальные опасности, заключающиеся в про- ведении визуальных атак на системы распознавания лиц, и расскажем про возмож- ности борьбы с ними. Два основных бенчмарка для работы с изображениями лиц, имеющиеся в свободном доступе, дополнят нашу картину Модель Производительность (кадров в секунду, FPS) Accuracy (доля верных ответов), % FaceNet (PyTorch) 14,5 99,65 OpenFace (TensorFlow) 6,8 93,80 GhostFaceNet (TensorFlow) 4,4 99,68 VGG-Face (TensorFlow) 1,38 98,78 ArcFave (TensorFlow) 2,9 99,41 Таблица 1. Сравнение распознавателей лиц

RkJQdWJsaXNoZXIy Mzk4NzYw