Журнал "Системы Безопасности" № 5‘2023

Ц И Ф Р О В А Я Т Р А Н С Ф О Р М А Ц И Я , И И , И Н Т Е Р Н Е Т В Е Щ Е Й 20 в форме двух облаков над ними, отображаю- щих нестабильность (размытость) каждого био- метрического образа. Очевидным также является то, что каждому примеру образа "свой" сверточная нейронная сеть будет ставить в соответствие 20 коротких векторов обогащенных данных. При организа- ции поиска и тестирования на компьютере нет смысла хранить реальные примеры изображе- ний лица, вместо них удобнее хранить их короткие векторы уже обогащенных биометри- ческих данных. Это обеспечивает существенное уменьшение объема требуемой памяти и, соот- ветственно, ускорение тестирования [7, 8]. Следует отметить, что морфинг двух лиц – давно используемая вычислительная процеду- ра. Обычно ее применяют художники. Для этой цели художник вручную задает одинаковые точки на лицах, а далее компьютер создает про- межуточные состояния между двумя лицами. Формально каждый программный продукт при поиске лиц на изображении выделяет некото- рые точки на лице (см. рис. 1), опираясь на которые может быть построен морфинг (муль- тик) промежуточных вариантов между двумя связываемыми между собой лицами. в рассматриваемом нами случае нет необходи- мости в обычном морфинге, так как мы имеем короткие векторы обогащенных данных. в соот- ветствии с гОСТ Р 52633.2 [5] для скрещивания двух векторов от двух изображений двух раз- ных лиц и получения векторов одного образа- потомка достаточно выполнить операцию усреднения одинаковых параметров. Послед- нее отображено третьим облаком векторов на рис. 2, для которого можно восстановить при- меры, однако в этом нет необходимости. Создать первоначальную тестовую базу из 1 тыс. лиц студентов (сотрудников) посильно для любого университета (предприятия). Если процедура получения синтетических векторов будет построена на получении одного образа- потомка от двух образов-родителей, то удастся увеличить тестовую базу до 0,5 млн образов. При получении от двух образов-родителей двух образов-потомков мы увеличиваем объем тестовой базы до 1 млн образов лиц людей. Этого вполне достаточно для организации при любом отечественном университете испыта- тельной лаборатории. Такая лаборатория может занять ту же позицию, что и NIST, не предостав- ляя доступ сторонним пользователям к своей тестовой базе. Проблема практически полного отсутствия информации о статистиках тестовых баз Позволить себе почти ничего не сообщать о ста- тистиках используемых тестовых баз реальных биометрических образов могут далеко не все. То, что дозволено NIST, никому иному не позво- лено. Если развитие тестирования пойдет по пути создания множества испытательных лабо- раторий разных предприятий, то предприятиям придется сообщать о статистических характери- стиках своих тестовых баз. не вдаваясь в содер- жание статистик, рискнем назвать только неко- торые их параметры. 1. Число естественных биометрических обра- зов, собранных по гОСТ Р 52633.1 [6]. 2. Число добавленных синтетических образов, созданных по гОСТ Р 52633.2 [5]. 3. Средняя вероятность ошибок второго рода – P 2 для среднестатистического образа лица по базе естественных образов. 4. вероятность ошибок второго рода для наи- худших по стойкости 3% лиц по базе естествен- ных биометрических образов. 5. вероятность ошибок второго рода для наи- лучших по стойкости 3% лиц по базе естествен- ных биометрических образов. необходимость в опубликовании такого типа статистик позволяет заказчику тестирования ориентироваться на качество собранных в той или иной базе тестовых образов. Подобные характеристики не сложно вычислить, фор- мально они должны быть заложены в открытом коде тестирования и стандарте по тестированию (если таковые будут созданы). По крайней мере, опубликование даже этих статистических характеристик должно суще- ственно ограничить возможные манипуляции со стороны испытательных лабораторий. Почему необходим контроль не только за ком- мерческими продуктами проверки качества работы нейросетевых приложений, но и за испытательными лабораториями? Ответ на этот вопрос прост: необходимо исключить возмож- ность злоупотреблений (субъективности) со стороны испытательных лабораторий. Если испытательная лаборатория ничего не говорит о статистиках своих тестовых баз и не предо- ставляет эти базы подавшему заявку на испыта- ние, то возможны злоупотребления. Если лабо- ратория хочет улучшить статистики проверяе- мого продукта, то ей достаточно ухудшить ста- бильность биометрических характеристик тестовых баз. верно и обратное: повышение стабильности биометрических параметров среднестатистического биометрического образа будет обязательно приводить к улучшению вероятностных характеристик проверяемого продукта. Заключение авторы данной статьи уверены в том, что соз- дание открытого кода для тестирования каче- ства работы нейросетевых приложений являет- ся вполне посильной задачей для отечественно- го научно-технического сообщества, однако до того или параллельно с этим нужен отечествен- ный стандарт. в свою очередь, появление подобного программного обеспечения даст реальную возможность любой отечественной структуре развернуть под своим контролем испытательные лаборатории без компромета- ции конкретно используемых тестовых баз лиц реальных людей или иных образов. Задача разработки нейросетевых приложений искусственного интеллекта, включая его пред- варительное тестирование, и задача самостоя- тельного тестирования качества заказчиком работы того или иного коммерческого продукта должны быть разделены. При этом размер используемых тестовых баз реальных образов лиц не является технической проблемой. По крайней мере, это относится к России и Бело- руссии, где действует стандарт гОСТ Р 52633.2– 2010 [5]. Список литературы 1. николенко С., Кудрин а., архангельская Е. глубокое обучение. Погружение в мир нейро- нных сетей. СПб.: издат. дом. "Питер", 2018. 2. аггарвал Чару. нейронные сети и глубокое обучение. СПб.: Диалектика, 2020. 3. ПнСТ 835–2023 (ISO/IEC TS 4213:2022) гар- монизованный проект национального стандарта ТК 164. "искусственный интеллект. Оценка эффективности моделей и алгоритмов машин- ного обучения в задаче классификации". 4. гОСТ Р иСО/МЭК 19795–1–2007 "автома- тическая идентификация. идентификация био- метрическая. Эксплуатационные испытания и протоколы испытаний в биометрии. Часть 1. Принципы и структура". 5. гОСТ Р 52633.2–2010 "Защита информации. Техника защиты информации. Требования к формированию синтетических биометриче- ских образов, предназначенных для тестирова- ния средств высоконадежной биометрической аутентификации". 6. гОСТ Р 52633.12009 "Защита информации. Техника защиты информации. Требования к формированию баз естественных биометри- ческих образов, предназначенных для тестиро- вания средств высоконадежной биометриче- ской аутентификации". 7. Майоров а.в. Оценка стойкости защищен- ных нейросетевых преобразователей биомет- рия-код с использованием больших баз синте- тических биометрических образов // а.в. Майоров, С.а. Сомкин, а.П. Юнин, а.Ж. акмаев // известия высших учебных заведений. Поволжский регион. Технические науки. 2018. № 4. С. 65–74. 8. иванов а.и. искусственный интеллект высокого доверия. ускорение вычислений и экономия памяти при тестировании боль- ших сетей искусственных нейронов на малых выборках. // Системы безопасности. 2020. № 5. С. 60–62. n октябрь – ноябрь 2023 www.secuteck.ru СПЕЦПРОЕКТ РЕшЕния на ОСнОвЕ иСКуССТвЕннОгО инТЕллЕКТа Ваше мнение и вопросы по статье направляйте на ss @groteck.ru Д оверенное тестирование приложений искусственного интеллекта (ИИ) сегодня должно быть выполнено именно в нашей стране, доверен- ной испытательной лабораторией на доверенной базе тестовых биомет- рических образов. Когда речь идет о распознавании образов лиц людей, должны использоваться реальные базы, полученные не в иде- альных социальных сетях, а c реально работающих видеокамер охран- ной системы или от системы наблюдения с видеофиксацией. Нужен открытый код тестирования, соответствующий требованиям отече- ственных стандартов

RkJQdWJsaXNoZXIy Mzk4NzYw