Журнал "Information Security/ Информационная безопасность" #5, 2020

В Сбербанке реализована эшелони- рованная защита всех онлайн-услуг, которая включает в себя ряд защитных механизмов: подтверждение критичных операций одноразовыми паролями, шифрование трафика и др. Одним из ключевых элементов этой защиты является система фрод-мониторинга для выявления и предотвращения мошен- ничества. В системе фрод-мониторинга Сбер- банка используется целый ряд моделей на основе машинного обучения (ML- моделей), направленных на противодей- ствие различным аспектам кибермо- шенничества – выявление мошенниче- ских транзакций и групп, а также сово- купности этих моделей, что позволяет удерживать уровень мошеннических опе- раций на минимальных показателях при постоянном росте транзакционной актив- ности и появлении новых продуктов и услуг. Вместе с тем мы в Сбербанке посто- янно ищем пути повышения эффектив- ности фрод-мониторинга, анализируем достижения в различных областях Data Science на предмет их применимости. Почему графы? Для банка в целом и для задачи про- тиводействия мошенничеству в частно- сти важно хорошо знать своих клиентов. Наряду с социально-демографическими признаками, оборотами и покупками клиентов не менее важную роль играют финансовые взаимодействия людей. Последнее – не что иное, как граф, где вершинами выступают клиенты (или внешние по отношению к банку рекви- зиты), а ребра между вершинами – это финансовые транзакции. Используя такой граф, можно получить много важной дополнительной информации для системы фрод-мониторинга. В моделях фрод-мони- торинга Сбербанка мы уже давно используем графовые данные, напри- мер графовые характери- стики вершин и ребер (степени, общее число соседей между вершина- ми), пути между верши- нами и т.д. Однако созда- ние эвристик на графах требует привлечения фрод-аналитиков, что является очень затратным по времени. Обычно эври- стики носят локальный характер – затрагивают вершину и бли- жайшее ее окружение (см. рис. 1). Также расчет эвристик более высоких порядков и длин путей в моделях real-time на объемах банка невозможен (~12 000 транзакций в секунду со временем SLA <100 мс). Поэтому необходим механизм, который позволял бы извлекать инфор- мацию из структуры графа автоматиче- ски и использовать ее для моделей фрод-мониторинга. Машинное обучение на графах Зачастую для извлечения структурной информации из графов и передачи в тра- диционные ML-модели (регрессии, деревья решений и пр.) используется набор статистических данных, описы- вающих граф, kernel-функции для гра- фов или разработанные аналитиками признаки. Ограничения такого подхода заключаются в том, что разработанные признаки не адаптируются под имею- щиеся данные во время обучения, а соз- дание новых признаков требует много времени. В настоящее время разработано мно- жество алгоритмов, направленных на обучение представлений (Representation Learning) графов. Суть Representation Learning – закодировать структурную информацию о графе в пространство меньшей размерности (так называемый embedding), например представить вер- шины графа или целиком граф (подгра- фы) как точки в новом графе. При этом цель алгоритма/модели – чтобы в полу- чившемся пространстве геометрические соотношения отражали структуру исход- ного графа, например близкие вершины в пространстве были также близки (свя- заны ребром, имели небольшой крат- чайший путь) в графе. Ключевое отличие подходов Repre- sentation Learning от традиционных состоит в том, что последние самостоя- 42 • ТЕХНОЛОГИИ Graph Representation Learning как способ повышения эффективности противодействия мошенничеству нтернет и онлайн-услуги проникли во все отрасли нашей жизни. Банковская сфера – не исключение. Через удаленные каналы можно оплатить покупку или открыть вклад, получить кредит без визита в офис банка или совершить перевод через чат-бота в мессенджере. Однако вместе с распространением новых платежных инструментов растет и интерес мошенников к этим сервисам. И Андрей Пинчук, исполнительный директор, начальник Отдела аналитической экспертизы Сбербанка Рис. 1. Популярные эвристики для предсказания возникновения связи в графе (Г(x) – вершины - соседи) 1 1 . https://www.researchgate.net/publication/318916726_Weisfeiler-Lehman_Neural_Machine_for_Link_Prediction

RkJQdWJsaXNoZXIy Mzk4NzYw