Мультимодальные биометрические системы аутентификации
Мультимодальные биометрические системы аутентификации — один из способов улучшения точности распознавания в биометрии. Основная идея заключается в комбинировании нескольких методов унимодальной аутентификации для уменьшения количества ошибок.
Введение
Биометрия является одним из способов распознавания людей по физическим или поведенческим особенностям[1]. Данная область нашла своё применение в системах аутентификации и поиска людей (например, преступника по отпечаткам пальцев). В данной статье будет рассматриваться только первая область использования. Преимущество данного подхода по сравнению с классическими ключами и паролям состоит в том, что эти особенности нельзя потерять или забыть. А также их достаточно сложно подделать.
Различают два вида биометрических систем аутентификации: унимодальные — те, которые используют только одну особенность человека, и мультимодальные — использующие комбинацию унимодальных. В ходе различных исследований[2] [3] было показано, что использование мультимодальных методов аутентификации позволяет увеличить точность работы биометрических систем аутентификации[4] [5] [6].
Общая постановка задачи мультимодальной аутентификации
Задача мультимодальной аутентификации состоит из нескольких этапов:
- Получить результаты из отдельных систем.
- Произвести нормализацию этих результатов.
- Осуществить процедуру слияния[6] нормированных составляющих.
Таким образом, получается результат, который имеет такой же вид, как если бы производилась унимодальная аутентификация. При этом он содержит в себе информацию от всех составных частей мультимодальной модели.
Первым этап не является сложным в реализации, так как аутентификацию по отдельным системам можно производить одновременно. Например, можно просить пользователя одновременно зафиксировать палец на сканере отпечатков и произвести сканирование сетчатки глаза. Дальнейшие шаги же выполняются внутри общей системы.
Данный подход позволяет значительно увеличить уровень безопасности систем аутентификации[7]. В нем используется уже не одна характеристика человека, а несколько, что усложняет задачу подделки биометрических данных. Также существенным является то, что такие системы не только с большей точностью выявляют злоумышленников, но и имеют меньшее количество отказов для зарегистрированных пользователей (то есть более высокий True Positive Rate). Данное качество позволяет в значительной степени повысить качество решений в сфере аутентификации.
Способы нормализации
Необходимость этой части обусловлена тем, что при слиянии обычно происходит суммирование (часто с весами) результатов работы унимодальных методов аутентификации. Они представляют собой числа, которые при нормировке в шкалу [0, 1] интерпретируются как вероятность того, что пользователь имеет запрашиваемый им доступ. Таким образом, необходимо стандартизировать их перед слиянием, чтобы эффективно произвести процедуру слияния[8].
Min-Max
Данный метод позволяет отобразить сырые оценки на отрезок . При этом преобразование сохраняет форму исходного распределения. и являются граничными значениями для модели , должны поставляться поставщиком соответствующей унимодальной системы. Формула имеет вид:
, .
Z-score
Данный метод приводит значения к распределению со средним равным нулю и среднеквадратичным отклонением равным единице. Если значения исходного распределения известны, то это позволяет без каких-либо проблем использовать данный метод. Однако если этой информации нет, то можно посчитать их с помощью обучающей выборки, которую мы используем для обучения нашей модели. Данное решение может быть не оптимальным, если в выборке присутствуют выбросы, так как получается смещённая оценка[8]. Метод описывается следующим выражением:
, где , .
Tanh
Данный метод относят к так называемым надёжным статистическим методам[9][10]. В отличие от описанного выше подхода устойчив к выбросам и большим хвостам распределения, что делает его более сильным и надёжным инструментом нормализации. Формула имеет вид:
Адаптивная нормализация
Шаблон:Внешние медиафайлыОшибки аутентификации обусловлены тем, что истинное распределения и распределения самозванца перекрываются[11]. Данная область перекрытия описывается двумя характеристиками: центром и шириной . Основная идея данного подхода нормализации — увеличить различия между двумя этими распределениями путём уменьшения этого перекрытия, что позволит уменьшить вероятность ошибок.
Общий вид всех методов адаптивной нормализации:
, где − результат нормализации методом Min-Max, а функиция отображения.
Существует несколько видов функций отображения для адаптивной нормализации, которые будут описаны ниже.
Two-Quadrics[12]
Представляет собой функцию, вторая производная которой меняет знак в точке .
Logistic
По форме график функции схож с графиком функции Two-Quadrics.
, где , .В выражениях для и символ обозначает константу, которая выбирается чаще всего малым числом (часто значением 0.01). При этом легко видеть, что .
Quadric-Line-Quadric[13]
В данном случае зона перекрытия остаётся неизменной (на графике это видно по линейному участку в центре). За её пределами используется Two-Quadrics функция отображения.
Способы слияния (fusion)
После того, как результаты работы отдельных алгоритмов аутентификации прошли через процесс нормировки, необходимо объединить их[14]. Для этого существует ряд способов слияния. Первые три из перечисленных далее являются классическими. Последние два более сложные за счёт того, что они используют логику того, что какие-то методы аутентификации являются более важными, а какие-то менее важными.
Введём обозначения для дальнейших определений. Пусть — нормализованный выход метода () для пользователя (). В данном случае — число унимодальных методов, используемых в мультиимодальном, а — число пользователей в базе данных.
Simple Sum[15]
Простое суммирование для пользователя нормализованных результатов всех аутентификаторов.
Min Score[16]
Выбирает минимум среди всех нормализованных результатов аутентификатора для данного пользователя.
Max Score[16]
Выбирает максимум среди всех нормализованных результатов аутентификатора для данного пользователя.
Matcher Weighting[17]
Данный метод слияния основан на использовании Equal Error Rate[18] (EER). Эта функция ошибки делает оценку ROC-кривой. Обозначим EER для метода как . Тогда весом для метода будет .
При этом из формулы ясно, что для всех верно ≤ ≤ , а также, что . Важным моментом является ещё и то, что чем выше значение ошибки , тем ниже соответствующий весовой коэффициент . Таким образом, более точные методы, будут вносить больший вклад в финальную оценку.
Финальная формула имеет вид:
User Weighting[17]
Данный метод отличается от предыдущего тем, что мы производим взвешивание методов для каждого пользователя индивидуально. Изначально этот способ слияния был более сложным с точки зрения вычислений[19]. Позднее на его основе была предложена схема, уменьшающая число операций, которая и будет описана в этом разделе.
Обозначим вес для метода для пользователя как .
Рассмотри более детально, как вычислить искомы вес . Данный способ слияния берёт за основу концепцию волка-овцы[20]. Обозначим за овец пользователей, данные которых могут быть легко подделаны. Волками напротив обозначим пользователей, которые легко имитируют других клиентов. Как волки, так и овцы уменьшают эффективность работы процесса аутентификации, так как обе эти группы приводят к ложным срабатываниям.
Для того, чтобы использовать данный подход для мультимодального случая, необходимо ввести метрику lambness для каждой пары . Она показывает, насколько пользователь является овцой в рамках метода При её подсчёте предполагается, что параметры среднего и стандартного отклонения для подлинного распределения и распределения самозванцев известны. Для получения lambness происходит вычисление d-prime метрики[21], которая показывает, насколько различимы два распределения (в нашем случае истинное и поддельное). Обозначим для пары пользователь-метод среднее и стандартное отклонения подлинного распределения как , для поддельного соответственно. В данном случае индексы gen и imp обозначают genuine и impostor соответственно. .
При этом легко видеть, что чем меньше значение , тем в большей степени пользователь является овцой для некоторых волков. Это обусловленно тем, что в данном случае наблюдается сильное перекрытие распределений.
И, наконец, все готово для подсчёта весов для пользователя :
.
Формула слияния с полученными весами имеет вид:
Комбинирование методов
В ходе исследований[22][23] мультимодальных систем аутентификации было показано, что использование комбинации нескольких методов превосходят по качеству работы унимодальные системы. Причем прирост достигается даже при комбинировании с топовыми унимодальными системами. В некоторых случаях это может помочь снизить стоимость итоговой архитектуры за счет использования простых методов.
Также было показано[17], что в приложениях, где происходит постоянный приток новых людей (например, аэропорты), наиболее подходящая комбинация — это нормализация Min-Max и слияние Simple Sum. Если же работа происходит с ограниченным кругом лиц (например, лаборатория или офис), то наилучшая комбинация — это адаптивная нормализация Quadric-Line-Quadric и слияние User Weighting. Основная причина разницы результатов для двух случаев в том, что при работе с одними и теми же пользователями происходит постоянное повторение съёмов биометрических данных, что позволяет собирать их и аккумулировать в алгоритмы. Аналогичные результаты были получены также и в других исследованиях[24][25]. Описанные случаи являются исчерпывающими и описывают все возможные примеры использования систем аутентификации.
При решении прикладных задач стоит стоит пробовать различные комбинации методов создания мультимодалных систем. Это обусловленно тем, что из-за различий в том, какие унимодальные методы используются, какая аппаратура осуществляет аутентификацию и каких образом происходил сбор данных для обучения мультимодальной системы, результаты могут сильно отличаться от представленных в различных исследованиях. Однако в качестве базового решения стоит в первую очередь пробовать именно описанные выше.
Примечания
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ 6,0 6,1 Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ 8,0 8,1 Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ 16,0 16,1 Шаблон:Статья
- ↑ 17,0 17,1 17,2 Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья
- ↑ Шаблон:Статья