Мультимодальные биометрические системы аутентификации

Мультимодальные биометрические системы аутентификации — один из способов улучшения точности распознавания в биометрии. Основная идея заключается в комбинировании нескольких методов унимодальной аутентификации для уменьшения количества ошибок.

Введение

Биометрия является одним из способов распознавания людей по физическим или поведенческим особенностям^[1]. Данная область нашла своё применение в системах аутентификации и поиска людей (например, преступника по отпечаткам пальцев). В данной статье будет рассматриваться только первая область использования. Преимущество данного подхода по сравнению с классическими ключами и паролям состоит в том, что эти особенности нельзя потерять или забыть. А также их достаточно сложно подделать.

Различают два вида биометрических систем аутентификации: унимодальные — те, которые используют только одну особенность человека, и мультимодальные — использующие комбинацию унимодальных. В ходе различных исследований^[2] ^[3] было показано, что использование мультимодальных методов аутентификации позволяет увеличить точность работы биометрических систем аутентификации^[4] ^[5] ^[6].

Общая постановка задачи мультимодальной аутентификации

Задача мультимодальной аутентификации состоит из нескольких этапов:

Получить результаты из отдельных систем.
Произвести нормализацию этих результатов.
Осуществить процедуру слияния^[6] нормированных составляющих.

Таким образом, получается результат, который имеет такой же вид, как если бы производилась унимодальная аутентификация. При этом он содержит в себе информацию от всех составных частей мультимодальной модели.

Первым этап не является сложным в реализации, так как аутентификацию по отдельным системам можно производить одновременно. Например, можно просить пользователя одновременно зафиксировать палец на сканере отпечатков и произвести сканирование сетчатки глаза. Дальнейшие шаги же выполняются внутри общей системы.

Данный подход позволяет значительно увеличить уровень безопасности систем аутентификации^[7]. В нем используется уже не одна характеристика человека, а несколько, что усложняет задачу подделки биометрических данных. Также существенным является то, что такие системы не только с большей точностью выявляют злоумышленников, но и имеют меньшее количество отказов для зарегистрированных пользователей (то есть более высокий True Positive Rate). Данное качество позволяет в значительной степени повысить качество решений в сфере аутентификации.

Способы нормализации

Необходимость этой части обусловлена тем, что при слиянии обычно происходит суммирование (часто с весами) результатов работы унимодальных методов аутентификации. Они представляют собой числа, которые при нормировке в шкалу [0, 1] интерпретируются как вероятность того, что пользователь имеет запрашиваемый им доступ. Таким образом, необходимо стандартизировать их перед слиянием, чтобы эффективно произвести процедуру слияния^[8].

Min-Max

Данный метод позволяет отобразить сырые оценки на отрезок $[0, 1]$ . При этом преобразование сохраняет форму исходного распределения. $m i n (S)$ и $m a x (S)$ являются граничными значениями для модели $S$ , должны поставляться поставщиком соответствующей унимодальной системы. Формула имеет вид:

$n = \frac{s - m i n (S)}{m a x (S) - m i n (S)}$ , $n \in [0, 1]$ .

Z-score

Данный метод приводит значения к распределению со средним равным нулю и среднеквадратичным отклонением равным единице. Если значения исходного распределения известны, то это позволяет без каких-либо проблем использовать данный метод. Однако если этой информации нет, то можно посчитать их с помощью обучающей выборки, которую мы используем для обучения нашей модели. Данное решение может быть не оптимальным, если в выборке присутствуют выбросы, так как получается смещённая оценка^[8]. Метод описывается следующим выражением:

$n = \frac{s - m e a n (S)}{s t d (S)}$ , где $m e a n (n) = 0$ , $s t d (n) = 1$ .

Tanh

Данный метод относят к так называемым надёжным статистическим методам^[9]^[10]. В отличие от описанного выше подхода устойчив к выбросам и большим хвостам распределения, что делает его более сильным и надёжным инструментом нормализации. Формула имеет вид: $n = \frac{1}{2} * (t a n h (0.01 * \frac{s - m e a n (S)}{s t d (S)}) + 1)$

Адаптивная нормализация

Шаблон:Внешние медиафайлыОшибки аутентификации обусловлены тем, что истинное распределения и распределения самозванца перекрываются^[11]. Данная область перекрытия описывается двумя характеристиками: центром $c$ и шириной $w$ . Основная идея данного подхода нормализации — увеличить различия между двумя этими распределениями путём уменьшения этого перекрытия, что позволит уменьшить вероятность ошибок.

Общий вид всех методов адаптивной нормализации:

$n_{A D} = f (n_{M M})$ , где $n_{M M}$ − результат нормализации методом Min-Max, а $f$ функиция отображения.

Существует несколько видов функций отображения для адаптивной нормализации, которые будут описаны ниже.

Шаблон:Внешние медиафайлы

Two-Quadrics^[12]

Представляет собой функцию, вторая производная которой меняет знак в точке $c$ .

$n_{A D} = {\begin{matrix} \frac{1}{c} * n_{M M}^{2}, n_{M M} < c \\ c + \sqrt{(1 - c) (n_{M M} - c)}, n_{M M} > c \end{matrix}$

Logistic

По форме график функции схож с графиком функции Two-Quadrics.

$n_{A D} = \frac{1}{1 + A * e^{- B * n_{M M}}}$ , где $A = \frac{1}{d} - 1$ , $B = \frac{l n (A)}{c} - 1$ .В выражениях для $A$ и $B$ символ $d$ обозначает константу, которая выбирается чаще всего малым числом (часто значением 0.01). При этом легко видеть, что $f (0) = d$ .

Quadric-Line-Quadric^[13]

В данном случае зона перекрытия остаётся неизменной (на графике это видно по линейному участку в центре). За её пределами используется Two-Quadrics функция отображения.

$n_{A D} = {\begin{matrix} \frac{1}{c - \frac{w}{2}} * n_{M M}^{2}, n_{M M} < (c - \frac{w}{2}) \\ n_{M M}, (c - \frac{w}{2}) < n_{M M} < (c + \frac{w}{2}) \\ (c + \frac{w}{2}) + \sqrt{(1 - c - \frac{w}{2}) (n_{M M} - c - \frac{w}{2})}, n_{M M} > (c + \frac{w}{2}) \end{matrix}$

Способы слияния (fusion)

После того, как результаты работы отдельных алгоритмов аутентификации прошли через процесс нормировки, необходимо объединить их^[14]. Для этого существует ряд способов слияния. Первые три из перечисленных далее являются классическими. Последние два более сложные за счёт того, что они используют логику того, что какие-то методы аутентификации являются более важными, а какие-то менее важными.

Введём обозначения для дальнейших определений. Пусть $n_{i}^{m}$ — нормализованный выход метода $m$ ( $m = 1, 2, ..., M$ ) для пользователя $i$ ( $i = 1, 2, ..., I$ ). В данном случае $M$ — число унимодальных методов, используемых в мультиимодальном, а $I$ — число пользователей в базе данных.

Simple Sum^[15]

Простое суммирование для пользователя нормализованных результатов всех аутентификаторов.

$f_{i} = \sum_{m = 1}^{M} n_{i}^{m}$

Min Score^[16]

Выбирает минимум среди всех нормализованных результатов аутентификатора для данного пользователя.

$f_{i} = m i n (n_{i}^{1}, n_{i}^{2}, ..., n_{i}^{M})$

Max Score^[16]

Выбирает максимум среди всех нормализованных результатов аутентификатора для данного пользователя.

$f_{i} = m a x (n_{i}^{1}, n_{i}^{2}, ..., n_{i}^{M})$

Matcher Weighting^[17]

Данный метод слияния основан на использовании Equal Error Rate^[18] (EER). Эта функция ошибки делает оценку ROC-кривой. Обозначим EER для метода $m$ как $e^{m}$ $(m = 1, 2, ..., M)$ . Тогда весом для метода $m$ будет $w^{m}$ .

$w_{m} = \frac{1}{\sum_{m = 1}^{M} \frac{1}{e^{m}}} * \frac{1}{e^{m}}$

При этом из формулы ясно, что для всех $m$ верно $0$ ≤ $w^{m}$ ≤ $1$ , а также, что $\sum_{m = 1}^{M} w^{m} = 1$ . Важным моментом является ещё и то, что чем выше значение ошибки $e^{m}$ , тем ниже соответствующий весовой коэффициент $w^{m}$ . Таким образом, более точные методы, будут вносить больший вклад в финальную оценку.

Финальная формула имеет вид:

$f_{i} = \sum_{m = 1}^{M} w^{m} * n_{i}^{m}$

User Weighting^[17]

Данный метод отличается от предыдущего тем, что мы производим взвешивание методов для каждого пользователя индивидуально. Изначально этот способ слияния был более сложным с точки зрения вычислений^[19]. Позднее на его основе была предложена схема, уменьшающая число операций, которая и будет описана в этом разделе.

Обозначим вес для метода $m$ для пользователя $i$ как $w_{i}^{m}$ .

Рассмотри более детально, как вычислить искомы вес $w_{i}^{m}$ . Данный способ слияния берёт за основу концепцию волка-овцы^[20]. Обозначим за овец пользователей, данные которых могут быть легко подделаны. Волками напротив обозначим пользователей, которые легко имитируют других клиентов. Как волки, так и овцы уменьшают эффективность работы процесса аутентификации, так как обе эти группы приводят к ложным срабатываниям.

Для того, чтобы использовать данный подход для мультимодального случая, необходимо ввести метрику lambness для каждой пары $(i, m)$ . Она показывает, насколько пользователь $i$ является овцой в рамках метода $m$ При её подсчёте предполагается, что параметры среднего и стандартного отклонения для подлинного распределения и распределения самозванцев известны. Для получения lambness происходит вычисление d-prime метрики^[21], которая показывает, насколько различимы два распределения (в нашем случае истинное и поддельное). Обозначим для пары пользователь-метод $(i, m)$ среднее и стандартное отклонения подлинного распределения как $μ_{i, g e n}^{m}, σ_{i, g e n}^{m}$ , для поддельного $μ_{i, n}^{m}, σ_{i, n}^{m}$ соответственно. В данном случае индексы gen и imp обозначают genuine и impostor соответственно. $d_{i}^{m} = \frac{μ_{i, p}^{m} - μ_{i, n}^{m}}{\sqrt{σ_{i, p}^{m} - σ_{i, n}^{m}}}$ .

При этом легко видеть, что чем меньше значение $d_{i}^{m}$ , тем в большей степени пользователь является овцой для некоторых волков. Это обусловленно тем, что в данном случае наблюдается сильное перекрытие распределений.

И, наконец, все готово для подсчёта весов для пользователя $i$ :

$w_{i}^{m} = \frac{1}{\sum_{m = 1}^{M} d_{i}^{m}} * d_{i}^{m}$ .

Формула слияния с полученными весами имеет вид:

$f_{i} = \sum_{m = 1}^{M} w_{i}^{m} * n_{i}^{m}$

Комбинирование методов

В ходе исследований^[22]^[23] мультимодальных систем аутентификации было показано, что использование комбинации нескольких методов превосходят по качеству работы унимодальные системы. Причем прирост достигается даже при комбинировании с топовыми унимодальными системами. В некоторых случаях это может помочь снизить стоимость итоговой архитектуры за счет использования простых методов.

Также было показано^[17], что в приложениях, где происходит постоянный приток новых людей (например, аэропорты), наиболее подходящая комбинация — это нормализация Min-Max и слияние Simple Sum. Если же работа происходит с ограниченным кругом лиц (например, лаборатория или офис), то наилучшая комбинация — это адаптивная нормализация Quadric-Line-Quadric и слияние User Weighting. Основная причина разницы результатов для двух случаев в том, что при работе с одними и теми же пользователями происходит постоянное повторение съёмов биометрических данных, что позволяет собирать их и аккумулировать в алгоритмы. Аналогичные результаты были получены также и в других исследованиях^[24]^[25]. Описанные случаи являются исчерпывающими и описывают все возможные примеры использования систем аутентификации.

При решении прикладных задач стоит стоит пробовать различные комбинации методов создания мультимодалных систем. Это обусловленно тем, что из-за различий в том, какие унимодальные методы используются, какая аппаратура осуществляет аутентификацию и каких образом происходил сбор данных для обучения мультимодальной системы, результаты могут сильно отличаться от представленных в различных исследованиях. Однако в качестве базового решения стоит в первую очередь пробовать именно описанные выше.

Примечания

Шаблон:Примечания

[1] Шаблон:Статья

[2] Шаблон:Статья

[3] Шаблон:Статья

[4] Шаблон:Статья

[5] Шаблон:Статья

[:2-6] 6,0 ^6,1 Шаблон:Статья

[7] Шаблон:Статья

[:3-8] 8,0 ^8,1 Шаблон:Статья

[9] Шаблон:Статья

[10] Шаблон:Статья

[11] Шаблон:Статья

[12] Шаблон:Статья

[13] Шаблон:Статья

[14] Шаблон:Статья

[15] Шаблон:Статья

[:0-16] 16,0 ^16,1 Шаблон:Статья

[:1-17] 17,0 ^17,1 ^17,2 Шаблон:Статья

[18] Шаблон:Статья

[19] Шаблон:Статья

[20] Шаблон:Статья

[21] Шаблон:Статья

[22] Шаблон:Статья

[23] Шаблон:Статья

[24] Шаблон:Статья

[25] Шаблон:Статья

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

Мультимодальные биометрические системы аутентификации

Содержание

Введение

Общая постановка задачи мультимодальной аутентификации

Способы нормализации

Min-Max

Z-score

Tanh

Адаптивная нормализация

Two-Quadrics^[12]

Logistic

Quadric-Line-Quadric^[13]

Способы слияния (fusion)

Simple Sum^[15]

Min Score^[16]

Max Score^[16]

Matcher Weighting^[17]

User Weighting^[17]

Комбинирование методов

Примечания

Навигация

Мультимодальные биометрические системы аутентификации

Введение

Общая постановка задачи мультимодальной аутентификации

Способы нормализации

Min-Max

Z-score

Tanh

Адаптивная нормализация

Two-Quadrics[12]

Logistic

Quadric-Line-Quadric[13]

Способы слияния (fusion)

Simple Sum[15]

Min Score[16]

Max Score[16]

Matcher Weighting[17]

User Weighting[17]

Комбинирование методов

Примечания

Навигация

Поиск

Two-Quadrics^[12]

Quadric-Line-Quadric^[13]

Simple Sum^[15]

Min Score^[16]

Max Score^[16]

Matcher Weighting^[17]

User Weighting^[17]