Мультимодальные биометрические системы аутентификации

Материал из testwiki
Перейти к навигации Перейти к поиску

Мультимодальные биометрические системы аутентификации — один из способов улучшения точности распознавания в биометрии. Основная идея заключается в комбинировании нескольких методов унимодальной аутентификации для уменьшения количества ошибок.

Введение

Биометрия является одним из способов распознавания людей по физическим или поведенческим особенностям[1]. Данная область нашла своё применение в системах аутентификации и поиска людей (например, преступника по отпечаткам пальцев). В данной статье будет рассматриваться только первая область использования. Преимущество данного подхода по сравнению с классическими ключами и паролям состоит в том, что эти особенности нельзя потерять или забыть. А также их достаточно сложно подделать.

Различают два вида биометрических систем аутентификации: унимодальные — те, которые используют только одну особенность человека, и мультимодальные — использующие комбинацию унимодальных. В ходе различных исследований[2] [3] было показано, что использование мультимодальных методов аутентификации позволяет увеличить точность работы биометрических систем аутентификации[4] [5] [6].

Общая постановка задачи мультимодальной аутентификации

Задача мультимодальной аутентификации состоит из нескольких этапов:

  1. Получить результаты из отдельных систем.
  2. Произвести нормализацию этих результатов.
  3. Осуществить процедуру слияния[6] нормированных составляющих.

Таким образом, получается результат, который имеет такой же вид, как если бы производилась унимодальная аутентификация. При этом он содержит в себе информацию от всех составных частей мультимодальной модели.

Первым этап не является сложным в реализации, так как аутентификацию по отдельным системам можно производить одновременно. Например, можно просить пользователя одновременно зафиксировать палец на сканере отпечатков и произвести сканирование сетчатки глаза. Дальнейшие шаги же выполняются внутри общей системы.

Данный подход позволяет значительно увеличить уровень безопасности систем аутентификации[7]. В нем используется уже не одна характеристика человека, а несколько, что усложняет задачу подделки биометрических данных. Также существенным является то, что такие системы не только с большей точностью выявляют злоумышленников, но и имеют меньшее количество отказов для зарегистрированных пользователей (то есть более высокий True Positive Rate). Данное качество позволяет в значительной степени повысить качество решений в сфере аутентификации.

Способы нормализации

Необходимость этой части обусловлена тем, что при слиянии обычно происходит суммирование (часто с весами) результатов работы унимодальных методов аутентификации. Они представляют собой числа, которые при нормировке в шкалу [0, 1] интерпретируются как вероятность того, что пользователь имеет запрашиваемый им доступ. Таким образом, необходимо стандартизировать их перед слиянием, чтобы эффективно произвести процедуру слияния[8].

Min-Max

Данный метод позволяет отобразить сырые оценки на отрезок [0,1]. При этом преобразование сохраняет форму исходного распределения. min(S) и max(S) являются граничными значениями для модели S, должны поставляться поставщиком соответствующей унимодальной системы. Формула имеет вид:

n=smin(S)max(S)min(S), n[0,1].

Z-score

Данный метод приводит значения к распределению со средним равным нулю и среднеквадратичным отклонением равным единице. Если значения исходного распределения известны, то это позволяет без каких-либо проблем использовать данный метод. Однако если этой информации нет, то можно посчитать их с помощью обучающей выборки, которую мы используем для обучения нашей модели. Данное решение может быть не оптимальным, если в выборке присутствуют выбросы, так как получается смещённая оценка[8]. Метод описывается следующим выражением:

n=smean(S)std(S), где mean(n)=0, std(n)=1.

Tanh

Данный метод относят к так называемым надёжным статистическим методам[9][10]. В отличие от описанного выше подхода устойчив к выбросам и большим хвостам распределения, что делает его более сильным и надёжным инструментом нормализации. Формула имеет вид:n=12*(tanh(0.01*smean(S)std(S))+1)

Адаптивная нормализация

Шаблон:Внешние медиафайлыОшибки аутентификации обусловлены тем, что истинное распределения и распределения самозванца перекрываются[11]. Данная область перекрытия описывается двумя характеристиками: центром c и шириной w. Основная идея данного подхода нормализации — увеличить различия между двумя этими распределениями путём уменьшения этого перекрытия, что позволит уменьшить вероятность ошибок.

Общий вид всех методов адаптивной нормализации:

nAD=f(nMM), где nMM − результат нормализации методом Min-Max, а f функиция отображения.

Существует несколько видов функций отображения для адаптивной нормализации, которые будут описаны ниже.


Шаблон:Внешние медиафайлы

Two-Quadrics[12]

Представляет собой функцию, вторая производная которой меняет знак в точке c.

nAD={1c*nMM2,nMM<cc+(1c)(nMMc),nMM>c


Logistic

По форме график функции схож с графиком функции Two-Quadrics.

nAD=11+A*eB*nMM, где A=1d1, B=ln(A)c1.В выражениях для A и B символ d обозначает константу, которая выбирается чаще всего малым числом (часто значением 0.01). При этом легко видеть, что f(0)=d.

Quadric-Line-Quadric[13]

В данном случае зона перекрытия остаётся неизменной (на графике это видно по линейному участку в центре). За её пределами используется Two-Quadrics функция отображения.

nAD={1cw2*nMM2,nMM<(cw2)nMM,(cw2)<nMM<(c+w2)(c+w2)+(1cw2)(nMMcw2),nMM>(c+w2)

Способы слияния (fusion)

После того, как результаты работы отдельных алгоритмов аутентификации прошли через процесс нормировки, необходимо объединить их[14]. Для этого существует ряд способов слияния. Первые три из перечисленных далее являются классическими. Последние два более сложные за счёт того, что они используют логику того, что какие-то методы аутентификации являются более важными, а какие-то менее важными.

Введём обозначения для дальнейших определений. Пусть nim — нормализованный выход метода m (m=1,2,...,M) для пользователя i (i=1,2,...,I). В данном случае M — число унимодальных методов, используемых в мультиимодальном, а I — число пользователей в базе данных.

Simple Sum[15]

Простое суммирование для пользователя нормализованных результатов всех аутентификаторов.

fi=m=1Mnim

Min Score[16]

Выбирает минимум среди всех нормализованных результатов аутентификатора для данного пользователя.

fi=min(ni1,ni2,...,niM)

Max Score[16]

Выбирает максимум среди всех нормализованных результатов аутентификатора для данного пользователя.

fi=max(ni1,ni2,...,niM)

Matcher Weighting[17]

Данный метод слияния основан на использовании Equal Error Rate[18] (EER). Эта функция ошибки делает оценку ROC-кривой. Обозначим EER для метода m как em (m=1,2,...,M). Тогда весом для метода m будет wm.

wm=1m=1M1em*1em

При этом из формулы ясно, что для всех m верно 0wm1, а также, что m=1Mwm=1. Важным моментом является ещё и то, что чем выше значение ошибки em, тем ниже соответствующий весовой коэффициент wm. Таким образом, более точные методы, будут вносить больший вклад в финальную оценку.

Финальная формула имеет вид:

fi=m=1Mwm*nim

User Weighting[17]

Данный метод отличается от предыдущего тем, что мы производим взвешивание методов для каждого пользователя индивидуально. Изначально этот способ слияния был более сложным с точки зрения вычислений[19]. Позднее на его основе была предложена схема, уменьшающая число операций, которая и будет описана в этом разделе.

Обозначим вес для метода m для пользователя i как wim.

Рассмотри более детально, как вычислить искомы вес wim. Данный способ слияния берёт за основу концепцию волка-овцы[20]. Обозначим за овец пользователей, данные которых могут быть легко подделаны. Волками напротив обозначим пользователей, которые легко имитируют других клиентов. Как волки, так и овцы уменьшают эффективность работы процесса аутентификации, так как обе эти группы приводят к ложным срабатываниям.

Для того, чтобы использовать данный подход для мультимодального случая, необходимо ввести метрику lambness для каждой пары (i,m). Она показывает, насколько пользователь i является овцой в рамках метода m При её подсчёте предполагается, что параметры среднего и стандартного отклонения для подлинного распределения и распределения самозванцев известны. Для получения lambness происходит вычисление d-prime метрики[21], которая показывает, насколько различимы два распределения (в нашем случае истинное и поддельное). Обозначим для пары пользователь-метод (i,m) среднее и стандартное отклонения подлинного распределения как μi,genm,σi,genm, для поддельного μi,nm,σi,nm соответственно. В данном случае индексы gen и imp обозначают genuine и impostor соответственно. dim=μi,pmμi,nmσi,pmσi,nm.

При этом легко видеть, что чем меньше значение dim, тем в большей степени пользователь является овцой для некоторых волков. Это обусловленно тем, что в данном случае наблюдается сильное перекрытие распределений.

И, наконец, все готово для подсчёта весов для пользователя i:

wim=1m=1Mdim*dim.

Формула слияния с полученными весами имеет вид:

fi=m=1Mwim*nim

Комбинирование методов

В ходе исследований[22][23] мультимодальных систем аутентификации было показано, что использование комбинации нескольких методов превосходят по качеству работы унимодальные системы. Причем прирост достигается даже при комбинировании с топовыми унимодальными системами. В некоторых случаях это может помочь снизить стоимость итоговой архитектуры за счет использования простых методов.

Также было показано[17], что в приложениях, где происходит постоянный приток новых людей (например, аэропорты), наиболее подходящая комбинация — это нормализация Min-Max и слияние Simple Sum. Если же работа происходит с ограниченным кругом лиц (например, лаборатория или офис), то наилучшая комбинация — это адаптивная нормализация Quadric-Line-Quadric и слияние User Weighting. Основная причина разницы результатов для двух случаев в том, что при работе с одними и теми же пользователями происходит постоянное повторение съёмов биометрических данных, что позволяет собирать их и аккумулировать в алгоритмы. Аналогичные результаты были получены также и в других исследованиях[24][25]. Описанные случаи являются исчерпывающими и описывают все возможные примеры использования систем аутентификации.

При решении прикладных задач стоит стоит пробовать различные комбинации методов создания мультимодалных систем. Это обусловленно тем, что из-за различий в том, какие унимодальные методы используются, какая аппаратура осуществляет аутентификацию и каких образом происходил сбор данных для обучения мультимодальной системы, результаты могут сильно отличаться от представленных в различных исследованиях. Однако в качестве базового решения стоит в первую очередь пробовать именно описанные выше.

Примечания

Шаблон:Примечания