f-дивергенция

Материал из testwiki
Перейти к навигации Перейти к поиску

f-дивергенцией (f-расхождением) называется класс функционалов Df(PQ), определяющих в общем случае несимметричную меру расхождения между двумя распределениями вероятностей P и Q. Обычно применяется в теории информации и теории вероятностей. Функционал однозначно определяется (порождается) функцией f(t), удовлетворяющей определённым условиям.

Данный класс дивергенций был введён и изучался независимо друг от друга учёными ЧисараШаблон:Sfn, МоримотоШаблон:Sfn, а также Али и СилвиШаблон:Sfn. Поэтому иногда можно встретить названия f-дивергенция Чисара, дивергенция Чисара—Моримото или расстояние Али—Силви.

Определение

Пусть P и Q — распределения вероятностей, заданные на множестве Ω, такие что P абсолютно непрерывно по отношению к Q. Пусть функция f(t) выпукла при t0 и f(1)=0. Тогда функция f задаёт f-дивергенцию P относительно Q следующим образом:

Df(PQ)=Ωf(dPdQ)dQ=EQf(dPdQ).

Если μ — любая мера на Ω, и оба распределения P и Q непрерывны относительно μ, т.е. существуют функции p=dPdμ и q=dQdμ, тогда f-дивергенция может быть записана как

Df(PQ)=Ωf(pq)qdμ.

В случае лебеговой меры μ=x распределения имеют плотности p(x) и q(x), тогда f-дивергенция принимает вид

Df(PQ)=Ωf(p(x)q(x))q(x)dx.

Для дискретных распределений P={pi} и Q={qi}, где i=1,...,N,

Df(PQ)=i=1Nf(piqi)qi.

Функция f(t) определена с точностью до слагаемого c(t1), где c — произвольная константа. Действительно, вид f-дивергенции не зависит от выбора c, поскольку слагаемое c(t1) функции f(t) даёт нулевой вклад в значение интеграла. Кроме того, функция f(t) может содержать положительную мультипликативную константу k, которая определяет единицу измерения дивергенции. В связи с этим некоторые авторы (например, БассевильШаблон:Sfn) указывают дополнительные ограничения, налагаемые на функцию f(t):

f(1)=0,
f(1)=1.

Первое из этих ограничений фиксирует константу c, второе — константу k. Условие f(1)=0 может быть полезно тем, что в этом случае f(t)0 с минимумом в точке t=1 (см. Лизе и ВайдаШаблон:Sfn), и выражение для f-дивергенции интуитивно проще воспринимается. Однако такой способ конкретизировать функцию f(t) не всегда удобен: например, для существования непрерывной версии f-энтропии, связанной с данной f-дивергенцией, может потребоваться другое значение константы c.

f-дивергенция может быть разложена в ряд Тейлора и записана в виде взвешенной суммы расстояний χ-типа (см. Нильсен и НокШаблон:Sfn).

Частные случаи f-дивергенции

Многие известные дивергенции, такие как дивергенция Кульбака—Лейблера, квадрат расстояния Хеллингера, расстояние хи-квадрат и ряд других, являются частными случаями f-дивергенции, которым соответствует определённый выбор функции f(t). В следующей таблице приведены некоторые распространённые виды дивергенций между распределениями вероятностей и соответствующая им функция f(t) (см. Лизе и ВайдаШаблон:Sfn).

Дивергенция Порождающая функция f(t)
Дивергенция Кульбака—Лейблера tlnt
Обратная Дивергенция Кульбака—Лейблера lnt
Квадрат расстояния Хеллингера 12(t1)2,1t,tt
Расстояние полной вариации 12|t1|
Расстояние χ2 Пирсона (t1)2,t21,t2t
Расстояние χ2 Неймана 1t1,1tt
Альфа-дивергенция {41α2(tt(1+α)/2),если α±1,tlnt,если α=1,lnt,если α=1
Альфа-дивергенция (другие обозначения) {tαtα(α1),если α0,α1,tlnt,если α=1,lnt,если α=0

Свойства

Шаблон:Unordered list С учётом последнего свойства класс f-дивергенций можно было бы эквивалентным образом определить как D*f(PQ)=EPf(dQdP). Подобное определение встречается, например, у ЧжанаШаблон:Sfn. Таким образом, интерпретация распределения Q как истинного, которая следует из определения f-дивергенции, не является её фундаментальным свойством, а является лишь следствием соглашения о порядке следования аргументов в определении. Иными словами, аргументы P и Q концептуально равноправны.

f-дивергенция является безразмерной величиной независимо от размерности множества Ω.

Связанные понятия

Кроме f-дивергенции, И. Чисар определил связанное с ней понятие f-энтропии (ЧисарШаблон:Sfn).

Примечания

Шаблон:Примечания

Литература

Шаблон:Refend