Распределение Дирихле

Материал из testwiki
Перейти к навигации Перейти к поиску

В теории вероятностей и математической статистике распределение Дирихле (по имени Иоганна Петера Густава Лежён-Дирихлe), часто обозначаемое Dir(α), — это семейство непрерывных многомерных вероятностных распределений, параметризованных вектором α неотрицательных вещественных чисел. Распределение Дирихле является обобщением Бета-распределения на многомерный случай. То есть, его функция плотности вероятности возвращает доверительную вероятность того, что вероятность каждого из K взаимоисключающих событий равна xi при условии, что каждое событие наблюдалось αi1 раз.

Функция плотности вероятности

Функция плотности вероятности для распределения Дирихле порядка K естьШаблон:Sfn

f(x1,,xK;α1,,αK)=1B(α)i=1Kxiαi1,

где xi0, i=1Kxi=1, αi>0, а B(α)=i=1KΓ(αi)Γ(i=1Kαi) — многомерная бета-функция, где α=(α1,,αK).

Свойства

Пусть X=(X1,,XK)Dir(α) и α0=i=1Kαi, тогдаШаблон:Sfn

E[Xiα]=αiα0,
Var[Xiα]=αi(α0αi)α02(α0+1),
Cov[XiXjα]=αiαjα02(α0+1).

Модой распределения является вектор x=(x1,,xK) с

xi=αi1α0K,αi>1.

Распределение Дирихле является сопряжённым априорным распределением к мультиномиальному распределению, а именно, если

βX=(β1,,βK)XMult(X),

где βi — число вхождений i в выборку из n точек дискретного распределения на {1, …, K} определённого через X, то

XβDir(α+β).

Эта связь используется в Байесовской статистике для того, чтобы оценить скрытые параметры X дискретного вероятностного распределения, имея набор из n выборок. Очевидно, что если априорное распределение обозначено как Dir(α), то Dir(α + β) есть апостериорное распределение после серии наблюдений с гистограммой β.

Связи с другими распределениями

Если для i{1,2,,K},

YiGamma(shape=αi,scale=1) независимо, то
V=i=1KYiGamma(shape=i=1Kαi,scale=1),

и

(X1,,XK)=(Y1/V,,YK/V)Dir(α1,,αK).

Несмотря на то, что Xi не являются независимыми друг от друга, они могут быть сгенерированы из набора из K независимых гамма случайных величин. К несчастью, так как сумма V теряется в процессе формирования X = (X1, …, XK), становится невозможно восстановить начальные значения гамма случайных величин только по этим значениям. Тем не менее, благодаря тому, что работать с независимыми случайными величинами проще, это преобразование параметров может быть полезно при доказательстве свойств распределения Дирихле.

Генерация случайных чисел

Метод построения случайного вектора x=(x1,,xK) для распределения Дирихле размерности K с параметрами (α1,,αK) следует непосредственно из этой связи. Сначала получим K независимых случайных выборок y1,,yK из гамма-распределений, каждое из которых имеет плотность

yiαi1eyiΓ(αi),

а затем положим

xi=yi/j=1Kyj.

Наглядная трактовка параметров

В качестве примера использования распределения Дирихле можно предложить задачу, в которой требуется разрезать нитки (каждая начальной длины 1,0) на K частей с разными длинами так, чтобы все части имели заданную среднюю длину, но с возможностью некоторой вариации относительных длин частей. Значения α / α0 определяют средние длины частей нитки, получившиеся из распределения. Дисперсия вокруг среднего значения обратно пропорциональна α0.

См. также

Примечания

Шаблон:Примечания

Литература

Шаблон:Вс Шаблон:Rq