Сопряжённое априорное распределение

Материал из testwiki
Версия от 15:29, 5 января 2025; imported>Bcf1889 (Дискретно-распределённые функции правдоподобия: уточнение)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Сопряжённое априорное распределение (Шаблон:Lang-en) и сопряжённое семейство распределений — одни из основных понятий в байесовской статистике.

Рассмотрим задачу о нахождении распределения параметра θ (рассматриваемого как случайная величина) по имеющемуся наблюдению x. По теореме Байеса, апостериорное распределение вычисляется из априорного распределения с плотностью вероятности p(θ) и функции правдоподобия p(x|θ) по формуле:

p(θ|x)=p(x|θ)p(θ)rangeθp(x|θ)p(θ)dθ.

Если апостериорное распределение p(θ|x) принадлежит тому же семейству вероятностных распределений, что и априорное распределение p(θ) (т.е. имеет тот же вид, но с другими параметрами), то это семейство распределений называется сопряжённым семейству функций правдоподобия p(x|θ). При этом распределение p(θ) называется сопряжённым априорным распределением к семейству функций правдоподобия p(x|θ).

Знание сопряжённых семейств распределений существенно упрощает вычисление апостериорных вероятностей в байесовской статистике, так как позволяет заменить вычисление громоздких интегралов в формуле Байеса простыми алгебраическими манипуляциями над параметрами распределений.

Пример

Для случайной величины, распределённой по закону Бернулли (бросание монетки) с неизвестным параметром q[0,1] (вероятность успеха), в качестве сопряжённого априорного распределения обычно выступает бета-распределение с плотностью вероятности:

p(q=x)=xα1(1x)β1B(α,β)

где α и β выбираются так, чтобы отразить имеющуюся априорную информацию или убеждение о распределении параметра q (выбор α = 1 and β = 1 даст равномерное распределение), а Β(αβ) — бета-функция, служащая здесь для нормализации вероятности.

Параметры α и β часто называют гиперпараметрами (параметрами априорного распределения), чтобы отличить их от параметров функции правдоподобия (в данном случае, q).

Если взять выборку из n значений этой случайной величины, и среди них окажется s успехов и f неудач, то апостериорное распределение параметра q будет равно:

P(s,f|q=x)=(s+fs)xs(1x)f,
p(q=x|s,f)=(s+fs)xs+α1(1x)f+β1/B(α,β)y=01((s+fs)ys+α1(1y)f+β1/B(α,β))dy=xs+α1(1x)f+β1B(s+α,f+β),

Это апостериорное распределение также оказывается распределённым по закону бета-распределения.

Таблица сопряжённых семейств распределений

В таблицах ниже показано каким образом изменяются параметры апостериорного распределения после выборки из n независимых, одинаково-распределённых наблюдений x1,x2,,xn. Второй столбец — параметр функции правдоподобия, относительно которого строится семейство сопряжённых распределений.

Дискретно-распределённые функции правдоподобия

Функция правдоподобия Параметр Сопряжённое семейство распределений Гиперпараметры априорного распределения Гиперпараметры апостериорного распределения
Бернулли p Бета α,β α+i=1nxi,β+ni=1nxi
Биномиальное p Бета α,β α+i=1nxi,β+i=1nNii=1nxi
Отрицательное биномиальное p Бета α,β α+rn,β+i=1nxi
Пуассона λ Гамма k,θ k+i=1nxi, θnθ+1
Пуассона λ Гамма α,β [1] α+i=1nxi, β+n
Мультиномиальное p (вектор вероятностей) Дирихле α α+i=1nx(i)
Геометрическое (в смысле числа «неудач» до первого «успеха») p0 (вероятность) Бета α,β α+n,β+i=1nxi

Непрерывно-распределённые функции правдоподобия

Функция правдоподобия Параметр Сопряжённое семейство распределений Гиперпараметры априорного распределения Гиперпараметры апостериорного распределения
Равномерное U(0,θ) Парето xm,k max{x(n),xm},k+n
Экспоненциальное λ Гамма α,β [2] α+n,β+i=1nxi
Нормальное
с известной дисперсией σ2
μ Нормальное μ0,σ02 (μ0σ02+i=1nxiσ2)/(1σ02+nσ2),(1σ02+nσ2)1
Нормальное
с известным τ = 1/σ2
μ Нормальное μ0,τ0 (τ0μ0+τi=1nxi)/(τ0+nτ),τ0+nτ
Нормальное
с известным средним μ
σ2 Scaled inverse chi-square ν,σ02 ν+n,νσ02+i=1n(xiμ)2ν+n
Нормальное
с известным средним μ
τ (= 1/σ2) Гамма α,β[2] α+n2,β+i=1n(xiμ)22
Нормальное
с известным средним μ
σ2 Обратное гамма-распределение α,β α+n2,β+i=1n(xiμ)22
Парето k Гамма α,β α+n,β+i=1nlnxixm
Парето xm Парето x0,k0 x0,k0kn при условии k0>kn.
Гамма
с известной α[1]
β (inverse scale) Гамма α0,β0 α0+nα,β0+i=1nxi

Примечания

Шаблон:Примечания

Литература

  • DeGroot, Morris H. Optimal Statistical Decisions. Wiley Classics Library. 2004. (Originally published in 1970.) ISBN 0-471-68029-X.
  1. 1,0 1,1 Параметризация гамма-распределения с параметрами: θ = 1/β and k = α.
  2. 2,0 2,1 beta_rate