Критерий согласия Колмогорова

Материал из testwiki
Перейти к навигации Перейти к поиску

Критерий согласия Колмогорова предназначен для проверки гипотезы о принадлежности выборки некоторому закону распределения, то есть проверки того, что эмпирическое распределение соответствует предполагаемой модели.

Критерий однородности Смирнова используется для проверки гипотезы о принадлежности двух независимых выборок одному закону распределения, то есть о том, что два эмпирических распределения соответствуют одному и тому же закону.

Эти критерии носят имена математиков Андрея Николаевича Колмогорова и Николая Васильевича Смирнова.

Критерий Смирнова о проверке гипотезы об однородности двух эмпирических законов распределения является одним из наиболее часто используемых непараметрических критериев.

Описание

Если в критерии χ2 сопоставляются частоты двух распределений отдельно по каждому разряду, то здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, каждый раз сопоставляются накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и различия можно будет признать статистически достоверными. В формулу критерия λ  включается эта разность. Чем больше эмпирическое значение λ, тем более существенными являются различия.

Статистика критерия Колмогорова

Пусть эмпирическая функция распределения (ЭФР) Fn, построенная по выборке X=(X1,,Xn), имеет вид:

Fn(x)=1ni=1nIXix,

где IXix указывает, попало ли наблюдение Xi в область (,x]:

IXix={1,Xix;0,Xi>x.

Выполняется проверка того, является ли выборка порождённой случайной величиной ξ с функцией распределения F(x). Статистика критерия для эмпирической функции распределения Fn(x) определяется следующим образом:

Dn=supx|Fn(x)F(x)|,

где под sup понимается супремум функции |Fn(x)F(x)|.

Распределение статистики Колмогорова

Обозначим нулевую гипотезу H0, как гипотезу о том, что выборка подчиняется распределению F(X)C1(𝕏). Тогда по теореме Колмогорова для введённой статистики справедливо:

t>0:limnP(nDnt)=K(t)=j=+(1)je2j2t2=θ4(e2t2),

где θ4(q)Тета-функция Якоби. Учтём, что критерий имеет правостороннюю критическую область.

Шаблон:Message box

Если α достаточно близко к 1, то Kα можно приблизительно рассчитать по формуле:

Kα12ln1α2.

Асимптотическая мощность критерия равна 1.


Обозначим теперь за нулевую гипотезу H0 гипотезу о том, что две исследуемые выборки подчиняются одному распределению случайной величины ξ:F(X)C1(𝕏).

Шаблон:Message box

Теорема Смирнова позволяет построить критерий для проверки двух выборок на однородность.

Шаблон:Message box

См. также

Примечание 1

В критерии Колмогорова предпочтительней использование статистики с поправкой Большева в следующем виде nDn+1/(6n). Распределение данной статистики уже не так сильно зависит от объема выборки. Зависимостью её распределения от объема выборки n можно пренебречь при n>25.

Примечание 2

Классический критерий Колмогорова предназначен для проверки простых гипотез. Если проверяется гипотеза о согласии наблюдаемой выборки с законом, все параметры которого известны, то критерий Колмогорова является свободным от распределения: неважно, с каким законом проверяется согласие. Если проверяемая гипотеза справедлива, предельным распределением статистики Колмогорова является распределение Колмогорова K(t).

Всё меняется при проверке сложных гипотез, когда по анализируемой выборке оцениваются параметры теоретического закона, согласие с которым проверяется. При проверке сложных гипотез свобода от распределения теряется. При проверке сложных гипотез и справедливости проверяемой гипотезы распределения статистик непараметрических критериев согласия (и критерия Колмогорова) зависят от ряда факторов: от вида наблюдаемого закона, соответствующего проверяемой гипотезе; от типа оцениваемого параметра и числа оцениваемых параметров; в некоторых случаях от конкретного значения параметра (например, в случае семейств гамма- и бета-распределений); от метода оценивания параметров. Различия в предельных распределениях той же самой статистики при проверке простых и сложных гипотез настолько существенны, что пренебрегать этим ни в коем случае нельзя.

О применении критерия Колмогорова при проверке сложных гипотез

Ссылки