Критерий согласия Пирсона

Материал из testwiki
Перейти к навигации Перейти к поиску

Критерий согласия Пирсона или критерий согласия χ2 (хи-квадрат) — непараметрический метод, который позволяет оценить значимость различий между фактическим (выявленным в результате исследования) количеством исходов или качественных характеристик выборки, попадающих в каждую категорию, и теоретическим количеством, которое можно ожидать в изучаемых группах при справедливости нулевой гипотезы. Выражаясь проще, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).

Является наиболее часто употребляемым критерием для проверки гипотезы о принадлежности наблюдаемой выборки x1,x2,...,xn объёмом n некоторому теоретическому закону распределения F(x,θ).

Критерий хи-квадрат для анализа таблиц сопряжённости был разработан и предложен в 1900 году основателем математической статистики английским учёным Карлом Пирсоном.

Критерий может использоваться при проверке простых гипотез вида

H0:Fn(x)=F(x,θ),

где θ — известный вектор параметров теоретического закона, и при проверке сложных гипотез вида

H0:Fn(x){F(x,θ),θΘ},

когда оценка θ^ скалярного или векторного параметра распределения F(x,θ) вычисляется по той же самой выборке.

Статистика критерия

Процедура проверки гипотез с использованием критериев типа χ2 предусматривает группирование наблюдений. Область определения случайной величины разбивают на k непересекающихся интервалов граничными точками

x(0),x(1),...,x(k1),x(k),

где x(0) — нижняя грань области определения случайной величины; x(k) — верхняя грань.

В соответствии с заданным разбиением подсчитывают число ni выборочных значений, попавших в i-й интервал, и вероятности попадания в интервал

Pi(θ)=F(x(i),θ)F(x(i1),θ),

соответствующие теоретическому закону с функцией распределения F(x,θ).

При этом

n=i=1kni и i=1kPi(θ)=1.

При проверке простой гипотезы известны как вид закона F(x,θ), так и все его параметры (известен скалярный или векторный параметр θ).

В основе статистик, используемых в критериях согласия типа χ2, лежит измерение отклонений ni/n от Pi(θ).

Статистика критерия согласия χ2 Пирсона определяется соотношением

χ2=ni=1k(ni/nPi(θ))2Pi(θ).

В случае проверки простой гипотезы, в пределе при n эта статистика подчиняется χr2-распределению с r=k1 степенями свободы, если верна проверяемая гипотеза H0. Плотность χr2-распределения, которое является частным случаем гамма-распределения, описывается формулой

g(s)=12r/2Γ(r/2)sr/21es/2.

Проверяемая гипотеза H0 отклоняется при больших значениях статистики, когда вычисленное по выборке значение статистики χn2 больше критического значения χr,α2,

P(χn2>χr,α2)=12r/2Γ(r/2)χr,α2sr/21es/2ds

или достигнутый уровень значимости ([[p-значение|Шаблон:Math-значение]]) меньше заданного уровня значимости (заданной вероятности ошибки 1-го рода) α.

Проверка сложных гипотез

При проверке сложных гипотез, если параметры закона F(x,θ) по этой же выборке оцениваются в результате минимизации статистики χn2 или по сгруппированной выборке методом максимального правдоподобия, то статистика χn2 при справедливости проверяемой гипотезы подчиняется χr2-распределению с r=km1 степенями свободы, где m — количество оценённых по выборке параметров.

Если параметры оцениваются по исходной негруппированной выборке, то распределение статистики не будет являться χkm12-распределением[1]. Более того, распределения статистики при справедливости гипотезы H0 будут зависеть от способа группирования, то есть от того, как область определения разбивается на интервалы[2].

При оценивании методом максимального правдоподобия параметров по негруппированной выборке можно воспользоваться модифицированными критериями типа χ2[3][4][5][6].

О мощности критерия

При использовании критериев согласия, как правило, не задают конкурирующих гипотез: рассматривается принадлежность выборки конкретному закону, а в качестве конкурирующей гипотезы — принадлежность любому другому. Естественно, что критерий по-разному будет способен отличать от закона, соответствующего H0, близкие или далёкие от него законы. Если задать конкурирующую гипотезу H1 и соответствующий ей некоторый конкурирующий закон F1(x,θ), то можно рассуждать уже об ошибках двух видов: не только об ошибке 1-го рода (отклонении проверяемой гипотезы H0 при её справедливости) и вероятности этой ошибки α, но и об ошибке 2-го рода (неотклонении H0 при справедливости H1) и вероятности этой ошибки β.

Мощность критерия по отношению к конкурирующей гипотезе H1 характеризуется величиной 1β. Критерий тем лучше распознаёт пару конкурирующих гипотез H0 и H1, чем выше его мощность.

Мощность критерия согласия χ2 Пирсона существенно зависит от способа группирования[7][8] и от выбранного числа интервалов[8][9].

При асимптотически оптимальном группировании, при котором максимизируются различные функционалы от информационной матрицы Фишера по группированным данным (минимизируются потери, связанные с группированием), критерий согласия χ2 Пирсона обладает максимальной мощностью относительно «(очень) близких» конкурирующих гипотез[10][8][9].

При проверке простых гипотез и использовании асимптотически оптимального группирования критерий согласия χ2 Пирсона имеет преимущество в мощности по сравнению с непараметрическими критериями согласия. При проверке сложных гипотез мощность непараметрических критериев возрастает и такого преимущества нет[11][12]. Однако для любой пары конкурирующих гипотез (конкурирующих законов) за счёт выбора числа интервалов и способа разбиения области определения случайной величины на интервалы можно максимизировать мощность критерия[13].

См. также

Примечания

Шаблон:Примечания

Литература

См. также

Ссылки

Шаблон:Нет иллюстрации

  1. Шаблон:Статья
  2. Шаблон:Статья
  3. Шаблон:Статья
  4. Шаблон:Статья
  5. Шаблон:Статья
  6. Шаблон:Книга
  7. Шаблон:Статья
  8. 8,0 8,1 8,2 Шаблон:Книга
  9. 9,0 9,1 Шаблон:Статья
  10. Денисов В. И., Лемешко Б. Ю. Оптимальное группирование при обработке экспериментальных данных // Измерительные информационные системы. — Новосибирск, 1979. — С. 5—14.
  11. Шаблон:Статья
  12. Шаблон:Статья
  13. Шаблон:Книга — Раздел 4.9.