Проверка статистических гипотез

Материал из testwiki
Перейти к навигации Перейти к поиску

Проверка статистических гипотез является содержанием одного из обширных классов задач математической статистики[1].

Статистическая гипотеза — гипотеза о виде распределения и свойствах случайной величины, которую можно подтвердить или опровергнуть применением статистических методов к данным выборки[1].

Статистические гипотезы

Определения

Пусть в (статистическом) эксперименте доступна наблюдению случайная величина X, распределение которой полностью или частично неизвестно. Тогда любое утверждение относительно называется статистической гипотезой. Гипотезы различают по виду предположений, содержащихся в них:

  • Статистическая гипотеза, однозначно определяющая распределение , то есть H:{=0}, где 0— какой-то конкретный закон, называется простой.
  • Статистическая гипотеза, утверждающая принадлежность распределения к некоторому семейству распределений, то есть вида H:{𝒫}, где 𝒫 — семейство распределений, называется сложной.

На практике обычно требуется проверить какую-то конкретную и, как правило, простую гипотезу H0. Такую гипотезу принято называть нулевой. При этом параллельно рассматривается противоречащая ей гипотеза H1, называемая конкурирующей или альтернативной.

Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу.

В большинстве случаев статистические критерии основаны на случайной выборке (X1,X2,,Xn) фиксированного объема n1 для распределения . В последовательном анализе выборка формируется в ходе самого эксперимента и потому её размер является случайной величиной (см. Последовательный статистический критерий).

Пример

Пусть дана независимая выборка (X1,,Xn)𝒩(μ,1) из нормального распределения, где μ — неизвестный параметр. Тогда H0:{μ=μ0}, где μ0 — фиксированная константа, является простой гипотезой, а конкурирующая с ней H1:{μ>μ0} — сложной.

Этапы проверки статистических гипотез

  1. Формулировка основной гипотезы H0 и конкурирующей гипотезы H1.
  2. Задание уровня значимости α, на котором в дальнейшем и будет сделан вывод о справедливости гипотезы. Он равен вероятности допустить ошибку первого рода.
  3. Расчёт статистики ϕ критерия такой, что:
    • её величина зависит от исходной выборки 𝐗=(X1,,Xn):ϕ=ϕ(X1,,Xn);
    • по её значению можно делать выводы об истинности гипотезы H0;
    • статистика ϕ, как функция случайной величины 𝐗, также является случайной величиной и подчиняется какому-то закону распределения.
  4. Построение критической области. Из области значений ϕ выделяется подмножество 𝒞 таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство P(ϕ𝒞)=α. Это множество 𝒞 и называется критической областью.
  5. Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику ϕ и по попаданию (или непопаданию) в критическую область 𝒞 выносится решение об отвержении (или не отвержении) выдвинутой гипотезы H0.

Виды критической области

Выделяют три вида критических областей:

  • Двусторонняя критическая область определяется двумя интервалами (,xα/2)(x1α/2+), где xα/2,x1α/2 находят из условий P(ϕ<xα/2)=α2,P(ϕ<x1α/2)=1α2.
  • Левосторонняя критическая область определяется интервалом (,xα), где xα находят из условия P(ϕ<xα)=α.
  • Правосторонняя критическая область определяется интервалом (x1α,+), где x1α находят из условия P(ϕ<x1α)=1α.

См. также

Примечания

Шаблон:Примечания

Литература

Шаблон:Вс