T-критерий Уэлча

Материал из testwiki
Перейти к навигации Перейти к поиску

Шаблон:Заголовок со строчной буквы

t-критерий Уэлча — тест, основанный на распределении Стьюдента и предназначенный для проверки статистической гипотезы о равенстве математических ожиданий случайных величин, имеющих необязательно равные известные дисперсии. Является модификацией t-критерия Стьюдента. Назван в честь британского статистика Бернарда Льюиса Уэлча.

Предпосылки

Для применения двухвыборочного t-критерия Стьюдента необходимо, чтобы истинные дисперсии были равны. В случае t-критерия Уэлча истинные дисперсии уже могут быть не равны, но предпосылка о нормальном распределении средних сохраняется.

Вычисление статистики

Пусть даны две независимые выборки нормально распределённых случайных величин:

X1,...,Xnx𝒩(μx,σx2)

Y1,...,Yny𝒩(μy,σy2)

Проверяем следующую нулевую гипотезу о равенстве математический ожиданий:

H0:μx=μy

Пусть нулевая гипотеза верна. Тогда E(XY)=0 и Var(XY)=σx2nx+σy2ny. Пусть σ^x2=i=1nx(XiX)2nx1 и σ^y2=i=1ny(YiY)2ny1 — несмещенные оценки дисперсий σx2 и σy2 соответственно. Рассчитаем следующую статистику:

t=X¯Y¯Var^(X¯Y¯)=X¯Y¯Var^(X¯)+Var^(Y¯)=X¯Y¯σ^x2nx+σ^y2ny

Сделаем следующее преобразование:

t=X¯Y¯σ^x2nx+σ^y2ny=X¯Y¯σx2nx+σy2nyσx2nx+σy2nyσ^x2nx+σ^y2ny

Распределение первой статистики является стандартным нормальным распределением:

X¯Y¯σx2nx+σy2ny𝒩(0,1)

Рассмотрим вторую статистику и для дальнейших вычислений назовем её S:

S=σx2nx+σy2nyσ^x2nx+σ^y2ny

Статистика S напоминает случайную величину с распределением хи-квадрат, поделенную на степень свободы, но таковой не является. Пусть Zχd2 является случайной величиной с распределением хи-квадрат с d степенями свободы. Тогда Zd0, равно как и S0. Теперь заметим, что E(S)=1 (так как мы используем несмещенные оценки дисперсий), а E(Zd)=E(Z)d=dd=1.

Раз мы хотим, чтобы S была максимально похожа на Zdχd2d, то приравняем дисперсии данных случайных величин:

Var(S)=Var(Zd)=2d

Рассчитаем дисперсию случайной величины S:

Var(S)=1(σx2nx+σy2ny)2(1nx2Var(σ^x2)+1ny2Var(σ^y2))=1(σx2nx+σy2ny)2(2(σx2)2nx2(nx1)+2(σy2)2ny2(ny1))=2d

Отсюда:

d=(σx2nx+σy2ny)2σx4nx2(nx1)+σy4ny2(ny1)

В конечном итоге имеем при справедливости нулевой гипотезы:

tapprox.td,

где d находится как:

d=(σx2nx+σy2ny)2σx4nx2(nx1)+σy4ny2(ny1)

При достаточно больших объёмах выборок мы можем воспользоваться нормальной аппроксимацией:

t=X¯Y¯σ^x2nx+σ^y2nynx,ny𝒩(0,1)

Двухвыборочный t-критерий Уэлча для независимых выборок

Пусть даны две независимые выборки нормально распределённых случайных величин:

X1,...,Xnx𝒩(μx,σx2)

Y1,...,Yny𝒩(μy,σy2)

При нулевой гипотезе H0:μx=μy мы рассчитываем следующую статистику:

t=X¯Y¯σ^x2nx+σ^y2ny

Пусть альтернативная гипотеза H1:μxμy.

При справедливости нулевой гипотезы распределение t будет приблизительно являться распределением Стьюдента с d степенями свободы:

tapprox.td,

где d находится как:

d=(σx2nx+σy2ny)2σx4nx2(nx1)+σy4ny2(ny1)

Следовательно, при превышении значения наблюдаемой статистики по абсолютной величине критического значения данного распределения (при заданном уровне значимости) нулевая гипотеза отвергается.

Пример

В следующих примерах будем сравнивать t-критерий Стьюдента и t-критерий Уэлча. Выборки сгенерированы модулем numpy.random для языка программирования Python.

Для всех трех примеров математические ожидания будут равны μx=20 и μy=22 соответственно.

В первом примере истинные дисперсии равны (σx2=σy2=4) и объёмы выборок равны (nx=ny=15). Обозначим за SX и SY как соответствующие случайные выборки:

SX={19.17,21.41,23.83,15.72,21.44,20.93,21.53,21.76,21.62,18.11,19.74,18.74,17.12,21.30,21.97}SY={19.71,22.77,22.85,26.21,21.60,21.50,25.43,21.45,24.69,22.69,20.21,26.24,21.43,22.49,20.76}

Во втором примере истинные дисперсии неравны (σx2=16, σy2=1) и неравные объёмы у выборок (nx=10,ny=20). У меньшей выборки большая дисперсия:

SX={18.33,22.82,27.66,11.43,22.88,21.87,23.07,23.53,23.24,16.21}SY={21.87,21.37,20.56,22.65,22.98,20.86,22.39,22.43,24.11,21.80,21.75,23.71,21.73,23.35,22.34,21.10,24.12,21.71,22.24,21.38}

В третьем примере истинные дисперсии неравны (σx2=1, σy2=16) и неравные объёмы у выборок (nx=10,ny=20). У большей выборки большая дисперсия:

SX={19.58,20.71,21.92,17.86,20.72,20.47,20.77,20.88,20.81,19.05}SY={21.48,19.48,16.25,24.61,25.94,17.42,23.55,23.71,30.43,21.21,21.01,28.86,20.91,27.39,23.37,18.42,30.47,20.86,22.97,19.52}
Выборка SX Выборка SY t-критерий Стьюдента t-критерий Уэлча
Пример nx X σ^x2 ny Y σ^y2 t d p-value psim-value t d p-value psim-value
1 15 20.29 4.61 15 22.67 4.35 -3.07 28 0.005 0.005 −3.07 28.0 0.005 0.004
2 10 21.10 21.01 20 22.22 1.04 −1.06 28 0.299 0.465 −0.76 9.57 0.464 0.459
3 10 20.27 1.31 20 22.89 16.69 −1.97 28 0.059 0.015 −2.66 23.28 0.014 0.018

Для равных дисперсий и равных объёмов выборок t-критерий Стьюдента и t-критерий Уэлча выдали примерно одинаковый результат (пример 1). Для неравных дисперсий t-критерий Уэлча точнее оценивает истинное распределение статистики, чем t-критерий Стьюдента (p-value для t-критерия Уэлча ближе к моделированной psim-value, чем для t-критерия Стьюдента).

Если неизвестно, равны ли дисперсии двух генеральных совокупностей, крайне не рекомендуется проводить пре-тесты для определения равенства дисперсий, а лучше сразу использовать t-критерий Уэлча.[1]

Реализация в различных ПО

Язык программирования / ПО Функция Примечание
LibreOffice TTEST(Data1; Data2; Mode; Type) Подробнее[2]
MATLAB ttest2(data1, data2, 'Vartype', 'unequal') Подробнее[3]
Microsoft Excel до 2010 TTEST(array1, array2, tails, type) Подробнее[4]
Microsoft Excel 2010 and позднее T.TEST(array1, array2, tails, type) или ТТЕСТ(массив1;массив2;хвосты;тип) Подробнее[5][6]
Python scipy.stats.ttest_ind(a, b, equal_var=False) Подробнее[7]
R t.test(data1, data2, alternative="two.sided", var.equal=FALSE) Подробнее[8]
Haskell Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2 Подробнее[9]
Julia UnequalVarianceTTest(data1, data2) Подробнее[10]
Stata ttest varname1 == varname2, welch Подробнее[11]
Google Sheets TTEST(range1, range2, tails, type) Подробнее[12]

Литература

B. L. Welch The Generalization of `Student’s' Problem when Several Different Population Variances are Involved // Vol. 34, No. 1/2 (Jan., 1947), pp. 28-35

Примечания

Шаблон:Примечания