Критерий знаков

Материал из testwiki
Перейти к навигации Перейти к поиску

В математической статистике критерий знаков используется при проверке нулевой гипотезы о равенстве медианы некоторому заданному значению (для одной выборки) или о равенстве нулю медианы разности (для двух связанных выборок).[1] Это непараметрический критерий, то есть он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность, чем более специализированные критерии.

Описание метода для двух выборок

Рассмотрим две непрерывно распределенные случайные величины X и Y, и пусть нулевая гипотеза выполняется, то есть медиана их разности равна нулю. Тогда p=(X>Y)=0.5. Иными словами, каждая из случайных величин равновероятно больше другой.

Рассмотрим пару связных выборок {(x1,y1),,(xn,yn)}. Будем считать, что в выборке нет элементов, для которых xi=yi (иначе уберем эти элементы из выборки). Построим статистику w, равную числу элементов в выборке, при которых xi>yi. При выполнении нулевой гипотезы, эта величина имеет биномиальное распределение: wB(n,0.5).

Для применения критерия необходимо вычислить «левый хвост» биномиального распределения до w: b=2ni=0wCni. Согласно критерию, при уровне значимости α:

  • против двусторонней альтернативной гипотезы p0.5
если b∉[α/2,1α/2], то нулевая гипотеза отвергается;
  • против альтернативы p<0.5
если b<α, то нулевая гипотеза отвергается;
  • против альтернативы p>0.5
если b>1α, то нулевая гипотеза отвергается;

Пример задачи

Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения.

Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки и называются связанными.

Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.

Заданы две выборки одинаковой длины xn=(x1,,xn),xi;yn=(y1,,yn),yi.

Дополнительные предположения:

  • обе выборки простые;
  • выборки связные, то есть элементы xi,yi соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).

Нулевая гипотеза H0:{x>y}=1/2.

Если в выборке имеются случаи xi=yi, то их следует исключить из выборки, уменьшив число наблюдений. Статистика критерия — это число w элементов в выборке, при которых xi>yi.

Ссылки

Шаблон:Reflist

  1. The Sign Test for a Median Шаблон:Wayback // STAT 415 Intro Mathematical Statistics. Penn State University.