Складной нож (статистика)

Материал из testwiki
Версия от 11:07, 18 марта 2017; imported>Lanhiaze (Преамбула: уточнение)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Складной нож (Шаблон:Lang-en) — один из методов ресэмплинга (линейное приближением статистического бутстрэпа), используемый для оценки погрешности в статистическом выводе. Способ заключается в следующем: для каждого элемента вычисляется среднее значение выборки без учёта данного элемента, а затем — среднее всех таких значений. Для выборки из N элементов оценка получается путём вычисления среднего значения остальных N-1 элементов.

Этот метод разработал Морис Кенуй (Maurice Quenouille 1949, 1956) с целью уменьшения погрешности оценки отдельного образца. Джон Тьюки в 1958 году расширил его возможности и предложил название «складной нож», потому что его действие напоминает складной нож — простой инструмент, которым можно решить множество различных проблем, пускай и менее эффективно, чем при помощи предназначенных для этого средств. Он может помочь улучшить оценку в случае когда данные распределены неравномерно.

Оценка

Оценочные параметры могут быть найдены как среднее значение элементов выборки без i-го элемента (назовем их x¯i).

x¯i=1n1jinxj

Дисперсионная оценка

Оценка дисперсии параметров может быть вычислена по формуле:

Var(jackknife)=n1ni=1n(x¯ix¯(.))2=1ni=1n(j=1nxjnxi)2

где x¯i — это оценочные параметры, а x¯(.)=1ninx¯i — оценка, основанная на всех элементах.

Другими словами оценка дисперсии — это среднее арифметическое квадратов разности среднего арифметического всех элементов и данного.

Оценка и коррекция смещения

Данный метод может быть использован для оценки погрешности параметра относительно всей выборки. Введем θ^, как оценку параметра на основе всех данных:

θ^=Var(jackknife)n1

θ^(.)=1ni=1nθ^(i)

Bias^(θ)=(n1)(θ^(.)θ^)