Регрессия Деминга

Материал из testwiki
Перейти к навигации Перейти к поиску
Двумерный случай метода наименьших полных квадратов (регрессия Деминга). Красные отрезки показывают ошибку как по x, так и по y, что отличается от традиционного метода наименьших квадратов, в котором ошибка измеряется только по оси y. Показан случай, когда отклонение измеряется перпендикулярно, что происходит, когда x и y имеют равные дисперсии.

В статистике регрессия Деминга, названная именем У. К. Деминга, — это вид Шаблон:Не переведено 5, которая пытается найти прямую наилучшего сглаживания для двумерного набора данных. Регрессия отличается от Шаблон:Не переведено 5 в том, что она принимает во внимание Шаблон:Не переведено 5 в наблюдении как по оси x, так и по оси y. Регрессия является частным случаем метода наименьших полных квадратов, которая рассматривает любое число показателей и имеет более сложную структуру ошибок.

Регрессия Деминга эквивалентна оценке максимального правдоподобия на Шаблон:Не переведено 5, в которой ошибки двух переменных считаются независимыми и имеют нормальное распределение, а отношение их дисперсий, δ, известно Шаблон:Sfn. На практике это отношение может быть оценено из исходных данных. Однако процедура регрессии не принимает во внимание возможные ошибки в оценке отношений дисперсии.

Регрессия Деминга лишь слегка сложнее Шаблон:Не переведено 5. Большинство статистических пакетов, используемых в клинической химии, предоставляют регрессию Деминга.

Модель первоначально была предложена АдкокомШаблон:Sfn, который рассматривал случай δ = 1, а затем рассматривалась в более общем виде Куммеллем Шаблон:Sfn с произвольным δ. Однако их идеи оставались большей частью незамеченными более 50 лет, пока их не возродил КупмансШаблон:Sfn и позднее распространил ДемингШаблон:Sfn. Книга последнего стала столь популярной в клинической химии и связанных областях, что метод в этих областях получил название регрессия ДемингаШаблон:Sfn.

Спецификация

Предположим, что данные (yi, xi) являются значениями, полученными в ходе измерений "истинных" значений (yi*, xi*), которые лежат на регрессионной прямой:

yi=yi*+εi,xi=xi*+ηi,

где ошибки ε и η независимы и отношение их дисперсий, известно:

δ=σε2ση2.

На практике дисперсии параметров x и y часто неизвестны, что усложняет оценку δ. Заметим, что когда метод измерения x и y тот же самый, эти дисперсии, скорее всего, равны, так что в этом случае δ=1.

Мы пытаемся найти прямую "наилучшего сглаживания"

y*=β0+β1x*,

такую, что взвешенная сумма квадратов остатков минимальна Шаблон:Sfn

SSR=i=1n(εi2σε2+ηi2ση2)=1σε2i=1n((yiβ0β1xi*)2+δ(xixi*)2)  minβ0,β1,x1*,,xn*SSR

Решение

Решение может быть выражено в терминах моментов второго порядка. То есть мы сначала вычисляем следующие величины (все суммы берутся по i = 1 : n):

x=1nxi,y=1nyi,sxx=1n(xix)2,sxy=1n(xix)(yiy),syy=1n(yiy)2.

Наконец, параметры оценки методом наименьших квадратов будутШаблон:Sfn:

β^1=syyδsxx+(syyδsxx)2+4δsxy22sxy,β^0=yβ^1x,x^i*=xi+β^1β^12+δ(yiβ^0β^1xi).

Ортогональная регрессия

В случае равенства дисперсий ошибок, т.е. в случае δ=1, регрессия Деминга становится ортогональной регрессией — она минимизирует сумму квадратов Шаблон:Не переведено 5. В этом случае обозначим каждую точку выборки zj на комплексной плоскости (т.е. точка (xj, yj) выборки записывается как zj = xj + iyj, где iмнимая единица). Обозначим через Z сумму квадратов разностей от точек выборки до центра тяжести (также представленного в комплексных координатах). Центр тяжести — это среднее точек выборки. ТогдаШаблон:Sfn:

  • Если Z = 0, то любая прямая, проходящая через центр тяжести, является прямой наилучшего ортогонального сглаживания.
  • Если Z ≠ 0, прямая наилучшего ортогонального сглаживания проходит через центр тяжести и параллельна вектору из начала координат в Z.

Тригонометрическую интерпретацию прямой наилучшего ортогонального сглаживания дал Кулидж в 1913Шаблон:Sfn.

Приложения

В случае трёх неколлинеарных точек на плоскости треугольник, образованный этими точками, имеет единственный вписанный эллипс Штейнера, который касается сторон треугольника в средних точках. Главная ось этого эллипса будет ортогональной регрессией этих трёх вершинШаблон:Sfn.

Примечания

Шаблон:Примечания

Литература

Шаблон:Rq