Отношение Рэлея

Материал из testwiki
Перейти к навигации Перейти к поиску

В математике для данной комплексной эрмитовой матрицы M и ненулевого вектора x отношение Рэлея[1] R(M,x) определяется следующим образом[2][3]:

R(M,x)=x*Mxx*x.

Для действительных матриц условие эрмитовости матрицы сводится к её симметричности, а эрмитово сопряжение векторов x* превращается в обычное транспонирование x. Заметьте, что R(M,cx)=R(M,x) для любой вещественной константы c0. Напомним, что эрмитова (как и симметричная вещественная) матрица имеет вещественные собственные значения. Можно показать, что для матрицы отношение Рэлея достигает минимального значения λmin (наименьшее собственное число матрицы M) когда x равен vmin (соответствующий собственный вектор). Подобным образом можно показать, что R(M,x)λmax и R(M,vmax)=λmax. Отношение Рэлея используется в теореме Куранта-Фишера о минимаксе для получения всех значений собственных чиселШаблон:Sfn. Используется оно и в алгоритмах нахождения собственных значений матрицы для получения приближения собственного значения из приближения собственного вектора. А именно, отношение является базой для Шаблон:Не переведено 5Шаблон:SfnШаблон:Sfn.

Множество значений отношения Рэлея называется Шаблон:Не переведено 5Шаблон:SfnШаблон:Sfn.

Специальный случай ковариационных матриц

Ковариационная матрица M для многомерной статистической выборки A (матрицы наблюдений) может быть представлена в виде произведения A' AШаблон:SfnШаблон:Sfn. Будучи симметричной вещественной матрицей, M имеет неотрицательные собственные значения и ортогональные (или приводимые к ортогональным) собственные вектора.

Во-первых, то, что собственные значения λi не отрицательны:

Mvi=AAvi=λivi
viAAvi=viλivi
Avi2=λivi2
λi=Avi2vi20.

И, во-вторых, что собственные вектора vi ортогональны друг другу:

Mvi=λivi
vjMvi=λivjvi
(Mvj)vi=λivjvi
λjvjvi=λivjvi
(λjλi)vjvi=0
vjvi=0 (если собственные значения различны — в случае одинаковых значений можно найти ортогональный базис).

Теперь покажем, что отношение Рэлея принимает максимальное значение на векторе, соответствующем наибольшее собственное значение. Разложим произвольный вектор x по базису собственных нормированных векторов vi:

x=i=1nαivi, где αi=xvivivi=x,vivi2 является проекцией x на vi
i,||vi||=(vivi)=1

Таким образом, равенство

R(M,x)=xAAxxx

можно переписать в следующем виде:

R(M,x)=(j=1nαjvj)AA(i=1nαivi)(j=1nαjvj)(i=1nαivi)

Поскольку собственные вектора ортогональны, последнее равенство превращается в

R(M,x)=i=1nαi2λii=1nαi2=i=1nλi(xvi)2(xx)=i=1nλi(xvi)2(xx)(vivi)

Последнее равенство показывает, что отношение Рэлея является суммой квадратов косинусов углов между вектором x и каждым из собственных векторов vi, умноженных на соответствующее собственное значение.

Если вектор x максимизирует R(M,x), то все вектора, полученные из x умножением на скаляр (kx для k0) также максимизируют R. Таким образом, задачу можно свести к нахождению максимума i=1nαi2λi при условии i=1nαi2=1.

Поскольку все собственные числа не отрицательны, задача сводится к нахождению максимума выпуклой функции и можно показать, что он достигается при α1=1 и i>1,αi=0 (собственные значения упорядочены по убыванию).

Таким образом, отношение Рэлея достигает максимума на собственном векторе, соответствующему максимальному собственному значению.

Тот же результат с использованием множителей Лагранжа

Тот же результат может быть получен с помощью множителей Лагранжа. Задача состоит в нахождении критических точек функции

R(M,x)=xTMx,

при постоянной величине x2=xTx=1. То есть, нужно найти критические точки функции

(x)=xTMxλ(xTx1),

где λ — множитель Лагранжа. Для стационарных точек функции (x) выполняется равенство

d(x)dx=0
2xTMT2λxT=0
Mx=λx

и R(M,x)=xTMxxTx=λxTxxTx=λ.

Таким образом, собственные вектора x1xn матрицы M являются критическими точками отношения Рэлея и их собственные значения λ1λn — соответствующими стационарными значениями.

Это свойство является базисом метода главных компонент и канонической корреляции.

Использование в теории Штурма — Лиувилля

Теория Штурма — Лиувилля заключается в исследовании линейного оператора

L(y)=1w(x)(ddx[p(x)dydx]+q(x)y)

со скалярным произведением

y1,y2=abw(x)y1(x)y2(x)dx,

где функции удовлетворяют некоторым специфичным граничным условиям в точках a и b. Отношение Рэлея здесь принимает вид

y,Lyy,y=aby(x)(ddx[p(x)dydx]+q(x)y(x))dxabw(x)y(x)2dx.

Иногда это отношение представляют в эквивалентном виде используя интегрирование по частямШаблон:Sfn:

y,Lyy,y=aby(x)(ddx[p(x)y(x)])dx+abq(x)y(x)2dxabw(x)y(x)2dx
=y(x)[p(x)y(x)]|ab+aby(x)[p(x)y(x)]dx+abq(x)y(x)2dxabw(x)y(x)2dx
=p(x)y(x)y(x)|ab+ab[p(x)y(x)2+q(x)y(x)2]dxabw(x)y(x)2dx.

Обобщение

Для любой пары (A,B) вещественных симметричных положительно определённых матриц и ненулевого вектора x, обобщенное отношение Рэлея определяется как

R(A,B;x):=xTAxxTBx.

Обобщённое отношение Рэлея можно свести к отношению Рэлея R(D,Cx) путём преобразования D=C*1AC1, где Cразложение Холецкого матрицы B.

См. также

Примечания

Шаблон:Примечания

Литература

Шаблон:Rq
  1. также известно под именем отношение Рэлея-Рица, названного в честь Вальтера Рица и Лорда Рэлея.
  2. Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176–180.
  3. Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998