Мажорирование стресса

Материал из testwiki
Перейти к навигации Перейти к поиску

Мажорирование стресса — это стратегия оптимизации, используемая в многомерном шкалировании, где для набора из n элементов размерности m ищется конфигурация X n точек в r(<<m)-мерном пространстве, которая минимизирует так называемую функцию мажорирования σ(X). Обычно r равно 2 или 3, то есть (n x r) матрица X перечисляет точки в 2- или 3-мерном евклидовом пространстве, так что результат может быть отражён визуально. Функция σ является ценой или функцией потерь, которая измеряет квадрат разницы между идеальным (m-мерным) расстоянием и актуальным расстоянием в r-мерном пространстве. Она определяется как:

σ(X)=i<jnwij(dij(X)δij)2,

где wij0 является весом для мер между парами точек (i,j), dij(X) является евклидовым расстоянием между i и j, а δij является идеальным расстоянием между точками в m-мерном пространстве. Заметим, что wij может быть использовано для спецификации степени доверия в похожести точек (например, можно указать 0, если нет никакой информации для конкретной пары).

Конфигурация X, которая минимизирует σ(X), даёт график, в котором близкие точки соответствуют близким точкам в исходном m-мерном пространстве.

Существует много путей минимизации σ(X). Например, КрускалШаблон:Sfn рекомендует итеративный подход кратчайшего спуска. Однако существенно лучший (в терминах гарантированности и скорости сходимости) метод минимизации стресса был предложен Яном де Лейвом[1]Шаблон:Sfn. Метод итеративной мажоризации де Лейва на каждом шаге минимизирует простую выпуклую функцию, которая ограничивает σ сверху и касается поверхности σ в точке Z, которая называется опорной точкой. В выпуклом анализе такая функция называется мажорирующей функцией. Этот итеративный процесс мажоризации также упоминается как алгоритм SMACOF (Шаблон:Lang-en).

Алгоритм SMACOF

Функцию стресса σ можно разложить следующим образом:

σ(X)=i<jnwij(dij(X)δij)2=i<jwijδij2+i<jwijdij2(X)2i<jwijδijdij(X)

Заметим, что первый член является константой C, а второй зависит квадратично от X (то есть для матрицы Гессе V второй член эквивалентен trXVX), а потому относительно прост в вычислениях. Третий же член ограничен величиной

i<jwijδijdij(X)=trXB(X)XtrXB(Z)Z,

где B(Z) имеет элементы

bij=wijδijdij(Z) для dij(Z)0,ij

bij=0 для dij(Z)=0,ij

bii=j=1,jinbij.

Данное неравенство доказывается через неравенство Коши — Буняковского, см. статью БоргаШаблон:Sfn.

Таким образом, мы имеем простую квадратичную функцию τ(X,Z), которая мажорирует стресс:

σ(X)=C+trXVX2trXB(X)X
C+trXVX2trXB(Z)Z=τ(X,Z)


Тогда итеративная процедура мажоризации делает следующее:

  • на шаге k мы принимаем ZXk1
  • XkminXτ(X,Z)
  • останавливаемся, если σ(Xk1)σ(Xk)<ϵ, в противном случае возвращаемся в начало.

Было показано, что этот алгоритм уменьшает стресс монотонно (см. статью де ЛейваШаблон:Sfn).

Использование в визуализации графов

Мажорирование стресса и алгоритмы, подобные SMACOF, имеют также приложение в области визуализации графовШаблон:SfnШаблон:Sfn. То есть можно найти более или менее эстетичное расположение вершин для сети или графа путём минимизации функции стресса. В этом случае δij обычно берётся как расстояние в смысле теории графов между узлами (вершинами) i и j, а веса wij берутся равными δijα. Здесь α выбирается как компромисс между сохранением длинных и коротких идеальных расстояний. Хорошие результаты были показаны для α=2Шаблон:Sfn.

Примечания

Шаблон:Примечания

Литература

Шаблон:Refbegin

Шаблон:Refend Шаблон:Rq

  1. Имя нидерландское и родился он в Вубурге (Нидерланды), см. с таким же именем статью «Портрет Яна де Лейва».