Мажорирование стресса

Мажорирование стресса — это стратегия оптимизации, используемая в многомерном шкалировании, где для набора из n элементов размерности m ищется конфигурация X n точек в r(<<m)-мерном пространстве, которая минимизирует так называемую функцию мажорирования $σ (X)$ . Обычно r равно 2 или 3, то есть (n x r) матрица X перечисляет точки в 2- или 3-мерном евклидовом пространстве, так что результат может быть отражён визуально. Функция $σ$ является ценой или функцией потерь, которая измеряет квадрат разницы между идеальным ( $m$ -мерным) расстоянием и актуальным расстоянием в r-мерном пространстве. Она определяется как:

σ (X) = \sum_{i < j ⩽ n} w_{i j} (d_{i j} (X) - δ_{i j})^{2}

,

где $w_{i j} ⩾ 0$ является весом для мер между парами точек $(i, j)$ , $d_{i j} (X)$ является евклидовым расстоянием между $i$ и $j$ , а $δ_{i j}$ является идеальным расстоянием между точками в $m$ -мерном пространстве. Заметим, что $w_{i j}$ может быть использовано для спецификации степени доверия в похожести точек (например, можно указать 0, если нет никакой информации для конкретной пары).

Конфигурация $X$ , которая минимизирует $σ (X)$ , даёт график, в котором близкие точки соответствуют близким точкам в исходном $m$ -мерном пространстве.

Существует много путей минимизации $σ (X)$ . Например, КрускалШаблон:Sfn рекомендует итеративный подход кратчайшего спуска. Однако существенно лучший (в терминах гарантированности и скорости сходимости) метод минимизации стресса был предложен Яном де Лейвом^[1]Шаблон:Sfn. Метод итеративной мажоризации де Лейва на каждом шаге минимизирует простую выпуклую функцию, которая ограничивает $σ$ сверху и касается поверхности $σ$ в точке $Z$ , которая называется опорной точкой. В выпуклом анализе такая функция называется мажорирующей функцией. Этот итеративный процесс мажоризации также упоминается как алгоритм SMACOF (Шаблон:Lang-en).

Алгоритм SMACOF

Функцию стресса $σ$ можно разложить следующим образом:

σ (X) = \sum_{i < j ⩽ n} w_{i j} (d_{i j} (X) - δ_{i j})^{2} = \sum_{i < j} w_{i j} δ_{i j}^{2} + \sum_{i < j} w_{i j} d_{i j}^{2} (X) - 2 \sum_{i < j} w_{i j} δ_{i j} d_{i j} (X)

Заметим, что первый член является константой $C$ , а второй зависит квадратично от X (то есть для матрицы Гессе V второй член эквивалентен tr $X^{'} V X$ ), а потому относительно прост в вычислениях. Третий же член ограничен величиной

\sum_{i < j} w_{i j} δ_{i j} d_{i j} (X) = tr X^{'} B (X) X ⩾ tr X^{'} B (Z) Z

,

где $B (Z)$ имеет элементы

b_{i j} = - \frac{w_{i j} δ_{i j}}{d_{i j} (Z)}

для

d_{i j} (Z) \neq 0, i \neq j

$b_{i j} = 0$ для $d_{i j} (Z) = 0, i \neq j$

$b_{i i} = - \sum_{j = 1, j \neq i}^{n} b_{i j}$ .

Данное неравенство доказывается через неравенство Коши — Буняковского, см. статью БоргаШаблон:Sfn.

Таким образом, мы имеем простую квадратичную функцию $τ (X, Z)$ , которая мажорирует стресс:

σ (X) = C + tr X^{'} V X - 2 tr X^{'} B (X) X

⩽ C + tr X^{'} V X - 2 tr X^{'} B (Z) Z = τ (X, Z)

Тогда итеративная процедура мажоризации делает следующее:

на шаге k мы принимаем $Z \leftarrow X^{k - 1}$
$X^{k} \leftarrow \min_{X} τ (X, Z)$
останавливаемся, если $σ (X^{k - 1}) - σ (X^{k}) < ϵ$ , в противном случае возвращаемся в начало.

Было показано, что этот алгоритм уменьшает стресс монотонно (см. статью де ЛейваШаблон:Sfn).

Использование в визуализации графов

Мажорирование стресса и алгоритмы, подобные SMACOF, имеют также приложение в области визуализации графов Шаблон:Sfn Шаблон:Sfn. То есть можно найти более или менее эстетичное расположение вершин для сети или графа путём минимизации функции стресса. В этом случае $δ_{i j}$ обычно берётся как расстояние в смысле теории графов между узлами (вершинами) i и j, а веса $w_{i j}$ берутся равными $δ_{i j}^{- α}$ . Здесь $α$ выбирается как компромисс между сохранением длинных и коротких идеальных расстояний. Хорошие результаты были показаны для $α = 2$ Шаблон:Sfn.

Примечания

Шаблон:Примечания

Литература

Шаблон:Refbegin

Шаблон:Refend Шаблон:Rq

↑ Имя нидерландское и родился он в Вубурге (Нидерланды), см. с таким же именем статью «Портрет Яна де Лейва».

[1] Имя нидерландское и родился он в Вубурге (Нидерланды), см. с таким же именем статью «Портрет Яна де Лейва».

[1]

Мажорирование стресса

Содержание

Алгоритм SMACOF

Использование в визуализации графов

Примечания

Литература

Навигация

Мажорирование стресса

Алгоритм SMACOF

Использование в визуализации графов

Примечания

Литература

Навигация

Поиск