Алгоритм распространения доверия

Алгоритм распространения доверия (Шаблон:Lang-en, также алгоритм «sum-product») — алгоритм маргинализации с помощью двунаправленной передачи сообщений на графе, применяемый для вывода на графических вероятностных моделях (таких как байесовские и марковские сети). Предложен Дж. Перлом в 1982 году.

Постановка задачи

Шаблон:Стиль статьи Рассмотрим функцию:

p^{*} (X) = \prod_{j = 1}^{m} f_{j} (X_{j})

, где

X_{j} = {x_{i}}_{i = 1}^{n}

Чтобы получить вероятность, необходимо её нормализовать:

p (X) = \frac{1}{Z} \prod_{j = 1}^{m} f_{j} (X_{j}), Z = \sum_{X} \prod_{j = 1}^{m} f_{j} (X_{j})

Рассматриваются следующие задачи:

Задача нормализации:

найти

Z = \sum_{X} \prod_{j = 1}^{m} f_{j} (X_{j})

Задача маргинализации:

найти

p_{i}^{*} (x_{i}) = \sum_{k \neq i} p^{*} (X)

Задача нормализованной маргинализации

найти

p_{i} (x_{i}) = \sum_{k \neq i} p (X)

Все эти задачи NP-полны, так что сложность их решения в худшем случае возрастает экспоненциально. Однако некоторые частные случаи можно решить быстрее, чем и занимается данный алгоритм.

Структура графа

Граф, используемый алгоритмом, состоит из вершин, соответствующих переменным, и вершин, соответствующих функциям. Функции соединены с переменными, от которых они зависят.

Пример

Например, функции

p^{*} (X) = f_{1} (x_{1}) f_{2} (x_{2}) f_{3} (x_{3}) f_{4} (x_{1}, x_{2}) f_{5} (x_{2}, x_{3})

соответствует следующий граф:

Файл:SumProduct ExampleGraph.png

Передача сообщений

В графе пересылаются сообщения двух видов: от функций к переменным и от переменных к функциям.

От переменной $x_{i}$ к функции $f_{j}$ :

q_{i \to j} (x_{i}) = \prod_{k \in n e (i) ∖ j} r_{k \to i} (x_{i})

(здесь

n e (i)

— множество вершин, соседних с i)

От функции $f_{j}$ к переменной $x_{i}$ :

r_{j \to i} (x_{i}) = \sum_{X_{i} ∖ x_{i}} (f_{j} (X_{j}) \prod_{k \in n e (i) ∖ j} q_{k \to j} (x_{k})

При этом пустое произведение считаем равным единице. Из этих формул видно, что если у вершины всего одна соседняя точка, то её (вершины) сообщение можно вычислить, не зная входящих сообщений.

Алгоритм

Существует два подхода, в зависимости от характера полученного графа:

Подход 1

Предположим, что граф является деревом. Начиная с листьев будем постепенно обходить все вершины и вычислять сообщения (при этом применяется стандартное правило передачи сообщений: сообщение можно передавать только в том случае, если его можно полностью построить).

Тогда за количество шагов, равное диаметру графа, работа алгоритма закончится.

Подход 2

Если граф не является деревом, то можно начать с того, что все переменные передают сообщение 1, а потом уже его модифицируют, когда до них доходят сообщения от функций.

Такой алгоритм в общем случае работает неверно и делает много лишнего, но все же полезен на практике.

Вычисление маргиналов

Когда рассылка сообщений закончена, маргиналы вычисляются по следующей формуле:

p_{i}^{*} (x_{i}) = \prod_{j \in n e (i)} r_{j \to i} (x_{i})

Z = \sum_{i} p_{i}^{*} (x_{i}), p (x_{i}) = \frac{1}{Z} p_{i}^{*} (x_{i})

Нормализация на лету

Если нужно рассчитать только нормализованные маргиналы (настоящие вероятности), то можно на каждом шаге нормализовать сообщения от переменных к функциям:

q_{i \to j} (x_{i}) = α_{i j} \prod_{k \in n e (i) ∖ j} r_{k \to i} (x_{i})

,

где $α_{i j}$ подобраны так, чтобы

\sum_{i} q_{i \to j} (x_{i}) = 1

Математическое обоснование алгоритма

С математической точки зрения алгоритм перераскладывает изначальное разложение:

p^{*} (X) = \prod_{j = 1}^{m} f_{j} (X_{j})

в произведение:

p^{*} (X) = \prod_{j = 1}^{m} ϕ_{j} (X_{j}) \prod_{i = 1}^{m} ψ_{i} (x_{i})

,

где $ϕ_{j}$ соответствует узлам-функциям, а $ψ_{i}$ — узлам-переменным.

Изначально, до передачи сообщений $ϕ_{j} (X_{j}) = f_{j} (X_{j})$ и $ψ_{i} (x_{i}) = 1$

Каждый раз, когда приходит сообщение $r_{j \to i}$ из функции в переменную, $ϕ$ и $ψ$ пересчитываются:

ψ_{i} (x_{i}) = \prod_{j \in n e (i)} r_{j \to i} (x_{i})

,

ϕ_{j} (X_{i}) = \frac{f_{j} (X_{j})}{\prod_{i \in n e (j)} r_{j \to i} (x_{i})}

Очевидно, что общее произведение от этого не меняется, а $ψ_{i}$ по окончании передачи сообщений станет маргиналом $p^{*} (x_{i})$ .

Ссылки

С. Николенко. Курс «Вероятностное обучение»

Алгоритм распространения доверия

Содержание

Постановка задачи

Структура графа

Пример

Передача сообщений

Алгоритм

Подход 1

Подход 2

Вычисление маргиналов

Нормализация на лету

Математическое обоснование алгоритма

Ссылки

Навигация

Алгоритм распространения доверия

Постановка задачи

Структура графа

Пример

Передача сообщений

Алгоритм

Подход 1

Подход 2

Вычисление маргиналов

Нормализация на лету

Математическое обоснование алгоритма

Ссылки

Навигация

Поиск