Многочастичный фильтр

Многочасти́чный фильтрШаблон:Sfn (МЧФ, Шаблон:Lang-en — «фильтр частиц», «частичный фильтр», «корпускулярный фильтр») — последовательный метод Монте-Карло — рекурсивный алгоритм для численного решения проблем оценивания (фильтрации, сглаживания), особенно для нелинейных и не-гауссовских случаев. Со времени описания в 1993 годуШаблон:Sfn Н. Гордоном, Д. Салмондом и А. Смитом используется в различных областях — навигации, робототехнике, компьютерном зрении.

В сравнении с обычно применяемыми для подобных задач методами — расширенными фильтрами Кальмана (EKF) — многочастичные фильтры не зависят от методов линеаризации или апроксимации. Обычный EKF плохо справляется с существенно нелинейными моделями, а также в случае шумов системы и измерений, сильно отличающихся от гауссовых, поэтому были разработаны различные модификации, такие как UKF (Шаблон:Lang-en), QKF (Шаблон:Lang-en) и т. п.Шаблон:Sfn. Следует отметить, что в свою очередь многочастичные фильтры более требовательны к вычислительным ресурсам.

Термин «particle filter» был дан Дел Моралом в 1996 году^[1], а «sequential Monte Carlo» — Лю (Liu) и Ченом (Chen) в 1998.

Многие используемые на практике многочастичные фильтры выводятся применением последовательного метода Монте-Карло к последовательности целевых распределений Шаблон:Sfn.

Постановка задачи

МЧФ предназначен для оценки последовательности скрытых переменных $x_{n}$ для $n = 1, 2, \dots$ на основании наблюдений $y_{n}$ при $n = 1, 2, \dots$ . Для простоты изложения будем считать, что рассматривается динамическая система, и $x_{n}$ и $y_{n}$ — действительные вектора состояния и измерений соответственноШаблон:Sfn.

Стохастическое уравнение состояния системы имеет вид:

x_{k} = f_{k} (x_{k - 1}, v_{k})

,

где $f_{k}$ функция изменения состояния системы, $v_{k}$ — случайная величина, возмущающее воздействие.

Уравнение измерений:

y_{k} = h_{k} (x_{k}, w_{k})

,

где $h_{k}$ функция измерения, $w_{k}$ — случайная величина, шум измерений.

Функции $f_{k}$ и $h_{k}$ в общем случае нелинейные, а статистические характеристики шума системы ( $v_{k}$ ) и измерений ( $w_{k}$ ) предполагаются известными.

Задачей фильтрации является получение оценки ${\hat{x}}_{k}$ на основе известных к моменту $k$ результатов измерений $y_{1 : k}$ .

Скрытая марковская модель и байесовский вывод

Шаблон:Main

Рассмотрим дискретный марковский процесс ${X_{n}}_{n ⩾ 1}$ со следующими распределениями вероятностей:

Шаблон:EF

где $μ (x)$ — плотность вероятности, $f (x_{n} ∣ x_{n - 1})$ — условная плотность вероятности (переходная плотность вероятности) при переходе от $x_{n - 1}$ к $x_{n}$ .

Здесь нотация $X ∣ Y \sim f (\dots)$ означает, что $X$ при условии $Y$ распределено как $f (\dots)$ .

Реализации процесса ${X_{n}}$ (скрытые переменные $x_{n}$ ) наблюдаются посредством другого случайного процесса ${Y_{n}}_{n ⩾ 1}$ — процесса измерений — с маргинальными плотностями:

Шаблон:EF

где $h (y_{n} ∣ x_{n})$ — условная плотность вероятности (плотность измерений), измерения считаются статистически независимыми.

Модель может проиллюстрирована следующей диаграммой переходов:

\begin{matrix} X_{1} & \to & X_{2} & \to & X_{3} & \to & X_{4} & \to & \dots \\ ↓ & ↓ & ↓ & ↓ & \dots \\ Y_{1} & Y_{2} & Y_{3} & Y_{4} & \dots \end{matrix}

Для простоты считаем, что переходная плотность и плотность измерений не зависят от $n$ . Параметры модели считаются заданными.

Определённая таким образом модель системы и измерений известна как скрытая марковская модельШаблон:Sfn.

Уравнение Шаблон:Eqref определяет априорное распределение для процесса ${X_{n}}$ :

Шаблон:EF

Аналогично Шаблон:Eqref задаёт функцию правдоподобия:

Шаблон:EF

Здесь и далее нотация $x_{k : l}$ для $k ⩽ l$ обозначает $(x_{k}, \dots, x_{l})$ .

Таким образом, байесовский вывод для ${X_{1 : n}}$ при известных реализациях измерений ${Y_{1 : n}}$ , обозначенных соответственно как ${x_{1 : n}}$ и ${y_{1 : n}}$ , будет опираться на апостериорное распределение

Шаблон:EF

где (здесь $d x_{1 : n}$ — доминирующая мера):

p (y_{1 : n}) = \int p (x_{1 : n}) p (y_{1 : n} ∣ x_{1 : n}) d x_{1 : n}

.

Выборка по значимости

См. также Выборка по значимости.

Метод Монте-Карло позволяет оценивать свойства довольно сложных распределений вероятностей, например, путём вычисления средних и дисперсии в виде интегралаШаблон:Sfn:

\bar{θ} = \int θ (x) p (x) d x

,

где $θ (x)$ — функция для оценивания. Например, для среднего можно положить: $θ (x) = x$ .

В случае невозможности аналитического решения, задача может быть решена численно генерированием случайных выборок с плотностью $p (x)$ , обозначим их как ${x^{(i)}}_{1 ⩽ i ⩽ N}$ , и получением среднего арифметического по точкам выборкиШаблон:Sfn:

\bar{θ} \approx \frac{1}{N} \sum_{i = 1}^{N} θ (x^{(i)})

В более общем случае, когда выборка из $p$ затруднена, применяется другое распределение $q$ (так называемое Шаблон:Lang-en), а для сохранения несмещённости оценки вводятся весовые коэффициенты $w_{i}$ на основе отношения $r (x^{(i)}) = p (x^{(i)}) / q (x^{(i)})$ Шаблон:Sfn:

w_{i} = \frac{r (x^{(i)})}{\sum_{j = 1}^{N} r (x^{(j)})}

после чего вычисляет взвешенное среднее:

\bar{θ} = \int θ (x) r (x) q (x) d x \approx \sum_{i = 1}^{N} w_{i} θ (x^{(i)})

,

Перевыборка

Хотя вспомогательное распределение используется в основном для упрощения выборки из основного распределения $p$ , часто применяется процедура «выборки и перевыборки по значимости» (Шаблон:Lang-en). Эта процедура состоит из двух этапов: собственно выборки по значимости с вычислением весов $w_{i}$ , и дополнительной выборки точек, учитывающих эти весаШаблон:Sfn.

Перевыборка особенно необходима для последовательных фильтровШаблон:Sfn.

Последовательный метод Монте-Карло

Методы многочастичной фильтрации и сглаживания являются наиболее известными примерами алгоритмов последовательного метода Монте-Карло (Шаблон:Lang-en). До такой степени, что в литературе часто не делают между ними различия. Тем не менее, SMC включает в себя более широкий класс алгоритмов, применимых для описания более сложных приблизительных методов фильтрации и сглаживанияШаблон:Sfn.

Последовательные методы Монте-Карло являются классом методов Монте-Карло, которые производят последовательную выборку из последовательности целевых плотностей вероятностей ${f_{n} (x_{1 : n})}$ увеличивающейся размерности, где каждое $f_{n} (x_{1 : n})$ определено на декартовой степени $𝒳^{n}$ Шаблон:Sfn.

Если записать плотность как:Шаблон:Sfn

f_{n} (x_{1 : n}) = \frac{ϕ_{n} (x_{1 : n})}{Z_{n}}

, где

ϕ_{n} : 𝒳^{n} \to ℝ^{+}

известна поточечно, а

Z_{n} = \int ϕ_{n} (x_{1 : n}) d x_{1 : n}

— нормализующая, возможно неизвестная, постоянная, то

SMC-алгоритм будет находить приближения $f_{k} (x_{1 : k})$ и оценки $Z_{k}$ для $k = 1, 2, \dots$ .

Например, для случая фильтрации можно положить (см. Шаблон:Eqref):

ϕ_{n} (x_{1 : n}) = p (x_{1 : n}) p (y_{1 : n} ∣ x_{1 : n})

и

Z_{n} = p (y_{1 : n})

,

из чего будем иметь:

f_{n} (x_{1 : n}) = \frac{p (x_{1 : n}) p (y_{1 : n} ∣ x_{1 : n})}{p (y_{1 : n})} = p (x_{1 : n} | y_{1 : n})

.

Опуская вывод, схему предиктор-корректор можно представить в следующем видеШаблон:Sfn:

p (x_{1 : n} ∣ y_{1 : n - 1}) = p (x_{1 : n - 1} ∣ y_{1 : n - 1}) f (x_{n} ∣ x_{n - 1})

— предиктор,

p (x_{1 : n} ∣ y_{1 : n}) = \frac{h (y_{n} ∣ x_{n}) p (x_{1 : n} ∣ y_{1 : n - 1})}{p (y_{n} ∣ y_{1 : n - 1})}

— корректор.

Множитель $(p (y_{n} ∣ y_{1 : n - 1}))^{- 1}$ — нормализующая постоянная, которая не требуется для обычного SMC-алгоритма.

Алгоритм

Типичный алгоритм многочастичного фильтра можно представить в следующем видеШаблон:Sfn:

   Алгоритм МЧФ
   -- инициализация
   для i = 1...N:
     выборка  $ξ_{0}^{(i)}$  из  $q_{0} (x_{0} ∣ y_{0})$ 
     -- начальные веса
      $ω_{0}^{(i)} := h (y_{0} ∣ ξ_{0}^{(i)}) μ (ξ_{0}^{(i)}) / q_{0} (ξ_{0}^{(i)} ∣ y_{0})$  
   кц
   для n = 1...T:
     если ПЕРЕВЫБОРКА то
       -- выбор индексов  $j_{i} \in {1, \dots, N}$  N частиц в соответствии с весами
        $j_{1 : N}$  = SelectByWeight( ${w_{n - 1}^{(j)}}$ )
       для i = 1...N:
          $x_{n - 1}^{(i)} := ξ_{n - 1}^{(j_{i})}$ 
          $w_{n - 1}^{(i)} := 1 / N$ 
     иначе
       для i = 1...N:
          $x_{n - 1}^{(i)} := ξ_{n - 1}^{(i)}$ 
     для i = 1...N:
       -- шаг распространения частицы
        $ξ_{n}^{(i)} \sim q_{n} (ξ_{n}^{(i)} ∣ ξ_{n - 1}^{(i)}, y_{n})$ 
       -- обновление весов
        $ω_{n}^{(i)} := w_{n - 1}^{(i)} h (y_{n} ∣ ξ_{n}^{(i)}) f (ξ_{n}^{(i)} ∣ x_{n - 1}^{(i)}) / q_{n} (ξ_{n}^{(i)} ∣ x_{n - 1}^{(i)}, y_{n})$  
     кц
     -- нормализация весов
      $s := \sum_{j = 1}^{N} ω_{n}^{(j)}$ 
     для i = 1...N:
        $w_{n}^{(i)} := ω_{n}^{(i)} / s$ 
   кц

См. также

Фильтр Кальмана#UKF

Примечания

Шаблон:Примечания

Литература

Шаблон:Книга

Ссылки

Particle Filter, SciPy Cookbook

Шаблон:Вс

↑ Шаблон:Статья

[1] Шаблон:Статья

[1]

Многочастичный фильтр

Содержание

Постановка задачи

Скрытая марковская модель и байесовский вывод

Выборка по значимости

Перевыборка

Последовательный метод Монте-Карло

Алгоритм

См. также

Примечания

Литература

Ссылки

Навигация

Многочастичный фильтр

Постановка задачи

Скрытая марковская модель и байесовский вывод

Выборка по значимости

Перевыборка

Последовательный метод Монте-Карло

Алгоритм

См. также

Примечания

Литература

Ссылки

Навигация

Поиск