Цепь Маркова

Материал из testwiki
Перейти к навигации Перейти к поиску
Пример цепи с двумя состояниями

Це́пь Ма́ркова — последовательность случайных событий с конечным или счётным числом исходов, где вероятность наступления каждого события зависит только от состояния, достигнутого в предыдущем событии[1]. Характеризуется тем свойством, что, говоря нестрого, при текущем настоящем состоянии системы, её будущее состояние не зависит от прошлого. Названа в честь А. А. Маркова (старшего), который впервые ввёл это понятие в работе 1906 года.[2]

Цепь Маркова с дискретным временем

Определение

Последовательность дискретных случайных величин {Xn}n0 называется простой цепью Маркова (с дискретным временем), если

(Xn+1=in+1Xn=in,Xn1=in1,,X0=i0)=(Xn+1=in+1Xn=in).

Таким образом, в простейшем случае условное распределение последующего состояния цепи Маркова зависит только от текущего состояния и не зависит от всех предыдущих состояний (в отличие от цепей Маркова высших порядков).

Область значений случайных величин {Xn} называется простра́нством состоя́ний цепи, а номер n — номером шага.

Переходная матрица и однородные цепи

Матрица P(n), где

Pij(n)(Xn+1=jXn=i)

называется ма́трицей перехо́дных вероя́тностей на n-м шаге, а вектор 𝐩=(p1,p2,), где

pi(X0=i)

нача́льным распределе́нием цепи Маркова.

Очевидно, матрица переходных вероятностей является стохастической справа, то есть

jPij(n)=1,n.

Цепь Маркова называется одноро́дной, если матрица переходных вероятностей не зависит от номера шага, то есть

Pij(n)=Pij,n.

В противном случае цепь Маркова называется неоднородной. В дальнейшем будем предполагать, что имеем дело с однородными цепями Маркова.

Конечномерные распределения и матрица перехода за n шагов

Из свойств условной вероятности и определения однородной цепи Маркова получаем:

(Xn=in,,X0=i0)=Pin1,inPi0,i1Pi0,

откуда вытекает специальный случай уравнения Колмогорова — Чепмена:

(Xn=inX0=i0)=(Pn)i0,in,

то есть матрица переходных вероятностей за n шагов однородной цепи Маркова есть n-я степень матрицы переходных вероятностей за 1 шаг. Наконец,

(Xn=in)=((PT)n𝐩)in.

Типы состояний

Примеры

Цепь Маркова с непрерывным временем

Определение

Семейство дискретных случайных величин {Xt}t0 называется цепью Маркова (с непрерывным временем), если

(Xt+h=xt+hXs=xs,0<st)=(Xt+h=xt+hXt=xt).

Цепь Маркова с непрерывным временем называется однородной, если

(Xt+h=xt+hXt=xt)=(Xh=xhX0=x0).

Матрица переходных функций и уравнение Колмогорова — Чепмена

Аналогично случаю дискретного времени, конечномерные распределения однородной цепи Маркова с непрерывным временем полностью определены начальным распределением

𝐩=(p1,p2,),pi=(X0=i),i=1,2,

и ма́трицей перехо́дных фу́нкций (переходных вероятностей)

𝐏(h)=(Pij(h))=(Xh=jX0=i).

Матрица переходных вероятностей удовлетворяет уравнению Колмогорова — Чепмена: 𝐏(t+s)=𝐏(t)𝐏(s) или

Pij(t+s)=kPik(t)Pkj(s).

Матрица интенсивностей и дифференциальные уравнения Колмогорова

По определению матрица интенсивностей 𝐐=limh0𝐏(h)𝐈h, или, что эквивалентно,

𝐐=(qij)=(dPij(h)dh)h=0.

Из уравнения Колмогорова — Чепмена следуют два уравнения:

Для обоих уравнений начальным условием выбирается 𝐏(0)=𝐈. Соответствующее решение 𝐏(t)=exp(𝐐t).

Свойства матриц P и Q

Для любого t>0 матрица 𝐏(t) обладает следующими свойствами:

  1. Матричные элементы 𝐏(t) неотрицательны: Pij(t)0 (неотрицательность вероятностей).
  2. Сумма элементов в каждой строке 𝐏(t) равна 1: jPij(t)=1 (полная вероятность), то есть матрица 𝐏(t) является стохастической справа (или по строкам).
  3. Все собственные числа λ матрицы 𝐏(t) не превосходят 1 по абсолютной величине: |λ|1. Если |λ|=1, то λ=1.
  4. Собственному числу λ=1 матрицы 𝐏(t) соответствует как минимум один неотрицательный левый собственный вектор-строка (равновесие): (p1*,p2*,...); pi*0; ipi*=1; ipi*Pij(t)=pj*.
  5. Для собственного числа λ=1 матрицы 𝐏(t) все корневые векторы являются собственными, то есть соответствующие жордановы клетки тривиальны.

Матрица 𝐐 обладает следующими свойствами:

  1. Внедиагональные матричные элементы 𝐐 неотрицательны: qij0ij.
  2. Диагональные матричные элементы 𝐐 неположительны: qii0.
  3. Сумма элементов в каждой строке 𝐐 равна 0: jqij=0.
  4. Действительная часть всех собственных чисел μ матрицы 𝐐 неположительна: Re(μ)0. Если Re(μ)=0, то μ=0.
  5. Собственному числу μ=0 матрицы 𝐐 соответствует как минимум один неотрицательный левый собственный вектор-строка (равновесие): (p1*,p2*,...); pi*0; ipi*=1; ipi*qij=0.
  6. Для собственного числа μ=0 матрицы 𝐐 все корневые векторы являются собственными, то есть соответствующие жордановы клетки тривиальны.

Граф переходов, связность и эргодические цепи Маркова

Для цепи Маркова с непрерывным временем строится ориентированный граф переходов (кратко — граф переходов) по следующим правилам:

  • Множество вершин графа совпадает со множеством состояний цепи.
  • Вершины i,j(ij) соединяются ориентированным ребром ij, если qij>0 (то есть интенсивность потока из i-го состояния в j-е положительна).

Топологические свойства графа переходов связаны со спектральными свойствами матрицы 𝐐. В частности, для конечных цепей Маркова верны следующие теоремы:

  • Следующие три свойства А, Б, В конечной цепи Маркова эквивалентны (обладающие ими цепи иногда называют слабо эргодическими):
А. Для любых двух различных вершин графа переходов i,j(ij) найдется такая вершина k графа («общий сток»), что существуют ориентированные пути от вершины i к вершине k и от вершины j к вершине k. Замечание: возможен случай k=i или k=j; в этом случае тривиальный (пустой) путь от i к i или от j к j также считается ориентированным путём.
Б. Нулевое собственное число матрицы 𝐐 невырождено.
В. При t матрица 𝐏(t) стремится к матрице, у которой все строки совпадают (и совпадают, очевидно, с равновесным распределением).
  • Следующие пять свойств А, Б, В, Г, Д конечной цепи Маркова эквивалентны (обладающие ими цепи называют эргодическими):
А. Граф переходов цепи ориентированно связен.
Б. Нулевое собственное число матрицы 𝐐 невырождено и ему соответствует строго положительный левый собственный вектор (равновесное распределение).
В. Для некоторого t>0 матрица 𝐏(t) строго положительна (то есть Pij(t)>0 для всех i,j).
Г. Для всех t>0 матрица 𝐏(t) строго положительна.
Д. При t матрица 𝐏(t) стремится к строго положительной матрице, у которой все строки совпадают (и совпадают, очевидно, с равновесным распределением).

Примеры

Файл:MarkovTriangle.png
Рис. Примеры графов переходов для цепей Маркова: a) цепь не является слабо эргодической (не существует общего стока для состояний A2,A3); b) слабо эргодическая цепь (граф переходов не является ориентированно связным) c) эргодическая цепь (граф переходов ориентированно связан).

Рассмотрим цепи Маркова с тремя состояниями и с непрерывным временем, соответствующие графам переходов, представленным на рис. В случае (a) отличны от нуля только следующие недиагональные элементы матрицы интенсивностей — q12,q13, в случае (b) отличны от нуля только q12,q31q32, а в случае (c) — q12,q31q23. Остальные элементы определяются свойствами матрицы 𝐐 (сумма элементов в каждой строке равна 0). В результате для графов (a), (b), (c) матрицы интенсивностей имеют вид: 𝐐a=((q12+q13)q12q13000000), 𝐐b=(q12q120000q31q32(q31+q32)), 𝐐c=(q12q1200q23q23q310q31),

Основное кинетическое уравнение

Шаблон:Основная Основное кинетическое уравнение описывает эволюцию распределения вероятностей в цепи Маркова с непрерывным временем. «Основное уравнение» здесь — не эпитет, а перевод термина Шаблон:Lang-en. Для вектора-строки распределения вероятностей π основное кинетическое уравнение имеет вид:

dπdt=π𝐐

и совпадает, по существу, с прямым уравнением Колмогорова. В физической литературе чаще используют векторы-столбцы вероятностей и записывают основное кинетическое уравнение в виде, который явно использует закон сохранения полной вероятности:

dpidt=j,ji(TijpjTjipi),

где Tij=qji.

Если для основного кинетического уравнения существует положительное равновесие pi*>0, то его можно записать в форме

dpidt=j,jiTijpj*(pjpj*pipi*).

Функции Ляпунова для основного кинетического уравнения

Для основного кинетического уравнения существует богатое семейство выпуклых функций Ляпунова — монотонно меняющихся со временем функций распределения вероятностей. Пусть h(x)(x>0) — выпуклая функция одного переменного. Для любого положительного распределения вероятностей (pi>0) определим функцию Моримото Hh(p):

Hh(p)=ipi*h(pipi*).

Производная Hh(p) по времени, если p(t) удовлетворяет основному кинетическому уравнению, есть

dHh(p(t))dt=i,jijTijpj*[h(pipi*)h(pjpj*)+h(pipi*)(pjpj*pipi*)]0.

Последнее неравенство справедливо из-за выпуклости h(x).

Примеры функций Моримото Hh(p)

  • h(x)=|x1|, Hh(p)=i|pipi*|;
эта функция — расстояние от текущего распределения вероятностей до равновесного в l1-норме. Сдвиг по времени является сжатием пространства вероятностных распределений в этой норме. (О свойствах сжатий см. статью Теорема Банаха о неподвижной точке.)
  • h(x)=xlnx, Hh(p)=ipiln(pipi*);
эта функция — (минус) энтропия Кульбака (см. Расстояние Кульбака — Лейблера). В физике она соответствует свободной энергии, деленной на kT (где k — постоянная Больцмана, T — абсолютная температура):
если pi*=exp(μ0Ui/kT) (распределение Больцмана), то
Hh(p)=ipilnpi+ipiUi/kTμ0=(UTS)/kT.
  • h(x)=lnx, Hh(p)=ipi*ln(pipi*);
эта функция — аналог свободной энергии для энтропии Бурга, широко используемой в обработке сигналов:
SBurg=ilnpi
  • h(x)=(x1)22, Hh(p)=i(pipi*)22pi*;
это квадратичное приближение для (минус) энтропии Кульбака вблизи точки равновесия. С точностью до постоянного во времени слагаемого эта функция совпадает с (минус) энтропией Фишера, которую даёт следующий выбор,
  • h(x)=x22, Hh(p)=ipi22pi*;
это (минус) энтропия Фишера.
  • h(x)=xq1q1,q>0,q1, Hh(p)=1q1[ipi*(pipi*)q1];
это один из аналогов свободной энергии для Шаблон:Iw.
SqTsallis(p)=1q1(1ipiq).
служит основой для статистической физики неэкстенсивных величин. При q1 она стремится к классической энтропии Больцмана — Гиббса — Шеннона, а соответствующая функция Моримото — к (минус) энтропии Кульбака.

Практическое применение

Шаблон:Основная статья Шаблон:Дополнить раздел Одной из первых научных дисциплин, в которой цепи Маркова нашли практическое применение, стала лингвистика (в частности текстология). Сам Марков для иллюстрации своих результатов исследовал зависимость в чередовании гласных и согласных в первых главах «Евгения Онегина» и «Детских годов Багрова-внука»[3].

Примечания

Шаблон:Примечания

Литература

Ссылки

Шаблон:Внешние ссылки Шаблон:Состояния цепи Маркова Шаблон:Типы искусственных нейронных сетей Шаблон:Машинное обучение Шаблон:Перевести