НОВОСТИ БИБЛИОТЕКА ЭНЦИКЛОПЕДИЯ БИОГРАФИИ КАРТА САЙТА ССЫЛКИ О ПРОЕКТЕ

§ 8. Цепи Маркова. Возвратные и невозвратные состояния. Финальные распределения вероятностей. Стационарность

1. Условно будем говорить о некоторой физической системе, шаг за шагом меняющей свое фазовое состояние. Будем считать, что имеется лишь конечное или счетное число различных фазовых состояний ε₁, ε₂, ... Обозначим ξ(n) состояние системы через n шагов. Будем предполагать, что цепочка последовательных переходов

зависит от вмешательства случая, причем соблюдается следующая закономерность: если на каком-либо шаге n система находится в состоянии ε_i, то, независимо от предшествующих обстоятельств, она на следующем шаге с вероятностью p_ij переходит в состояние ε_j.

(8.0)

i,j = 1, 2, ...

Описанная выше модель называется однородной цепью Маркова, а вероятности p_ij называются переходными вероятностями этой цепи. Кроме них, еще задается начальное распределение вероятностей

(8.1)

i = 1, 2, ...

Какова вероятность того, что система через n шагов будет находиться в состоянии ε_j?

Обозначим эту вероятность p_j (n):

(8.2)

Через n-1 шагов система обязательно будет находиться в одном из состояний ε_k, k = 1, 2, ..., причем в ε_k она будет с вероятностью, обозначенной p_k (n-1). При условии, что через n-1 шагов система будет находиться в состоянии ε_k, вероятность оказаться через n шагов в состоянии ε_j равна вероятности p_kj перехода из ε_k в ε_j. Используя формулу полной вероятности, получаем, что

(8.3)

Это дает следующие рекуррентные соотношения для вероятностей р_j (n), j = 1, 2, ...:

(8.4)

Если в начальный момент система находится в определенном состоянии ε_i, то начальное распределение вероятностей таково, что р_i⁰ = 1, р⁰_k = 0 для k≠i, а вероятность p_j (n) совпадает с вероятностью p_ij (n) того, что система из состояния ε_i за n шагов перейдет в состояние ε_j.

(8.5)

i,j = 1, 2, ...

При начальном распределении вида р_i⁰ = 1, р_k⁰ = 0 для k≠i формула (8.4) дает следующие соотношения между переходными вероятностями р_ij (n); i, j = 1, 2, ...:

(8.6)

Удобно ввести матрицу Согласно формуле (8.6)

P(0) = I, P(1) = P, P(2) = P(1)P = P², ...,

где I - единичная матрица, - матрица переходных вероятностей. Видно, что имеет место следующее равенство:

P (n) = Pⁿ, (n = 1, 2, ...).

Рассмотрим несколько примеров.

Задача о стопке книг. На письменном столе лежит стопка из m книг. Если обозначить каждую книгу соответствующим номером, то порядок их расположения сверху вниз можно описать перестановкой из m чисел (i₁, i₂, ..., i_m), где i₁ - номер книги, лежащей сверху, i₂ - номер следующей книги, ..., i_m - номер последней книги, лежащей в самом низу. Предположим, что каждая книга берется с определенной вероятностью, скажем, книга с номером k берется с вероятностью p_k (k = 1, ..., m), причем при возвращении она кладется сверху.

Возьмем произвольное состояние (i₁, i₂, ..., i_m). На следующем шаге оно либо остается неизменным, что происходит с вероятностью p_i₁ при выборе лежащей сверху книги с номером i₁, либо меняется на одно из m-1 состояний вида (i_k, i₁, ...), что происходит с вероятностью р_{i_k} при выборе книги с номером i_k.

Перед нами цепь Маркова с состояниями, каждое из которых описывается соответствующей перестановкой (i₁, i₂, ..., i_m), и указанными переходными вероятностями.

Остановимся на случае m = 2. Тогда имеется лишь два состояния: ε₁ = (1, 2) и ε₂ = (2, 1). Переходные Вероятности имеют вид:

p₁₁ = p₂₁ = p₁, p₁₂ = p₂₂ = p₂

и матрица переходных вероятностей есть

Вероятности перехода за два шага суть

Видно, что Р² = Р и вообще Рⁿ = Р. При любом начальном распределении вероятностей имеем (n = 1, 2, ...)

Задача о наилучшем выборе (см. п. 1 § 3). Положим ξ₀(0) = 1 и обозначим: ξ(1)- порядковый номер первого предмета, оказавшегося наилучшим среди всех осмотренных ранее; ξ(2) - порядковый номер следующего наилучшего среди всех осмотренных до него предметов и т. д. Цепочка обрывается на некотором v-м шаге, если предмет с порядковым номером ξ(v) оказывается абсолютно наилучшим, так что и среди не осмотренных еще предметов нет лучшего. Число v является случайным, поскольку случайным является сам порядок осмотра. Введем состояния ε₁, ε₂, ..., ε_m, ε_m+1, охарактеризовав их следующим образом: ε₁ при i = 1, ..., m означает, что предмет с порядковым номером i (т. е. i-й по счету осмотренный предмет) является наилучшим среди всех ранее осмотренных; ε_m+1 означает, что уже осмотрен абсолютно наилучший предмет. Если положить ξ(n) = ε_m+1 при всех n>v, то последовательность образует цепь Маркова.

Найдем соответствующие переходные вероятности р_ij. Очевидно, р_ij = 0 при i≥j, j≤m, a p_{m+1, m+1} = 1. Подсчитаем вероятности р_ij при i<j≤m. Обозначим ε_j событие,

состоящее в том, что при случайном порядке осмотра j предметов наилучшим среди них является последний j-й предмет. Очевидно, переходные вероятности р_ij согласно общей формуле (8.0) совпадают с условными вероятностями

i<j≤m.

Очевидно, вероятность события ε_j совпадает с вероятностью того, что среди всех перестановок из j предметов будет выбрана та, при которой на последнем месте стоит наилучший предмет. Всего различных перестановок имеется j!, а тех, при которых на последнем месте оказывается один и тот же фиксированный элемент, имеется (j-1)! Следовательно,

j = 1, ..., m.

Вероятность события ε_iε_j совпадает с вероятностью того, что на последнем месте стоит наилучший предмет, а на i-м месте стоит также вполне определенный предмет - второй по качеству среди всех j предметов. Всего имеется (j-2)! таких перестановок и, следовательно,

i<j≤m.

Таким образом, переходные вероятности p_ij суть

i<j≤m.

Переходные вероятности р_i,m фактически были подсчитаны ранее (см. п. 1 § 3):

i = 1, ..., m.

Случайные блуждания. Рассмотрим случайное блуждание, связанное с неограниченными испытаниями Бернулли, когда частица блуждает по целочисленным точкам действительной прямой таким образом, что, находясь в точке i, она с вероятностью р переходит на следующем шаге в соседнюю точку i+1, а с вероятностью q = 1 - p - в соседнюю точку i-1. Если обозначить ξ(n) положение частицы после n шагов, то последовательность будет цепью Маркова с переходными вероятностями вида

Рассмотрим случайное блуждание другого типа. Частица блуждает лишь по целым неотрицательным точкам, причем из точки i она с вероятностью p_i переходит на следующем шаге в соседнюю точку i+1, а с вероятностью q_i = 1-p_i возвращается в нулевое положение. Соответствующие переходные вероятности суть

2. Рассмотрим цепь Маркова с состояниями ε₁, ε₂, ... и переходными вероятностями p_ij, i,j = 1, 2,... Цусть в начальный момент система находится в состоянии ε_i. Временно положим u_n = p_ii (n) и обозначим v_n вероятность того, что через n шагов система впервые вернется в исходное состояние ε_i. Имеет место следующее равенство:

(8.8)

где дополнительно введены u₀ = 1 и v₀ = 0.

Оно является следствием общей формулы полной вероятности. Именно, если ввести события B_k - "система через k шагов впервые возвращается в исходное состояние ε_i", k = 1, ..., n, и событие B_n+1 - "система ни разу не побывает в состоянии ε_i в течение первых n шагов", то B₁, ..., В_n+1 будет полной системой событий, и вероятность события А - "система через n шагов будет находиться в исходном состоянии ε_i" - по формуле полной вероятности есть

где

k = 1, ..., n;

Если обратиться к производящим функциям

то отношение (8.8), справедливое при всех n = 1, 2,... , можно записать в виде

u₀ = 1,

откуда

Значение

есть вероятность того, что система рано или поздно попадет в исходное состояние ε_i, иначе v есть вероятность возвращения в ε_i. Состояние ε_i называется возвратным, если вероятность возвращения в него равна 1, и невозвратным, если вероятность эта меньше 1.

Теорема. Состояние ε_i является возвратным тогда и только тогда, когда

(8.11)

Доказательство. Возвратность состояния ε_i означает, что

Это предельное соотношение равносильно тому, что

Но, как легко видеть,

Таким образом, возвратность состояния ε_i равносильна тому, что ряд расходится. Для завершения доказательства остается лишь напомнить, что u_n = p_ii (n).

Теорема. Если исходное состояние ε_i является возвратным, то система с вероятностью 1 за бесконечное число шагов бесконечно много раз возвратится в ε_i. Если это состояние является невозвратным, то за бесконечное число шагов система с вероятностью 1 лишь конечное число раз побывает в состоянии ε_i, другими словами, после некоторого конечного числа шагов она никогда больше не возвращается в ε_i.

Доказательство. Обозначим v₁ - число шагов до первого возвращения в состояние ε_i, v₂ - число шагов до второго возвращения и т. д. Если за бесконечное число шагов происходит меньше k возвращений, то полагаем v_k = ∞.

Событие означает, что произошло по меньшей мере k возвращений. Вероятность возвращения есть

При условии осуществления события система через некоторое конечное число шагов v₁ возвращается в исходное состояние ε_i, после чего ее дальнейшее поведение подчиняется тем же закономерностям, как если бы она только начинала свое движение. Таким образом, вероятность события при условии, что , будет равна υ:

Очевидно, если v₁ = ∞, то также и v₂ = ∞. Поэтому

Совершенно аналогично при любом k

Невозвратность состояния ε_i означает, что υ<1. В этом случае

и, согласно первой лемме Бореля - Кантелли (см. п. 1 § 4), с вероятностью 1 может произойти лишь конечное число событий вида т. е. с вероятностью 1 за бесконечное число шагов система лишь конечное число раз побывает в состоянии ε_i.

Возвратность состояния ε_i означает, что v = 1. В этом случае при любом k

Обозначим х число возвращений за бесконечное число шагов. Очевидно, событие тождественно с событием , так что, если P при всех k, то с вероятностью 1 величина х превосходит любое наперед заданное число k. Это значит, что

Теорема доказана.

Говорят, что состояние ε_j достижимо из ε_i, если за некоторое число шагов система с положительной вероятностью переходит из ε_i в ε_j, т. е. p_ij (М)>0 при некотором М.

Пусть ε_i - возвратное состояние и ε_j достижимо из ε_i. Тогда ε_i в свою очередь достижимо из ε_j, так как в противном случае, выходя из ε_i, система за М шагов с положительной вероятностью p_ij (М) = α> 0 попадает в состояние ε_j, после чего уже не может вернуться в ε_i; таким образом, вероятность возвращения в ε_i будет не больше, чем 1-α, а это противоречит возвратности ε_i. Итак, если ε_j достижимо из возвратного состояния ε_i, то в свою очередь ε_i достижимо из ε_j, т. е. р_ij (N) = β> 0 при некотором N. Как следует из формулы (8.7), при любом n

Р (n + М + N) = P (М) Р (n) Р (N) = Р (N) Р(n) Р (M),

откуда

p_ii (n + M + N) ≥ p_ij (M) p_jj (n) p_ji (N) = αβ p_jj (n).

p_jj (n + M + N) ≥ p_ji (M) p_ii (n) p_ij (N) = αβ p_iij (n).

Эти неравенства показывают, что ряды

сходятся или расходятся одновременно. Согласно условию (8.11), для возвратного состояния ε_i ряд расходится.

Поэтому также и

Следовательно, состояние ε_j является возвратным. Мы пришли к следующему результату.

Теорема. Если состояние ε_j достижимо из возвратного состояния ε_i, то ε_j также является возвратным, причем ε_i в свою очередь достижимо из ε_j.

Следствие. Если цепь Маркова имеет лишь конечное число состояний, причем каждое из них достижимо из любого другого состояния, то все они являются возвратными.

Действительно, если имеется лишь конечное число состояний, то за бесконечное число шагов хотя бы в одном из них система обязательно побывает бесконечное число раз. Следовательно, хотя бы одно состояние является возвратным, а поскольку по условию из него можно с положительной вероятностью перейти в любое другое состояние, все они будут возвратными.

Рассмотрим примеры, описанные в предыдущем пункте.

Задача о стопке книг. Очевидно, если каждая книга выбирается с положительной вероятностью, т. е. p_i>0 при всех i = 1, ..., m, то любое состояние достижимо из каждого другого состояния. Всего имеется m! различных состояний (i₁, ...., i_m) и все они будут возвратными. Если p_i = 0 при некотором i, то все состояния вида (i₁, ..., i_m), где i₁ = i (книга с номером i лежит на самом верху), являются невозвратными, так как после первого же шага выбирается некоторая книга с номером j, отличным от i, и книга с номером i, никогда не вынимаемая из стопки, опускается ниже.

Задача о наилучшем выборе. Очевидно, через некоторое число шагов, не больше m (m - число всех имеющихся предметов), система попадает в состояние ε_m+1, в котором остается навсегда. Таким образом, все состояния, кроме ε_m+1, являются невозвратными.

Случайные блуждания. Рассмотрим случайное блуждание, при котором частица из каждой целочисленной точки i на следующем шаге с вероятностью р переходит в соседнюю точку j = i+1, а с вероятностью q - в точку j = i-1. Ясно, что каждое состояние достижимо из любого другого состояния и (см. формулу (6.0))

Используя формулу Стерлинга, при получаем

где

причем знак равенства имеет место лишь при

Таким образом, при

откуда следует, что ряды

сходятся или расходятся одновременно. При р≠q, когда 4pq<1, ряд сходится, и следовательно, каждое состояние является невозвратным. Интуитивно ясно, что, например, при p>q блуждающая частица постепенно будет уходить все дальше и дальше в положительном направлении, рано или поздно навсегда покидая любое фиксированное состояние i. При неограниченно продолжающемся симметричном случайном блуждании, когда , частица бесконечное число раз возвращается в каждое из состояний.

Рассмотрим теперь случайное блуждание, при котором частица из неотрицательной целой точки i на следующем шаге с вероятностью p_i смещается в соседнюю точку j = i+1, а с вероятностью q_i = 1-p_i переходит в нулевую точку j = 0. Очевидно, если все вероятности p_i таковы, что 0<p_i<1, то все состояния являются достижимыми одно из другого. Все они будут возвратными или невозвратными.

Предположим, что система находится в состоянии i = 0. Вероятность того, что за последующие n шагов она ни разу не вернется в исходное положение i = 0, равна произведению p₀p₁...p_n-1 - вероятности того, что система последовательно пробегает цепочку состояний 0→1→ ... →n. Легко видеть, что вероятность за бесконечное число шагов ни разу не вернуться в исходное состояние i = 0 равна бесконечному произведению

Если это бесконечное произведение сходится к нулю: = 0, то состояние i = 0 (а вместе с ним и все остальные) является возвратным. В противном случае вероятность возвращения есть

и состояние i = 0 (а вместе с ними все остальные) является невозвратным.

К этому результату можно прийти и другим путем, непосредственно рассматривая вероятности v_k впервые вернуться в исходное состояние 0 ровно через k шагов. Очевидно, частица впервые возвращается в состояние 0 на k-м шаге, если она на первых k-1 шагах последовательно переходит из состояния i-1 в i (с вероятностями p_i-1, i = 1, ..., k-1), и потому

v₁ = 1-р₀, v_k = p₀...p_k-2(1-p_k-1); k = 2,3,...

Вероятность возвращения в исходное состояние 0 по определению равна сумме и есть

3. Рассмотрим цепь Маркова с конечным числом состояний ε₁, ..., ε_m, каждое из которых достижимо из любого другого состояния. Более того, предположим, что существует такое N, что за N шагов система с положительной вероятностью может перейти из каждого состояния ε_i в любое другое состояние ε_j, т. е.

(8.12)

Теорема. Вероятности р_j (n), с которыми через n шагов система будет находиться в соответствующих состояниях ε_j, j = 1, ..., m, при n→∞ имеют предельные значения

(8.13)

Указанные финальные вероятности p^*_j j = 1, ..., m, не зависят от начального распределения и, более того,

(8.14)

где С и D - некоторые положительные постоянные.

Доказательство. Положим

Имеем

Таким образом, получаем следующую цепочку неравенств:

Для любых состояний ε_α и ε_β

где означает суммирование по всем тем k, при которых разность р_αk(N) - р_βk (N) является положительной, а суммирование по всем тем k, при которых разность р_αk(N) - р_βk (N) является отрицательной. Очевидно, в силу условия (8.12)

Используя полученные соотношения, оценим разность R_j (n) - r_j (n). Имеем

Отсюда вытекает, что

k = 1, 2, ...

Последовательность r_j (n), n = 1, 2, ..., монотонно возрастает, а последовательность R_j (n), n = 1, 2, ..., монотонно убывает, причем r_j (n) ≤ R_j (n). Полученная выше оценка разности R_j (n) - r_j (n) показывает, что эти последовательности имеют один и тот же предел p_j^*:

Очевидно,

При любом начальном распределении p_i⁰, i = 1, ..., m, имеем

Полученные оценки, конечно, можно переписать в виде (8.14) при соответствующих постоянных С и D, полагая

Теорема доказана.

Финальные вероятности p_j^*, j = 1, ...,m, являются решением следующей системы линейных уравнений:

(8.15)

j = 1, ..., m.

Эти уравнения получаются, если в формуле (8.4), согласно которой

перейти к пределу при n→∞.

Рассмотрим произвольную цепь Маркова с состояниями ε₁, ε₂, ... и числа р_i⁰, i = 1, 2 ..., такие, что

(8.16)

(8.17)

Взяв p_i⁰, i = 1, 2, ..., в качестве начального распределения вероятностей, будем иметь следующие вероятности p_j (n) для нахождения системы в соответствующих состояниях ε_j через n шагов:

.........................................

Видно, что вероятности p_j (n) остаются неизменными:

p_j (n) = p_j⁰, j = 1, 2, ...,

каково бы ни было n = 1, 2, ...

Цепь Маркова называется стационарной, если вероятности p_j (n), j = 1, 2, ..., остаются неизменными при всех n = 0, 1, ...; стационарным называется и соответствующее распределение вероятностей p_j⁰ = p_j (n), j = 1, 2, ... Согласно формуле (8.4) распределение вероятностей р_j⁰, j = 1, 2, ..., является стационарным тогда и только, тогда, когда оно удовлетворяет системе уравнений (8.17).

Если при любом начальном распределении существуют одни и те же финальные вероятности то стационарное распределение единственно: j = 1, 2,...

Полученные выше результаты могут быть соединены в следующую теорему.

Теорема. При условии (8.12) финальные вероятности p_j^*, j = 1, ..., m, являются единственным решением системы линейных уравнений (8.15), удовлетворяющим дополнительному требованию вида и образуют стационарное распределение вероятностей.

Остановимся на рассмотренных ранее (в пп. 1, 2) примерах.

Задача о стопке книг. Как показывают проведенные ранее расчеты, для m = 2 стационарное распределение вероятностей возникает уже на первом шаге:

p₁ (n) = p₁, р₂ (n) = р₂

при всех n = 1, 2, ... и любом начальном распределении вероятностей.

Рассмотрим случай произвольного m. Обозначим p_{(i₁, ..., i_m),(j₁, ..., j_m)} вероятность перехода из состояния (i₁, ..., i_m) в состояние (j₁, ..., j_m). Как было показано,

где перестановка (i_k, i₁, ...) получается из (i₁, ..., i_m) выбором некоторого i_k и перестановкой его на первое место. Финальные вероятности являются решением следующей системы линейных уравнений:

Через достаточно большое число шагов практически устанавливается стационарное распределение вероятностей, т. е. стопка книг будет с неизменными вероятностями занимать соответствующие положения (i₁, ..., i_m). Естественно спросить, с какой вероятностью каждая из имеющихся книг оказывается лежащей сверху?

Вероятность того, что сверху лежит книга с номером i, есть, очевидно,

где берется сумма по всем состояниям, в которых на первом месте стоит i.

Из уравнений для финальных вероятностей получаем, что

т. е. финальная вероятность р^*_i находиться сверху книге с номером i равна той вероятности р_i с которой эта книга выбирается. Таким образом, чем чаще берется та или иная книга, тем с большей вероятностью она будет находиться сверху.

Случайные блуждания. Пусть блуждающая частица из каждой целочисленнной точки i переходит с одной и той же вероятностью р в соседнюю точку i+1, ас вероятностью q - в точку i-1.

При p<q или p>q частица с течением времени все дальше смещается в направлении -∞ или +∞ соответственно. При p = q, хотя она и будет бесконечное число раз возвращаться в каждое из состояний, но при любом фиксированном i вероятность p_i (n) находиться в точке i в пределе при n→∞ равна 0.

Рассмотрим случайное блуждание, при котором частица с вероятностью p_i переходит из точки i в соседнюю точку j = i+1, а с вероятностью q_i = 1-p_i - в точку j = 0.

Для невозвратных состояний, когда

частица с вероятностью 1 будет уходить при n→☆ в направлении +∞ и, очевидно, никакого стационарного распределения быть не может. Распределение вероятностей является стационарным тогда и только тогда, когда оно удовлетворяет системе уравнений (8.17). В нашем случае эта система выглядит следующим образом:

j = 1, 2, ...,

откуда

Видно, что стационарное распределение существует тогда и только тогда, когда сходится ряд

При этом, очевидно, стационарное распределение вероятностей имеет вид

ПОИСК:

© MATHEMLIB.RU, 2001-2021
При копировании материалов проекта обязательно ставить ссылку на страницу источник:
http://mathemlib.ru/ 'Математическая библиотека'