ДИНАМИЧЕСКАЯ ИГРА

ДИНАМИЧЕСКАЯ ИГРА - разновидность позиционных игр, характеризующаяся тем, что в такой игре игроки управляют «движением точки» в пространстве состояний А. Пусть I = {i} - множество игроков. Каждой точке х ∈ А соответствует множество S^(x)_i элементарных стратегий игрока i ∈ I в этой точке и тем самым - множество S(x) = ∏_iS^(x)_i элементарных ситуаций в x. На X заданы переходные функции распределения F{x_k |x₁, s^(x₁), ..., x_k-1, s^(x_k-1)), х_i ∈ X, s^(x_i) ∈ S^(x_i), представляющие собой закон движения управляемой точки, известный каждому из игроков. Функция F при фиксированном х_k измерима по всем остальным аргументам. Последовательность Р чередующихся состояний и элементарных ситуаций х₁, s^(x₁) ..., x_k, s^(x_k), ... наз. партией общей Д. и.; она определяется индуктивно по следующей схеме: пусть уже определен отрезок партии (дебют) х₁, s^(x₁) ..., x_k-1 (k ≥ 2), и каждый игрок i выбирает свою элементарную стратегию s_i^(x_i) ∈ S_i^(x_i), так что складывается элементарная ситуация s^(x_k-1); тогда игра переходит случайно, в соответствии с распределением F(⋅ |x₁, s^(x₁), ..., x_k-1, s^(x_k-1)), в состояние х_k. На каждой партии Р определен выигрыш h_i(P) игрока i. Если множество всех партий обозначить ℬ, то Д. и. задается системой

Г = ⚭I, X, {S_i^(x}_i∈I,x∈X, F, {h_i (P)}_{i∈I,P∈ℬ}〉.

Обычно в Д. и. считается, что к очередному моменту выбора элементарной стратегии игроки знают предшествующий дебют. В этом случае чистая стратегия s_i игрока i есть набор функций s^(x)_i(x₁, s^(x₁), ..., s^(x_k-1), x), ставящих в соответствие заканчивающемуся в х дебюту элементарную стратегию s^(x)_i ∈ S^(x)_i. Рассматривались также Д. и., в к-рых игрокам известен не весь предшествующий дебют, напр. игры с «запаздыванием информации».

Для того чтобы игра была определена, необходимо, чтобы каждая ситуация s = {s_i} индуцировала вероятностную меру μ_s на множестве всех партий и чтобы для каждого i существовало математич. ожидание ∃h_i(P) по мере μ_s. Это математич. ожидание и представляет собой выигрыш игрока i в ситуации s.

Функции h_i(P), вообще говоря, произвольны; однако более других изучались Д. и. либо с терминальным выигрышем (игра заканчивается, как только х_k оказывается в терминальном множестве X ⊂ X и h_i(P) = h_i(x_k), где х_k - последнее состояние в игре), либо синтегральным выигрышем (h_i(P) =

h_i(x_k, s^(x_k)).

Д. и. могут рассматриваться как игровой вариант задачи оптимального управления с дискретным временем, к каковой они и сводятся, если число игроков равно одному. Если в Д. и. X ⊂ ℝⁿ, дискретное время заменяется на непрерывное, а случайные факторы устраняются, то получают дифференциальную игру, к-рая, таким образом, может рассматриваться как разновидность Д. и.

Частными классами Д. и. являются стохастические игры, рекурсивные игры и игры на выживание.

Лит.: [1] Воробьев Н. Н., «Успехи матем. наук», 1970, т. 25, в. 2, с. 81 - 140.

В. К. Доманский.

Источники:

Математическая энциклопедия: Гл. ред. И. М. Виноградов, т. 2 Д - Коо.-М.: «Советская Энциклопедия», 1979.-1104 стб., ил.

Временно скрыть

Больше не показывать

Консультант Анна

На связи