НОВОСТИ    БИБЛИОТЕКА    ЭНЦИКЛОПЕДИЯ    БИОГРАФИИ    КАРТА САЙТА    ССЫЛКИ    О ПРОЕКТЕ  

ДИНАМИЧЕСКАЯ ИГРА

ДИНАМИЧЕСКАЯ ИГРА - разновидность позиционных игр, характеризующаяся тем, что в такой игре игроки управляют «движением точки» в пространстве состояний А. Пусть I = {i} - множество игроков. Каждой точке х ∈ А соответствует множество S(x)i элементарных стратегий игрока i ∈ I в этой точке и тем самым - множество S(x) = ∏iS(x)i элементарных ситуаций в x. На X заданы переходные функции распределения F{xk |x1, s(x1), ..., xk-1, s(xk-1)), хi ∈ X, s(xi) ∈ S(xi), представляющие собой закон движения управляемой точки, известный каждому из игроков. Функция F при фиксированном хk измерима по всем остальным аргументам. Последовательность Р чередующихся состояний и элементарных ситуаций х1, s(x1) ..., xk, s(xk), ... наз. партией общей Д. и.; она определяется индуктивно по следующей схеме: пусть уже определен отрезок партии (дебют) х1, s(x1) ..., xk-1 (k ≥ 2), и каждый игрок i выбирает свою элементарную стратегию si(xi) ∈ Si(xi), так что складывается элементарная ситуация s(xk-1); тогда игра переходит случайно, в соответствии с распределением F(⋅ |x1, s(x1), ..., xk-1, s(xk-1)), в состояние хk. На каждой партии Р определен выигрыш hi(P) игрока i. Если множество всех партий обозначить ℬ, то Д. и. задается системой

Г = ⚭I, X, {Si(x}i∈I,x∈X, F, {hi (P)}i∈I,P∈ℬ〉.

Обычно в Д. и. считается, что к очередному моменту выбора элементарной стратегии игроки знают предшествующий дебют. В этом случае чистая стратегия si игрока i есть набор функций s(x)i(x1, s(x1), ..., s(xk-1), x), ставящих в соответствие заканчивающемуся в х дебюту элементарную стратегию s(x)i ∈ S(x)i. Рассматривались также Д. и., в к-рых игрокам известен не весь предшествующий дебют, напр. игры с «запаздыванием информации».

Для того чтобы игра была определена, необходимо, чтобы каждая ситуация s = {si} индуцировала вероятностную меру μs на множестве всех партий и чтобы для каждого i существовало математич. ожидание ∃hi(P) по мере μs. Это математич. ожидание и представляет собой выигрыш игрока i в ситуации s.

Функции hi(P), вообще говоря, произвольны; однако более других изучались Д. и. либо с терминальным выигрышем (игра заканчивается, как только хk оказывается в терминальном множестве X ⊂ X и hi(P) = hi(xk), где хk - последнее состояние в игре), либо синтегральным выигрышем (hi(P) = hi(xk, s(xk)).

Д. и. могут рассматриваться как игровой вариант задачи оптимального управления с дискретным временем, к каковой они и сводятся, если число игроков равно одному. Если в Д. и. X ⊂ ℝn, дискретное время заменяется на непрерывное, а случайные факторы устраняются, то получают дифференциальную игру, к-рая, таким образом, может рассматриваться как разновидность Д. и.

Частными классами Д. и. являются стохастические игры, рекурсивные игры и игры на выживание.

Лит.: [1] Воробьев Н. Н., «Успехи матем. наук», 1970, т. 25, в. 2, с. 81 - 140.

В. К. Доманский.


Источники:

  1. Математическая энциклопедия: Гл. ред. И. М. Виноградов, т. 2 Д - Коо.-М.: «Советская Энциклопедия», 1979.-1104 стб., ил.











© MATHEMLIB.RU, 2001-2021
При копировании материалов проекта обязательно ставить ссылку на страницу источник:
http://mathemlib.ru/ 'Математическая библиотека'
Рейтинг@Mail.ru