next up previous
Next: 2 Вспомогательные антагонистические позиционные Up: KLEIMENO Previous: KLEIMENO

1. Формализация неантагонистической позиционной дифференциальной игры двух лиц


Пусть динамика неантагонистической позиционной дифференциальной
игры (НПДИ) двух лиц описывается уравнением

$\displaystyle \dot{x}=f(t,x,u,v),\quad t\in\lbrack t_{0},\theta],\quad x(t_{0})=x_{0} ,$ (1.1)

где $ x\in\mathbb{R}^{n}$ - фазовый вектор, управления© $ u\in P\in
\mathrm{comp}\,\mathbb{R}^{p}$ и $ v\in Q\in \mathrm{comp}\,\mathbb{R}^{q}$ находятся в распоряжении 1-го и 2-го игроков, соответственно;
$ \theta$ - фиксированный момент окончания.

Пусть $ G$ - компакт в $ \mathbb{R}^{1}\times\mathbb{R}^{n}$, проекция которого на ось времени равна заданному отрезку $ [t_{0},\theta]$. Предполагаем, что все траектории системы (1.1), начинающиеся в произвольной позиции $ (t_{\ast},x_{\ast})\in G$, остаются в $ G$ при всех $ t\in\lbrack
t_{\ast},\theta]$.

Пусть выполнены следующие предположения.

1$ ^{0}$. Функция $ f:G\times P\times Q\mapsto\mathbb{R}^{n}$ непрерывна на множестве аргументов и удовлетворяет условию Липшица по $ x$.

2$ ^{0}$. Существует константа $ \lambda>0$ такая, что

$\displaystyle \left\Vert
f(t,x,u,v)\right\Vert \leq\lambda(1+\left\Vert x\right\Vert ) $

для всех $ (t,x)\in G$, $ u\in P$, $ v\in Q.$

Игрок $ i$ выбирает свое управление, чтобы максимизировать функционал выигрыша

$\displaystyle I_{i}=\sigma_{i}(x(\theta)),\quad i=1,2$ (1.2)

где $ \sigma_{i}:\mathbb{R}^{n}\mapsto\mathbb{R}^{1}$ - заданные непрерывные функции.

Предположим, что оба игрока имеют полную информацию о текущей позиции $ (t,x(t))$ игры. Формализация стратегии игроков и порождаемых ими движений в НПДИ та же, что и формализация, введенная в антагонистических позиционных дифференциальных играх [1,2] за исключением технических деталей [3]. Чистая стратегия (кратко - стратегия) 1-го игрока отождествляется с парой $ U\div\{u(t,x,\varepsilon),\beta_{1}(\varepsilon)\}$, где $ u(\cdot)$ - произвольная функция, зависящая от позиции $ (t,x)$ и от положительного параметра точности $ \varepsilon$ и имеющая значения во множестве $ P $. Функция $ \beta_{1}:(0,\infty)\mapsto(0,\infty)$ - непрерывная, монотонная, удовлетворяющая условию $ \beta_{1}(\varepsilon)\rightarrow0$ при $ \varepsilon\rightarrow0$. Функция $ \beta_{1}(\cdot)$ имеет следующий смысл. Для фиксированного $ \varepsilon$ величина $ \beta_{1}(\varepsilon)$ представляет собою верхнюю грань для шага разбиения отрезка $ [t_{0},\theta]$, которое 1-й игрок использует при формировании пошагового движения. Стратегия $ V\div\left\{
v(t,x,\varepsilon),\beta_{2}(\varepsilon)\right\} $ 2-го игрока определяется аналогично.

Движения двух типов: аппроксимационные (пошаговые) и идеальные (предельные) рассматриваются в качестве движений, порожденных стратегиями игроков. Аппроксимационное движение $ x[\cdot,$ $ t_{0},$ $ x_{0},$ $ U,$ $ \varepsilon_{1},$ $ \Delta _{1},$ $ V,$ $ \varepsilon_{2},$ $ \Delta_{2}]$ вводится для фиксированных значений параметров точности $ \varepsilon_{1}$ и $ \varepsilon_{2}$ и для фиксированных разбиений $ \Delta_{1}=\{t_{i}^{(1)}\}$ и $ \Delta_{2}=\{t_{j}^{(2)}\}$ отрезка $ [t_{0},\theta]$, выбираемых 1-ым и 2-ым игроками, соответственно, при условии $ \delta(\Delta_{i}$) $ \leq\beta_{i}(\varepsilon_{i}),\,i=1,2.$ Здесь $ \delta(\Delta_{i})=\max\limits_{k}(t_{k+1}^{(i)}-t_{k}^{(i)}).$ Предельное движение , порожденное парой стратегий $ (U,V)$ из начальной позиции $ (t_{0},x_{0})$, есть непрерывная функция $ x[t]=x[t,t_{0},x_{0},U,V]$, для которой существует последовательность аппроксимационных движений

$\displaystyle \{x[t,t_{0}^{k},x_{0}^{k},U,\varepsilon_{1}^{k},\Delta_{1}^{k},V,\varepsilon
_{2}^{k},\Delta_{2}^{k}]\},$

равномерно сходящаяся к $ x[t]$ на $ [t_{0},\theta]$ как только

$\displaystyle k\rightarrow\infty,\quad\varepsilon_{1}^{k}\rightarrow0,\quad\var...
...rightarrow x_{0,\quad}\delta(\Delta_{i}^{k})\leq\beta_{i}(\varepsilon
_{i}^{k})$.

Пара стратегий $ (U,V)$ порождает непустое компактное (в метрике пространства $ C[t_{0},\theta])$ множество $ X(t_{0},x_{0},U,V)$, состоящие из предельных движений $ x[\cdot,t_{0},x_{0},U,V].$

Введем теперь следующие определения [3].

Определение 1.1   Пара стратегий $ (U^{N},V^{N})$ называется нэшевским равновесным решением ($ NE$-решением) игры, если для любого движения $ x^{\ast}[\cdot]\in X(t_{0},x_{0},U^{N},V^{N})$, любого
$ \tau\in\lbrack t_{0},\theta],$ и любых стратегий $ U$ и $ V$ справедливы следующие неравенства

$\displaystyle \max_{x[\cdot]}\sigma_{1}(x[\theta,\tau,x^{\ast}[\tau],U,V^{N}])\leq\sigma
_{1}(x[\theta,\tau,x^{\ast}[\tau],U^{N},V^{N}]),
$

$\displaystyle \max_{x[\cdot]}\sigma_{2}(x[\theta,\tau,x^{\ast}[\tau],U^{N},V])\leq\sigma
_{2}(x[\theta,\tau,x^{\ast}[\tau],U^{N},V^{N}]) $

Определение 1.2   $ NE$-решение $ (U^{P},V^{P})$, неулучшаемое по Парето относительно величин $ I_{1},I_{2}$ % latex2html id marker 3120
$ (\ref{f_1_2})$, называется $ P^{\ast}$-решением$ .$

Определение 1.3   $ P^{\ast}$-решение, наилучшее для игрока $ i$, называется
$ H_{i}
$-решением $ (i=1,2).$

Пусть теперь выполнены следующие предположения.

3$ ^{0}.$ 1-й игрок, называемый лидером, объявляет свою стратегию $ U^{\ast}
\div\{u^{\ast}(t,x,\varepsilon),\beta_{1}^{\ast}(\varepsilon)\}$ 2-му игроку наперед.

4$ ^{0}$. 2-й игрок, называемый ведомым, имея в виду стратегию $ U^{\ast}
$ 1-го игрока, выбирает свою рациональную стратегию $ V^{\ast}$ из условия

$\displaystyle \min\sigma_{2}(x[\theta,t_{o},x_{o},U^{\ast},V])\longrightarrow\max\limits_{V}
,$

где минимум функции $ \sigma_{2}$ берется по множеству $ X(t_{0},x_{0},U^{\ast},V).$

Задача 1-го игрока заключается в нахождении такой стратегии $ U^{S1}$, которая гарантирует ему максимальное значение функционала выигрыша $ \sigma_{1}(x[\theta])$ (1.2) при условии рациональности 2-го игрока. (более детальная постановка, включающая рассмотрение различных вариантов выбора из множества рациональных стратегий 2-го игрока, содержится в [3]).

Определение 1.4   Пара стратегий $ (U^{S1},V^{S1})$, где $ V^{S1}$ - рациональная стратегия $ 2$-го игрока, соответствующая объявленной стратегии $ U^{S1}$, называется $ S_{1}$-решением.

$ S_{2}$-решение определяется аналогично.



next up previous
Next: 2 Вспомогательные антагонистические позиционные Up: KLEIMENO Previous: KLEIMENO
2003-08-19