next up previous
Next: 2 Область достижимости Up: albreht Previous: albreht


1. Постановка задачи

Рассмотрим противоборствующие управляемые объекты, поведение которых описывается дифференциальными включениями

\begin{displaymath}
\dot y=u \in P(t,y,\lambda),\quad \dot z=v \in Q(t,z,\lambda),
\end{displaymath} (1.1)

где $y \in R^n$ и $z \in R^n$ - фазовые векторы объектов; $u \in R^n$ и $v \in R^n$ - векторы управляющих сил первого и второго игрока соответственно; $P(t, y, \lambda)$ и $Q(t, z, \lambda)$ - многозначные отображения, описывающие обобщенные управления игроков; $\lambda$ - малый параметр.

Предположим, что управление объектами (1.1) производится на заданном отрезке времени $T = [t_0, \vartheta]$ и что в каждый текущий момент времвни $t$ оба игрока измеряют (или вычисляют по доступной информации) реализовавшиеся значения $y[t, \lambda]$ и $z[t, \lambda]$ фазовых векторов $y$ и $z$. Предположим, что управляющие воздействия игроков формируются по принципу обратной связи, т.е. в каждый текущий момент времени $t$ реализующиеся значения $u[t, \lambda]$ и $v[t, \lambda]$ определяются на основании информации $\{t, y[t, \lambda], z[t, \lambda] \}$ о позиции игры и в зависимости от значения параметра $\lambda$, т.е. можно записать

\begin{displaymath}u[t, \lambda] = u[t, y[t, \lambda], z[t, \lambda],
\lambda], ...
...d v[t, \lambda] = v[t, y[t, \lambda], z[t, \lambda],
\lambda],
\end{displaymath}

причем при почти всех $t \in T$

\begin{displaymath}
u[t, \lambda] \in P(t,y, \lambda), \quad
v[t, \lambda] \in Q(t, z, \lambda).
\end{displaymath}

Способ формирования управлений в зависимости от позиции $\{t, y, z\}$ будем называть стратегией. Стратегию первого игрока будем обозначать символом $U$, а второго игрока - $V$. Допустимые стратегии $U$ и $V$ первого и второго игрока будем определять [1-5] как полунепрерывные сверху по включению при изменении позиции $\{t, y, z\}$ многозначные отображения, которые каждой позиции $\{t, y, z\}$ ставят в соответствие выпуклые и ограниченные множества

\begin{displaymath}
U(t, y, z, \lambda) \subset P(t, y, \lambda),\quad
V(t, y, z, \lambda) \subset Q(t, z, \lambda).
\end{displaymath}

В дальнейшем на многозначные отображения $P(t, y, \lambda)$ и $Q(t, z, \lambda)$, фигурирующие в правой части (1.1), будут наложены требования, при которых стратегии $P$ и $Q$, состоящие из множеств $P(t, y, \lambda)$ и $Q(t, z, \lambda)$ соответственно, будут допустимыми.

Обозначим символами $Y[t_0, y_0, \lambda]$ и $Z[t_0, z_0, \lambda]$ множества решений дифференциальных включений (1.1), порождаемых начальными условиями $y(t_0) = y_0$, $z(t_0) = z_0$ и определенных на отрезке $[t_0, \vartheta]$. Отметим, что множества $Y[t_0, y_0, \lambda]$ и $Z[t_0, y_0, \lambda]$ состоят из абсолютно непрерывных по $t$ функций $y(t, \lambda)$ и $z(t, \lambda)$, которые при почти всех $t$ удовлетворяют включениям (1.1) [1-5].

Обозначим через $X[t_0, y_0, z_0, \lambda, U]$ множество пар функций $\{y(t, \lambda), z(t,  \lambda ) \}$, удовлетворяющих дифференциальному включению

\begin{displaymath}\dot y(t, \lambda) \in U(t, y(t, \lambda), z(t, \lambda), \lambda),
\quad \dot z(t, \lambda) \in Q(t, z(t, \lambda), \lambda)\end{displaymath}

для почти всех $t \in [t_0, \vartheta]$ и достаточно малых значениях параметра $\lambda$ при некотором начальном условии $y(t_0) = y_0, z(t_0) = z_0.$

Аналогично, через $X[t_0, y_0, z_0, \lambda, V]$ обозначим множество пар функций $\{y(t, \lambda), z(t,  \lambda ) \}$, удовлетворяющих дифференциальному включению

\begin{displaymath}\dot y(t, \lambda) \in P(t, y(t, \lambda), \lambda), \quad
\dot z(t, \lambda) \in V(t, y(t, \lambda), z(t, \lambda), \lambda)\end{displaymath}

для почти всех $t \in [t_0, \vartheta]$ и достаточно малых значениях параметра $\lambda$ при некотором начальном условии $y(t_0) = y_0, z(t_0) = z_0.$

Пусть плата игры определяется равенством

\begin{displaymath}
J[u,v] = \sigma (y(\vartheta) - z(\vartheta)) = \sigma (x(\vartheta)),
\end{displaymath} (1.2)

где $\sigma (x( \vartheta ) )$ - заданная функция векторного аргумента $x = y - z$.

Первый игрок, распоряжающийся выбором управления $u \in P(t, y, \lambda)$, стремится минимизировать показатель качества управления $J[u,v],$ а второй игрок, распоряжающийся выбором управления $v \in Q(t, z, \lambda)$, напротив, стремится максимизировать эту величину. Будем изучать следующие две задачи [1-5].

Задача 1.1. Среди допустимых стратегий $U$ первого игрока требуется найти оптимальную минимаксную стратегию $U^0$, которая при достаточно малых значениях параметра $\lambda$ обеспечивает равенство

\begin{displaymath}J^0[t_0, y_0, z_0, \lambda, U^0] = \min_U J^0[t_0, y_0, z_0, \lambda, U],\end{displaymath}

какова бы ни была исходная позиция $\{ t_0, y_0, z_0\}$. Здесь

\begin{displaymath}
\begin{array}{c}
J^0[t_0, y_0, z_0, \lambda, U] =  [1ex]\d...
...z(t, \lambda)\} \in X[t_0, y_0,z_0, \lambda, U] \}.
\end{array}\end{displaymath}

Задача 1.2. Среди допустимых стратегий $V$ второго игрока требуется найти оптимальную максиминную стратегию $V^0$, которая при достаточно малых значениях параметра $\lambda$ обеспечивает равенство

\begin{displaymath}J_0[t_0, y_0, z_0, \lambda, V^0] = \max_V J_0[t_0, y_0, z_0, \lambda, V],\end{displaymath}

какова бы ни была исходная позиция $\{ t_0, y_0, z_0\}$.

Здесь

\begin{displaymath}
\begin{array}{c}
J_0[t_0, y_0, z_0, \lambda, V] =  [1ex]\d...
...z(t, \lambda)\} \in X[t_0,y_0, z_0, \lambda, V] \}.
\end{array}\end{displaymath}

Цель статьи - обоснование аналитических приближенных методов вычисления оптимальных стратегий $U^0, V^0$, разрешающих задачи 1.1 и 1.2 в виде рядов по степеням малого параметра $\lambda$. Работа опирается на методы теории позиционных дифференциальных игр [1-5], нелинейного анализа [6,7] и теории возмущений [8,9]. При общих предположениях относительно свойств дифференциальных включений (1.1) в работе [10] указаны достаточные условия, при которых для построения оптимальных стратегий и цены игры может быть использовано правило экстремального прицеливания [1-4]. В данной работе эти исследования продолжаются в случае регулярных возмущений и ее результаты частично анонсированы в [11].


next up previous
Next: 2 Область достижимости Up: albreht Previous: albreht
2003-06-05