next up previous
Next: 2 Стохастическая программная конструкция. Up: KOVR1 Previous: KOVR1

1. Постановка задачи.

Пусть система описывается уравнением
\begin{displaymath}
{dx \over dt}=A(t)x+B(t)u+C(t)v,\ \ \ \
t\in [t_0,\vartheta],
\end{displaymath} (1.1)


\begin{displaymath}
x\in R^n, \quad u\in P\subset R^r, \quad v\in Q\subset R^s,
\end{displaymath}

где $x$ - фазовый вектор, $u$ и $v$ - векторы управлений первого и второго игроков соответственно, $A(t)$, $B(t)$, $C(t)$ - непрерывные при $\ t\in [t_0,\vartheta]$ матрицы-функции; $t_0$ и $\vartheta$ - фиксированные моменты времени ($t_0<\vartheta$); $P$, $Q$ - выпуклые компакты. Пусть имеются два разбиения отрезка времени $[t_0,\vartheta]$:
\begin{displaymath}
\Delta_{t_{\alpha}^{[i_{\alpha}]}}=\{t_{\alpha}^{[i_{\alpha}...
...pha}]},
\ i_{\alpha}=1,\ldots,N_{\alpha}-1\}, \quad \alpha=1,2
\end{displaymath} (1.2)


\begin{displaymath}
t_{1}^{[i_1]}\ne t_{2}^{[i_2]},\quad i_1=1,\ldots,N_1, \quad...
...dots,N_2,
\quad \max\{t_{1}^{[N_1]},t_{2}^{[N_2]}\}=\vartheta.
\end{displaymath}

Заданы нормы $\mu_{\alpha}^{[i_{\alpha}]}(x)$, $x\in R^n$, $i_{\alpha}=1,\ldots,N_{\alpha}$, $\alpha=1,2$. Допустимы измеримые по Борелю реализации $u[t_0[\cdot]\vartheta)=\{u[t]\in P,~ t_0\leq t< \vartheta\}$ и $v[t_0[\cdot]\vartheta)=
\{v[t]\in Q,~ t_0\leq t< \vartheta\}$. Такие реализации порождают единственным образом абсолютно непрерывные движения $x[t_0[\cdot]\vartheta]=\{x[t],~ t_0\leq t\leq \vartheta,~x[t_0]=x_0\}$ системы (1.1) ($x_0$ задано).

Показатель качества движений дан в виде функционала

\begin{displaymath}
\gamma=\gamma(x[t_0[\cdot]\vartheta])=\sum_{i_1=1}^{N_1}\mu_...
...])
+\max_{1\leq i_2\leq N_2}\{\mu_2^{[i_2]}(x[t_2^{[i_2]}])\}.
\end{displaymath} (1.3)

При этом либо функционал $\gamma$ (1.3) задан априори, либо он аппроксимирует исходный показатель, который оценивает континуум значений $x[t]$, реализовавшихся в процессе движения системы. Задача построения управлений $u$ и $v$, которые нацелены на минимизацию и максимизацию показателя качества (1.3) соответственно, формализуется как антагонистическая дифференциальная игра [6]. Для всякой исходной истории $x[t_0[\cdot]t_*]$, $(t_0 \leq t_*< \vartheta)$ эта игра имеет цену $\rho^0(x[t_0[\cdot]t_*])$ и седловую точку $\{u^0(x[t_0[\cdot]t],\varepsilon)$, $v^0(x[t_0[\cdot]t],\varepsilon)\}$. Здесь $x[t_0[\cdot]t]=\{x[\tau],~ t_0\leq \tau\leq t\}$ - история движения, реализовавшаяся к текущему моменту времени $t$ $(t_*\leq t <\vartheta)$; $\varepsilon>0$ - некоторый параметр точности [2],[6]. Оптимальные стратегии $\{u^0(\cdot),~ v^0(\cdot)\}$, строятся как экстремальные ([6], стр. 150) к функционалу $\rho^0(\cdot)$. Для такого построения оптимальных стратегий достаточно уметь эффективно вычислять цену игры. Настоящая статья посвящена вопросам вычисления цены игры для каждой возможной текущей истории $x[t_0[\cdot]t]$ как исходной.



2003-04-28