Next: 2 Стохастическая программная конструкция.
Up: KOVR1
Previous: KOVR1
Пусть система описывается уравнением
![\begin{displaymath}
{dx \over dt}=A(t)x+B(t)u+C(t)v,\ \ \ \
t\in [t_0,\vartheta],
\end{displaymath}](img1.gif) |
(1.1) |
где
- фазовый вектор,
и
- векторы управлений первого и
второго игроков соответственно,
,
,
- непрерывные
при
матрицы-функции;
и
- фиксированные моменты времени (
);
,
- выпуклые
компакты. Пусть имеются два разбиения отрезка времени
:
![\begin{displaymath}
\Delta_{t_{\alpha}^{[i_{\alpha}]}}=\{t_{\alpha}^{[i_{\alpha}...
...pha}]},
\ i_{\alpha}=1,\ldots,N_{\alpha}-1\}, \quad \alpha=1,2
\end{displaymath}](img16.gif) |
(1.2) |
Заданы нормы
,
,
,
.
Допустимы измеримые по Борелю реализации
и
.
Такие реализации порождают единственным образом абсолютно непрерывные
движения
системы (1.1) (
задано).
Показатель качества движений дан в виде функционала
![\begin{displaymath}
\gamma=\gamma(x[t_0[\cdot]\vartheta])=\sum_{i_1=1}^{N_1}\mu_...
...])
+\max_{1\leq i_2\leq N_2}\{\mu_2^{[i_2]}(x[t_2^{[i_2]}])\}.
\end{displaymath}](img26.gif) |
(1.3) |
При этом либо функционал
(1.3) задан априори, либо
он аппроксимирует исходный показатель, который оценивает
континуум значений
, реализовавшихся в процессе движения системы.
Задача построения управлений
и
, которые нацелены на
минимизацию и максимизацию показателя качества (1.3) соответственно,
формализуется как антагонистическая дифференциальная игра [6].
Для всякой исходной истории
,
эта игра имеет цену
и седловую точку
,
.
Здесь
- история
движения, реализовавшаяся к текущему моменту времени
;
- некоторый параметр точности [2],[6].
Оптимальные стратегии
, строятся как экстремальные ([6], стр. 150) к
функционалу
. Для такого построения оптимальных стратегий
достаточно уметь эффективно вычислять цену игры.
Настоящая статья посвящена вопросам вычисления цены игры
для каждой возможной текущей истории
как исходной.
2003-04-28