next up previous
Next: 2 Непрерывные стратегии Up: BRYKALOV Previous: BRYKALOV

1. Скалярная игровая задача

Пусть текущее состояние управляемого объекта описывается скаляром $x$. Изменение величины $x$ на отрезке времени $[0,2]$ подчинено дифференциальному уравнению

\begin{displaymath}
\dot x=t+u, \qquad 0\leq t\leq2.
\end{displaymath} (1.1)

Уравнение (1.1) должно выполняться для почти всех моментов времени $t$. Функция $x(\cdot)$ предполагается абсолютно непрерывной. Начальное состояние нулевое
\begin{displaymath}
x(0)=0.
\end{displaymath} (1.2)

Функционал платы имеет вид

\begin{displaymath}
\gamma(x(\cdot))=\vert x(\vartheta_0)\vert.
\end{displaymath}

Отметим, что плата $\gamma(x(\cdot))$ зависит не только от функции $x(\cdot)$, но также от числа $\vartheta_0$.



Имеются два игрока. Один из них выбирает параметр $-1\leq u\leq1$ как измеримую по Лебегу функцию времени $u:[0,2]\rightarrow[-1,1]$. Цель этого игрока состоит в минимизации величины показателя качества $\gamma(x(\cdot))$. Другой игрок выбирает число $0\leq\vartheta_0\leq2$ с целью максимизировать показатель $\gamma(x(\cdot))$.



Для фиксированного программного управления $u(\cdot)$ решение $x(\cdot)$ начальной задачи (1.1),(1.2) имеет вид

\begin{displaymath}
x(t)= \frac{t^2}{2}+
\int\limits_0^tu (\tau)d\tau.
\end{displaymath} (1.3)

Если выбор управляющего параметра $\vartheta_0$ заранее известен игроку, выбирающему управление $u$, то этот игрок может сделать $\gamma(x(\cdot))=0$, полагая например $u(t)\equiv-\vartheta_0/2$.



Таким образом, соответствующий игрок не может выбрать константу $\vartheta_0$ так, что гарантирован ненулевой результат для любой возможной помехи $u(\cdot)$. Однако игрок может попытаться обеспечить ненулевой результат, выбирая число $\vartheta_0=\vartheta_0(x(\cdot))$ на основе обратной связи, то есть на основе измерений текущего фазового состояния $x(t)$ для некоторых моментов времени $t$. Иногда возможно также измерять помеху $u$. В этом случае игрок может назначать число $\vartheta_0$ в виде $\vartheta_0=\vartheta_0(x(\cdot),u(\cdot))$.



2003-06-05