next up previous
Next: Bibliography Up: BRYKALOV Previous: 2 Непрерывные стратегии

3. Разрывные стратегии

Рассмотрим сейчас случай, когда отображению (2.1) позволяется быть разрывным. Чтобы обеспечить ненулевой результат, соответствующий
игрок может выбирать число $\vartheta_0$ следующим образом:

\begin{displaymath}
% latex2html id marker 121
\vartheta_0(x(\cdot))= \varthet...
... 4},\\ [2ex]
2, & \ \ x(1)\geq-{1 \over 4}.
\end{array}\right.
\end{displaymath} (3.1)

Таким образом, правило (3.1) описывается скалярной функцией скалярного аргумента $x(1)$.



Имеем

\begin{displaymath}
x(2)\geq x(1)+{1\over 2}
\end{displaymath} (3.2)

для произвольного решения $x$ уравнения (1.1) с допустимой управляющей функцией $u(\cdot)$. Действительно,

\begin{displaymath}
x(2)-x(1)= \int\limits_1^2 (\tau+u(\tau))d\tau
\geq\int\limits_1^2(\tau-1)d\tau={1\over 2}.
\end{displaymath}

Следовательно, для любого случая в формуле (3.1) имеем неравенство

\begin{displaymath}
% latex2html id marker 474\vert x(\vartheta_{0 (\ref{e9})}(x(\cdot)))\vert\geq {1\over 4}
\end{displaymath}

и гарантирован результат $\gamma(x(\cdot))\geq1/4$.



Другое правило для выбора числа $\vartheta_0$ может быть дано формулой

\begin{displaymath}
% latex2html id marker 142
\vartheta_0(x(\cdot))= \varthet...
...e11})}(x(\cdot)) =\min\{\tau:
\vert x(\tau)\vert={1\over 4}\}.
\end{displaymath} (3.3)

Из соотношений (1.2), (3.2) и непрерывности функции $x$ следует, что множество чисел $\tau$ в формуле (3.3) непусто. Так как это множество замкнуто, достигается минимум. Итак, число (3.3) определено корректно, принадлежит отрезку $[0,2]$ и задаваемое отображение доставляет результат $\gamma(x(\cdot))=1/4$.



С другой стороны, каким бы ни было отображение (2.1), нельзя обеспечить более хороший результат для игрока, выбирающего $\vartheta_0$, потому что для программного управления

\begin{displaymath}
u(t)=\left\{
\begin{array}{cc}
-t, \ \ \ \ 0\leq t < \displa...
...displaystyle{\frac{2-\sqrt{2}}{2}}<t \leq 2
\end{array}\right.
\end{displaymath} (3.4)

решение начальной задачи (1.1), (1.2) имеет вид
\begin{displaymath}
x(t)=\left\{
\begin{array}{lc}
0, \qquad \qquad \qquad \quad...
...laystyle{\frac{2-\sqrt{2}}{2}}\leq t \leq 2
\end{array}\right.
\end{displaymath} (3.5)

и удовлетворяет неравенству $\vert x(t)\vert\leq1/4$ для всех $t\in[0,2]$.



Отметим, что как (3.1), так и (3.3) являются разрывными отображениями в смысле (2.1). Оба они удовлетворяют условию (NA).



Отметим также, что в рассматриваемой задаче управления число (3.3) удовлетворяет неравенству % latex2html id marker 494
$\vartheta_{0 (\ref{e11})}(x(\cdot))<2$. Действительно, если
% latex2html id marker 496
$\vartheta_{0 (\ref{e11})}(x(\cdot))=2$, то $x(2)=\pm1/4$, из неравенства (3.2) вытекает $x(1)\leq-1/4$ и, следовательно, % latex2html id marker 502
$\vartheta_{0 (\ref{e11})}(x(\cdot))\leq1$, что противоречит предположению % latex2html id marker 504
$\vartheta_{0 (\ref{e11})}(x(\cdot))=2$.



Однако можно выбрать решения $x$ задачи управления, для которых числа % latex2html id marker 508
$\vartheta_{0 (\ref{e11})}(x(\cdot))$ сколь угодно близки к $2$. Это можно показать модификацией функций (3.4), (3.5). Возьмем

\begin{displaymath}
u(t,\varepsilon)=\left\{
\begin{array}{cc}
-t, \ \ \ 0\leq t...
...\frac{2-
\sqrt{2}}{2}}+\varepsilon<t \leq 2
\end{array}\right.
\end{displaymath}

для $0<\varepsilon\leq\sqrt{2}/2$. Выбранная управляющая функция удовлетворяет ограничению $-1\leq u(t,\varepsilon)\leq1$. Соответствующее решение начальной задачи (1.1), (1.2) имеет вид

\begin{displaymath}
x(t,\varepsilon)=\left\{
\begin{array}{lc}
0, \qquad \qquad ...
...c{2-\sqrt{2}}{2}}+\varepsilon
\leq t \leq 2
\end{array}\right.
\end{displaymath}

и удовлетворяет соотношению

\begin{displaymath}x(t,\varepsilon)\geq
x(1,\varepsilon)=\displaystyle{-
\frac{1}{4}+\frac{\varepsilon\sqrt{2}-
\varepsilon^2}{2}>-\frac{1}{4}}\end{displaymath}

для всех $t\in[0,2]$, $\varepsilon\in(0,\sqrt{2}/2]$. Имеем

\begin{displaymath}
% latex2html id marker 526
\vartheta_{0
(\ref{e11})}(x(\cdot,\varepsilon))=1+\sqrt{1-
\varepsilon\sqrt{2}+\varepsilon^2}<2\end{displaymath}

и % latex2html id marker 528
$\displaystyle{\lim_{\varepsilon\to+0}\vartheta_{0
(\ref{e11})}(x(\cdot,\varepsilon))}=2$. (Однако функция $x(\cdot,0)$ совпадает с решением (3.5) и % latex2html id marker 532
$\vartheta_{0
(\ref{e11})}(x(\cdot,0))=1$, что подтверждает разрывность отображе-
ния (3.3).)



Интересно сравнить правила (3.1) и (3.3) как два различных способа поведения соответствующего игрока. В случае (3.1) в момент времени $t=1$ игроку становится известна величина $x(1)$, и на основе этой информации принимается решение либо остановить игру немедленно, либо дождаться ее окончания при $t=2$. (Очевидно, любое невырожденное правило этого типа описывается разрывным отображением.) Правило (3.1) требует измерения фазового состояния $x$ только в одной точке $t=1$, в то время как отображение (3.3) требует измерять $x$ непрерывно на отрезке $[0,2]$. Момент времени $\vartheta_0$, подсчитанный в соответствии с формулой (3.3), меньше или равен моменту, заданному формулой (3.1). По определению, для фиксированной траектории момент времени, задаваемый (3.3), является наименьшим возможным из тех, что достигают результат $1/4$. Как было показано выше, в рассматриваемой задаче этот момент времени всегда строго меньше, чем $2$, хотя он может быть произвольно близок к $2$. Правило (3.3) всегда дает гарантированный результат $1/4$, в то время как правило (3.1) может доставить более хороший результат для игрока, выбирающего $\vartheta_0$ в случае, если противник совершает ошибки. Можно также указать другие разумные способы назначения момента времени $\vartheta_0$, которые доставляют гарантированный результат.





Поступила 30.07.99


next up previous
Next: Bibliography Up: BRYKALOV Previous: 2 Непрерывные стратегии
2003-06-05