next up previous
Next: 6 Корректность Up: KLRUS Previous: 4 Минимаксные решения

5. Существование и единственность

Теорема 1. Пусть $\sigma :C([t_{0},T],\mathbb{R}^{n})\mapsto \mathbb{R}$ - непрерывный функционал, а гамильтониан $H$ удовлетворяет условиям (a)-(d) из п.2. Тогда существует одно и только одно минимаксное решение задачи (2.1), (2.2). Оно удовлетворяет условиям (4.11) и (4.13) при любых $\{Q,F^{\ast }(\cdot )\}\in K^{\ast }(H)$ и $\{P,F_{\ast }(\cdot )\}\in K_{\ast }(H)$.

Д о к а з а т е л ь с т в о. Доказательство этой теоремы проводится в основном по схеме обоснования аналогичного утверждения для минимаксного решения обычного (относительно функции конечномерного аргумента) уравнения Гамильтона-Якоби (см. [10, стр. 21-29]). Приведем конспект доказательства, уделяя внимание изменениям, связанным с эффектом последействия и функциональностью аргумента искомого решения.

Пусть $\{Q,F^{\ast }(\cdot )\}\in K^{\ast }(H)$, $\{P,F_{\ast }(\cdot )\}\in K_{\ast }(H)$. Обозначим через
$\Phi ^{\ast }[Q,F^{\ast }(\cdot )]$ (соответственно $\Phi _{\ast }[P,F_{\ast }(\cdot )]$) множество функционалов $\varphi :G\mapsto [-\infty ,\infty ]$, удовлетворяющих при этих $\{Q,F^{\ast }(\cdot )\}$ ( $\{P,F_{\ast }(\cdot )\}$) условиям (4.10), (4.11) (соответственно (4.12), (4.13)). Подмножество полунепрерывных снизу (сверху) функционалов $\varphi :G\mapsto \mathbb{R}$ из множества $\Phi ^{\ast }[Q,F^{\ast }(\cdot )]$
( $\Phi _{\ast }[P,F_{\ast }(\cdot )]$) обозначим $S^{\ast }[Q,F^{\ast }(\cdot )]$ ( $S_{\ast }[P,F_{\ast }(\cdot )]$). Функционалы
$\varphi \in S^{\ast }[Q,F^{\ast }(\cdot )]$ ( $\varphi \in S_{\ast }[P,F_{\ast }(\cdot )]$) являются верхними (нижними) решениями задачи (2.1), (2.2). Определим функционалы $\psi _{-}:G\times Q\mapsto \mathbb{R}$ и $\psi _{+}:G\times P\mapsto \mathbb{R}$ согласно равенствам:

\begin{displaymath}
\begin{array}{l}
\hspace{-3mm} \psi _{-}(t,x[t_{\ast }[\cdot...
...(t,x[t_{\ast }[\cdot ]t],{\bf0},p\mid
F_{\ast })\}.
\end{array}\end{displaymath} (5.1)

Для любого $\varphi \in \Phi ^{\ast }[Q,F^{\ast }(\cdot )]$ справедлива оценка

\begin{displaymath}
\varphi (t,x[t_{\ast }[\cdot ]t])\geq \psi _{-}(t,x[t_{\ast }[\cdot
]t],q),\quad (t,x[t_{\ast }[\cdot ]t],q)\in G\times Q.
\end{displaymath} (5.2)

Так как в силу соотношения (4.5) при всех $(t,x[t_{\ast }[\cdot ]t],p,q)\in \linebreak G\times P\times Q$ имеем $\overline{X}^{\ast }(t, x[t_{\ast }[\cdot ]t], {\bf0}, q \mid F^{\ast }) \
\cap$ $\overline{X}_{\ast
}(t,x[t_{\ast }[\cdot ]t],{\bf0},p\mid F_{\ast })\neq \varnothing $, то для любого $p\in P$ выполняется включение

\begin{displaymath}
\psi _{+}(\cdot ,p)\in \Phi ^{\ast }[Q,F^{\ast }(\cdot )].
\end{displaymath} (5.3)

Рассмотрим функционал

\begin{displaymath}
\varphi _{0}(t,x[t_{\ast }[\cdot ]t])=\inf \{\varphi (t,x[t_...
...st }[Q,F^{\ast }(\cdot )]\},\ (t,x[t_{\ast
}[\cdot ]t])\in G.
\end{displaymath} (5.4)

Из (5.1)-(5.4) следует, что $\varphi _{0}\in \Phi ^{\ast }[Q,F^{\ast }(\cdot )]$, причем

\begin{displaymath}
\begin{array}{c}
\varphi _{0}(T,x[t_{\ast }[\cdot ]T])=\sigm...
...ast
},T],\mathbb{R}^{n}),\quad q\in Q,\quad p\in P.
\end{array}\end{displaymath} (5.5)

Можно также проверить, что $\varphi _{0}\in \Phi _{\ast }[P,F_{\ast }(\cdot )]$. В определениях множеств $\Phi ^{\ast }[Q,F^{\ast }(\cdot )]$ и $\Phi _{\ast }[P,F_{\ast }(\cdot )]$ отсутствуют требования полунепрерывности функционалов $\varphi $. Поэтому введем операции замыкания снизу и сверху. Положим

\begin{displaymath}
\begin{array}{c}
\varphi _{0}^{-}(t,x[t_{\ast }[\cdot ]t])=\...
...rime }])\in O_{\delta
}(t,x[t_{\ast }[\cdot ]t])\},
\end{array}\end{displaymath} (5.6)

где $O_{\delta }(t,x[t_{\ast }[\cdot ]t])=\{(t^{\prime },x^{\prime }[t_{\ast
}[\cdot...
...rime }[t_{\ast }[\cdot
]t^{\prime }]), (t,x[t_{\ast }[\cdot ]t]))\leq \delta \}$; $\rho (\cdot ,\cdot )$ из (1.1).

Из (5.1), (5.5) и (5.6) вытекает, что

\begin{displaymath}
-\infty <\varphi _{0}^{-}(t,x[t_{\ast }[\cdot ]t])\leq \varp...
...ast }[\cdot ]t])<\infty ,\quad
(t,x[t_{\ast }[\cdot ]t])\in G.
\end{displaymath}

Функционал $\varphi _{0}$ удовлетворяет условиям (4.10)-(4.13). Отсюда, учитывая (5.6) и утверждение 3.2, можно показать, что функционал $\varphi _{0}^{-}$ будет удовлетворять условиям (4.10), (4.11), а $\varphi _{0}^{+}$ - условиям (4.12), (4.13). Кроме того, в силу (5.6) функционалы $\varphi _{0}^{-}$ и $\varphi _{0}^{+}$ будут полунепрерывными снизу и сверху соответственно, т.е. $\varphi _{0}^{-}\in S^{\ast }[Q,F^{\ast }(\cdot )]$, $\varphi _{0}^{+}\in S_{\ast }[P,F_{\ast }(\cdot )]$.

Таким образом получаем, что для любых $\{Q,F^{\ast }(\cdot )\}\in K^{\ast }(H)$ и
$\{P,F_{\ast }(\cdot )\}\in K_{\ast }(H)$ существует пара $(\varphi ^{\ast },\varphi _{\ast })\in S^{\ast }[Q,F^{\ast }(\cdot )]\times
S_{\ast }[P,F_{\ast }(\cdot )]$, удовлетворяющая неравенству

\begin{displaymath}
\varphi ^{\ast }(t,x[t_{\ast }[\cdot ]t])\leq \varphi _{\ast }(t,x[t_{\ast
}[\cdot ]t]),\quad (t,x[t_{\ast }[\cdot ]t])\in G.
\end{displaymath}

Для завершения доказательства осталось показать, что при любых $\{Q,F^{\ast }(\cdot )\}\in K^{\ast }(H)$, $\{P,F_{\ast }(\cdot )\}\in K_{\ast }(H)$, $\varphi ^{\ast }\in S^{\ast }[Q,F^{\ast }(\cdot )]$, $\varphi _{\ast }\in S_{\ast }[P,F_{\ast }(\cdot )]$ и $g^{0}=(t^{0},x^{0}[t_{\ast }[\cdot ]t^{0}])\in G$ справедливо неравенство

\begin{displaymath}
\varphi ^{\ast }(t^{0},x^{0}[t_{\ast }[\cdot ]t^{0}])\geq \varphi _{\ast
}(t^{0},x^{0}[t_{\ast }[\cdot ]t^{0}]).
\end{displaymath} (5.7)

Рассмотрим дифференциальное включение

\begin{displaymath}
\begin{array}{c}
\displaystyle {d\overline{x}[t] \over dt} \...
...athbb{R}^n\times \mathbb{R}, \quad a={\rm const}>0.
\end{array}\end{displaymath} (5.8)

Через $\overline{X}^{0}=\overline{X}(t^{0},x^{0}[t_{\ast }[\cdot ]t^{0}],{\bf0})$ обозначим множество его решений, отвечающих паре $g^{0}$. Пусть чисо $a>0$ выбрано так, чтобы

\begin{displaymath}
\overline{X}^{\ast }(t^{0},x^{0}[t_{\ast }[\cdot ]t^{0}],
{\...
...cdot ]t^{0}],{\bf0},p\mid F_{\ast })
\subset \overline{X}^{0},
\end{displaymath}


\begin{displaymath}
(t^{0},x^{0}[t_{\ast }[\cdot ]t^{0}],p,q)\in G\times P\times Q
\end{displaymath}

(такое $a$ существует, поскольку $F^{\ast }(\cdot )$ и $F_{\ast }(\cdot )$ удовлетворяют условиям ($\alpha $) из п.4).

Дифференциальное включение (5.8) удовлетворяет требованиям утверждения 3.1. Поэтому $\overline{X}^{0}$ - непустой компакт в $C([t_{\ast },T],\mathbb{R}^{n}\times \mathbb{R})$. Рассмотрим множество

\begin{displaymath}
W_{\mu }=\{(\overline{x}^{\ast }(\cdot ),\overline{x}_{\ast ...
... \overline{s}[t],{d\overline{s}[t] \over dt}\right\rangle \leq
\end{displaymath}


\begin{displaymath}
\leq \Lambda
\max\limits_{t_{\ast }\leq \tau \leq t}\left\Ve...
...]\right\Vert ^{2}+\mu
\ \mbox{п.в.}\ t\in \lbrack t^{0},T]\},
\end{displaymath} (5.9)

где $\overline{x}^{*}(\cdot )=(x^{*}(\cdot ),z^{*}(\cdot ))$, $\overline{x}_{*}(\cdot)=(x_{*}(\cdot),z_{*}(\cdot))$, $\overline{s}[\tau ]=\overline{x}_{\ast }[\tau ]-\overline{x}^{\ast }[\tau ]$ ( $\tau \in \lbrack t_{\ast },T]$), $\mu >0$, а $\Lambda $ - постоянная Липшица из условия ($\overline{b}$) (см. п.4) при $D=\{x(\cdot ):(x(\cdot ),z(\cdot ))\in\overline{X}^{0}\}$.

Положим

\begin{displaymath}
\begin{array}{ll}
M_{\mu }(t) =\!\!\!\!&\{(\overline{x}^{\as...
...t }(t,x_{\ast }[t_{\ast }[\cdot ]t])
+z_{*}[t]\ \},
\end{array}\end{displaymath} (5.10)


\begin{displaymath}
t_{\mu }=\sup \{t\in \lbrack t^{0},T]\mid M_{\mu }(t)\neq \emptyset \}.
\end{displaymath} (5.11)

Множество $W_{\mu }$ компактно, функционалы $\varphi ^{\ast }$ и $\varphi _{\ast }$ полунепрерывны снизу и сверху соответственно, поэтому $\sup $ в (5.11) достигается. Более того, при условиях ($\overline{a}$)-($\overline{d}$) и ($\alpha $), ($\beta $) (см. п.4), рассуждая от противного и используя при этом условия (4.11) (для $\varphi ^{\ast }$), (4.13) (для $\varphi _{\ast }$) и включение (5.8) можно проверить, что для любого $\mu >0$ справедливо равенство $t_{\mu }=T$.

Рассмотрим последовательность $\left(\overline{x}^{\ast (k)}(\cdot ),
\overline{x}_{\ast }^{(k)}(\cdot )\right)\in M_{\mu _{k}}(T)$ , где $\mu _{k}\downarrow 0$ при $k\rightarrow \infty $. Согласно (4.10) (для $\varphi ^{\ast }$), (4.12) (для $\varphi _{\ast }$) и (5.10) имеем

\begin{displaymath}
\begin{array}{c}
\varphi ^{\ast }(t^{0},x^{0}[t_{\ast }[\cdo...
...a (x_{\ast }^{(k)}[t_{0}[\cdot ]T])+z_{*}^{(k)}[T].
\end{array}\end{displaymath} (5.12)

Без ограничения общности можно принять, что при $k\rightarrow \infty $ последовательности $\overline{x}^{\ast (k)}(\cdot )=(x^{\ast (k)}(\cdot ),z^{\ast (k)}(\cdot ))$ и $\overline{x}_{\ast }^{(k)}(\cdot )=(x_{*}^{(k)}(\cdot ),z_{*}^{(k)}(\cdot ))$ равномерно сходятся к $\overline{x}_{0}^{\ast }(\cdot )=(x_0^{*}(\cdot ),z_0^{*}(\cdot ))$ и $\overline{x}_{\ast 0}(\cdot )=(x_{\ast 0}(\cdot ),z_{\ast 0}(\cdot ))$ соответственно. При этом из (5.9) следует, что $\overline{x}_{0}^{\ast }(\cdot )=\overline{x}_{\ast 0}(\cdot )$. Поэтому, переходя в (5.12) к пределу при $k\rightarrow \infty $, получаем неравенство (5.7). Теорема доказана.

З а м е ч а н и е 5.1. Из доказательства теоремы 1 вытекает, что для верхнего $\varphi ^{\ast }$, нижнего $\varphi _{\ast }$ и минимаксного $\varphi $ решений задачи (2.1), (2.2) всегда выполняется неравенство

\begin{displaymath}
\varphi_{\ast}(g)\leq \varphi (g)\leq \varphi^{\ast}(g),\quad
g=(t,x[t_{\ast}[\cdot]t]) \in G.
\end{displaymath}

Кроме того, минимаксное решение совпадает с минимальным верхним и максимальным нижним решениями.

Установим еще одно свойство минимаксного решения задачи (2.1), (2.2), которое может быть полезнным при практическом (особенно численном) его построении в конкретных примерах.

Утверждение 5.1. Пусть в дополнение к условиям теоремы $1$ существует отображение (информационный образ) $I(\tau _{\ast },\tau ,x[\tau _{\ast }[\cdot ]\tau ])$, удовлетворяющее следующим требованиям.

$(1^{*})$ Для любых $\tau _{\ast }\in \lbrack t_{\ast },T)$, $x^{(1)}(\cdot )$, $x^{(2)}(\cdot )$ из $C([t_{\ast },T],\mathbb{R}^{n})$ и $\tau ^{\ast }\in \lbrack \tau _{\ast },T]$ равенство $I(\tau _{\ast },\tau ^{\ast },x^{(1)}[\tau _{\ast }[\cdot ]\tau ^{\ast
}])=I(\tau _{\ast },\tau ^{\ast },x^{(2)}[\tau _{\ast }[\cdot ]\tau ^{\ast
}])$ влечет $x^{(1)}[\tau ^{\ast }]=x^{(2)}[\tau ^{\ast }]$. Если к тому же $x^{(1)}[\tau ^{\ast }[\cdot ]T]=x^{(2)}[\tau ^{\ast }[\cdot ]T]$, то $I(\tau _{\ast },\tau ,x^{(1)}[\tau _{\ast }[\cdot ]\tau ])=I(\tau _{\ast
},\tau ,x^{(2)}[\tau _{\ast }[\cdot ]\tau ])$ при всех $\tau \in \lbrack \tau ^{\ast },T]$.

$(2^{*})$ Справедливы тождества:

\begin{displaymath}
\begin{array}{l}
H(t,x[t_{\ast }[\cdot ]t],s)\equiv \widehat...
...iv \widehat{\sigma }(I(t_{0},T,x[t_{0}[\cdot
]T])),
\end{array}\end{displaymath}

где $L$ - функционал из условия (d) (см. п.2).

$(3^{*})$ Для любых $t^{\ast }\in \lbrack t_{\ast },T]$, компакта $D\subset C([t_{\ast },T],\mathbb{R}^{n})$ и множества $D^{\ast }=\{x(\cdot )\in D:I(t_{\ast },t^{\ast },x[t_{\ast }[\cdot ]t^{\ast
}])={\rm const}\}$ существует $\Lambda ^{\ast }>0$ такое, что для всех $t\in \lbrack t^{\ast },T]$, $x^{\ast }(\cdot )\in D^{\ast }$, $x^{\ast \ast }(\cdot )\in D^{\ast }$ и $(s,r)\in \mathbb{R}^{n}\times \mathbb{R}$, $\left\Vert s\right\Vert^2+r^2 =1$, $r>0$ справедлива оценка

\begin{displaymath}
r\left\vert H\left(t,x^{\ast }[t_{\ast }[\cdot ]t],{s \over ...
...}\left\Vert x^{\ast }[\tau ]-x^{\ast \ast }[\tau ]\right\Vert.
\end{displaymath}

Тогда при любых $(t^{0},x_{(1)}^{0}[t_{\ast }[\cdot ]t^{0}])\in G$, $(t^{0},x_{(2)}^{0}[t_{\ast }[\cdot ]t^{0}])\in G$, удовлетворяющих условиям

\begin{displaymath}
I(t_{\ast },t^{0},x_{(1)}^{0}[t_{\ast }[\cdot ]t^{0}])=I(t_{\ast
},t^{0},x_{(2)}^{0}[t_{\ast }[\cdot ]t^{0}]),
\end{displaymath}


\begin{displaymath}
I(t_{0},t^{0},x_{(1)}^{0}[t_{0}[\cdot]t^{0}])=
I(t_{0},t^{0},x_{(2)}^{0}[t_{0}[\cdot ]t^{0}]),
\end{displaymath}

для минимаксного решения $\varphi $ задачи (2.1), (2.2) справедливо равенство
\begin{displaymath}
\varphi (t^{0},x_{(1)}^{0}[t_{\ast }[\cdot ]t^{0}])=\varphi
(t^{0},x_{(2)}^{0}[t_{\ast }[\cdot ]t^{0}]).
\end{displaymath} (5.13)

Полное доказательство этого утверждения приводить не будем, заметим только, что поскольку всегда можно считать $\varphi (t^{0},x_{(1)}^{0}[t_{\ast }[\cdot ]t^{0}])\leq \varphi
(t^{0},x_{(2)}^{0}[t_{\ast }[\cdot ]t^{0}])$, то для доказательства равенства (5.13) достаточно показать, что $\varphi (t^{0},x_{(1)}^{0}[t_{\ast }[\cdot ]t^{0}])\geq \varphi
(t^{0},x_{(2)}^{0}[t_{\ast }[\cdot ]t^{0}])$. Учитывая ($1^{*}$)-($3^{*}$) это можно сделать при помощи рассуждений, подобных приведенным выше при обосновании неравенства (5.7), если рассмотреть множества

\begin{displaymath}
\overline{X}_{1}^{0}=
\overline{X}(t^{0},x_{(1)}^{0}[t_{\ast...
...\overline{X}(t^{0},x_{(2)}^{0}[t_{\ast }[\cdot ]t^{0}],{\bf0})
\end{displaymath}

решений дифференциального включения (3.1) при $F(t,x[t_{\ast }[\cdot ]t])$ из (4.7);

\begin{displaymath}
W_{\mu }^{\ast }=\{
(\overline{x}_{(1)}(\cdot ),\overline{x}...
... \overline{s}[t],{d\overline{s}[t] \over dt}\right\rangle \leq
\end{displaymath}


\begin{displaymath}
\leq \Lambda ^{\ast }\max\limits_{t^{0}\leq \tau
\leq t}\lef...
... ]\right\Vert ^{2}+\mu \
\mbox{п.в.}\ t\in \lbrack t^{0},T]\},
\end{displaymath}

где $\overline{s}[\tau ]=\overline{x}_{(2)}[\tau ]-\overline{x}_{(1)}[\tau ]$ ( $\tau \in \lbrack t^{0},T]$), $\mu >0$, а $\Lambda ^{\ast }>0$ взято из условия ($3^{*}$) при $t^{\ast }=t^{0}$, $D^{\ast }=\{x(\cdot ):(x(\cdot ),z(\cdot ))=\overline{x}(\cdot )
\in \overline{X}_{1}^{0}\cup \overline{X}_{2}^{0}\}$;

\begin{displaymath}
\begin{array}{c}
M_{\mu }^{\ast }(t)=\{
\left(\overline{x}_{...
...arphi (t,x_{(2)}[t_{\ast }[\cdot ]t])+z_{(2)}[t]\}.
\end{array}\end{displaymath}

При этом, используя условия (4.11) и (4.13), согласно теореме 1 удобно положить $P=Q=\mathbb{R}^{n}\times \mathbb{R}$, взяв $F^{\ast }(\cdot )$ и $F_{\ast }(\cdot )$ из (4.6).

Таким образом, при выполнении дополнительных требований ($1^{*}$)-($3^{*}$) минимаксное решение можно искать в виде суперпозиции
$\widehat{\varphi }(t,I(t_{\ast },t,x[t_{\ast }[\cdot
]t]),I(t_{0},t,x[t_{0}[\cdot ]t]))$. В частности, если $I(\tau _{\ast },\tau ,x[\tau _{\ast }[\cdot ]\tau ])=x[\tau ]$, то минимаксным решением задачи (2.1), (2.2) будет обычная функция конечномерного аргумента $\widehat{\varphi }(t,x[t])$ ( $t\in \lbrack t_{0},T]$, $x[t]\in \mathbb{R}^{n}$). При этом конструкции из п. 4 с точностью до обозначений переходят в конструкции (см. [10, стр. 29-36]), определяющие минимаксное решение соответствующего обычного уравнения Гамильтона-Якоби $\partial \varphi (t,x)/ \partial t +$ $\widehat{H}(t,x,\nabla _{x}\varphi (t,x))=0$ при условии $\varphi (T,x)=\widehat{\sigma }(x)
$. Поэтому функция $\widehat{\varphi }(t,x)$ будет минимаксным решением этой задачи.


next up previous
Next: 6 Корректность Up: KLRUS Previous: 4 Минимаксные решения
2003-08-14