next up previous
Next: Bibliography Up: KOVR1 Previous: 3 Стабильность стохастического программного

4. Вычисление программного экстремума.

Пусть реализовалась история $x[t_0[\cdot]t_*]$ ($t_*<\vartheta$) и выбрано разбиение $\Delta_k\{\tau_j\}$ % latex2html id marker 2817
$(\ref{2.2})$ отрезка $[t_*,\vartheta]$. Перейдем теперь к задаче о вычислении
$e(x[t_0[\cdot]t_*],\Delta_k)$ (2.11). Для этого на вероятностном пространстве $\{\Omega,B,$P$\}$ для каждого $j=1,\ldots,k$ определим вспомогательные случайные $n$-мерные величины $q_{[j],\alpha}^{[i_{\alpha}]}(\omega)=q_{[j],\alpha}^{[i_{\alpha}]}(\xi_j,\ldots,\xi_k)$, $i_{\alpha}=h_{\alpha}(\tau_j)+1,\ldots,N_{\alpha}$, $\alpha=1,2$ и случайную скалярную величину $q_{[j],0}(\omega)=q_{[j],0}(\xi_j,\ldots,\xi_k)$, которые при почти всех $\omega\in \Omega$ удовлетворяют условиям

\begin{displaymath}
0 \leq q_{[j],0}(\omega)\leq 1,
\end{displaymath} (4.1)


\begin{displaymath}
\mu_1^{[i_1]*}(q_{[j],1}^{[i_1]}(\omega))\leq 1,\ \ \ \ i_1=h_1(\tau_j)+1,\ldots,N_1,
\end{displaymath} (4.2)


\begin{displaymath}
\sum_{i_2=h_2(\tau_j)+1}^{N_2}\mu_2^{[i_2]*}(q_{[j],2}^{[i_2]}(\omega))\leq q_{[j],0}(\omega).
\end{displaymath} (4.3)

Через ${\bf Q}_j(\Omega)$ обозначим множества всех многомерных случайных величин

\begin{displaymath}
{\bf q}_{[j]}(\cdot)=\{{\bf q}_{[j]}(\omega)=
\{q_{[j],0}(\omega),q_{[j],1}^{[h_1(\tau_j)+1]}(\omega),\ldots,
\end{displaymath}


\begin{displaymath}
q_{[j],1}^{[N_1]}(\omega),
q_{[j],2}^{[h_2(\tau_j)+1]}(\omega),\ldots,q_{[j],2}^{[N_2]}(\omega)\}, \omega \in \Omega\},
\end{displaymath}

удовлетворяющих (4.1)-(4.3). Множествам ${\bf Q}_j(\Omega)$ поставим в соответствие множества $G_j(t_*)$ детерминированных векторов $(m_{(j)},\nu_{(j)})\in R^{n}\times R$:

\begin{displaymath}
G_j(t_*)=\{(m_{(j)},\nu_{(j)})\in R^{n}\times R:~\nu_{(j)}=M\{q_{[j],0}(\omega)\},
\end{displaymath}


\begin{displaymath}
~m_{(j)}=m({\bf q}_{[j]}(\cdot)), ~{\bf q}_{[j]}(\cdot)\in {\bf Q}_{j}(\Omega)\},
\end{displaymath} (4.4)

где

\begin{displaymath}
m({\bf q}_{[j]}(\cdot))=\sum_{i_1=h_1(\tau_j)+1}^{N_1}X^{T}[t_1^{[i_1]},
\vartheta]M\{q_{[j],1}^{[i_1]}(\omega)\}+ \mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+
\sum_{i_2=h_2(\tau_j)+1}^{N_2}X^{T}[t_2^{[i_2]},\vartheta]M\{q_{[j],2}^{[i_2]}(\omega)\}.
\end{displaymath}

Множества $G_j(t_*)$ - непустые выпуклые компакты в $R^{n+1}$. Пусть
$\Delta\psi_j(t_*;m)$ - функции (2.14). На случайных величинах ${\bf q}_{[j]}(\cdot) \in {\bf Q}_j(\Omega)$ рассмотрим далее вспомогательные функционалы

\begin{displaymath}
\begin{array}{c}
g_j(t_*;{\bf q}_{[j]}(\cdot))=\\ [2ex]
\dis...
...s,\xi_p))d\xi_j\ldots d\xi_p,\\ [2ex]
j=1,\ldots,k.
\end{array}\end{displaymath} (4.5)

В (4.5) согласно принятым обозначениям (2.10) имеем

\begin{displaymath}
m^{(\tau_p)}({\bf q}_{[j]}(\cdot);\xi_j,\ldots,\xi_p)=\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}=
\sum_{i_1=h_1(\tau_p)+1}^{N_1}X^T[t_1^{[i_1]},\vart...
...]}_{[j],1}(\xi_j,\ldots,\xi_k)\mid\xi_j,\ldots,\xi_p\}+\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+
\sum_{i_2=h_2(\tau_p)+1}^{N_2}X^T[t_2^{[i_2]},\vart...
..._j,\ldots,\xi_k)\mid\xi_j,\ldots,\xi_p\},
\quad j\leq p\leq k.
\end{displaymath}

Отметим, что из (2.8)-(2.13), (4.5) (при $j=1$) и определения области $G_1(t_*)$ (4.4) следует равенство

\begin{displaymath}
e(x[t_0[\cdot]t_*],\Delta_k)=\sum_{i_1=1}^{h_1(t_*)}\mu_1^{[i_1]}(x[t_1^{[i_1]}])+
\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{} +
\sup_{(m_{(1)},\nu_{(1)}) \in G_1(t_*)}
[(1-\nu_{(...
...1\leq i_2 \leq h_2(t_*)}\mu_2^{[i_2]}(x[t_2^{[i_2]}])+
\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{} +
\langle m_{(1)},X[\vartheta,t_*]x_* \rangle+
\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+
\sup_{{\bf q}_{[1]}(\cdot)\in {\bf Q}_{[1]}(\Omega)
\vert (m_{(1)},\nu_{(1)})}
g_1(t_*,{\bf q}_{[1]}(\cdot))]
\end{displaymath} (4.6)

где внутренний sup вычисляется по случайным вектор-функциям ${\bf q}_{[1]}(\cdot)\in {\bf Q}_{[1]}(\Omega)$ таким, что $m({\bf q}_{[1]}(\cdot))=m_{(1)}$, $M\{q_{[1],0}(\omega)\}=\nu_{(1)}$.

Таким образом, для вычисления величины $e(x[t_0[\cdot]t_*],\Delta_k)$ (2.11) требуется решить задачу поиска точной верхней грани функционала $g_1(t_*,{\bf q}_{[1]}(\cdot))$ на множестве случайных вектор-функций ${\bf q}_{[1]}(\cdot)\in {\bf Q}_{[1]}(\Omega)$: $m({\bf q}_{[1]}(\cdot))=m_{(1)}$, $M\{q_{[1],0}(\omega)\}=\nu_{(1)}$. Далее будет показано, что решение этой задачи приведет к известной процедуре ([10]) построения выпуклых сверху оболочек для вспомогательных функций из детерминированной программной конструкции. Приведем здесь эту конструкцию. Следуя [10], определим рекуррентную последовательность функций $\varphi_j(t_*;m_{(j)},\nu_{(j)})$, $(m_{(j)},\nu_{(j)}) \in G_j(t_*)$. При $j=k$ полагаем

\begin{displaymath}
\psi_k(t_*;m_{(k)},\nu_{(k)})=\Delta \psi_k(t_*;m_{(k)}),
\end{displaymath}


\begin{displaymath}
\varphi_k(t_*;m_{(k)},\nu_{(k)})=\{\psi_k(t_*;\cdot,\cdot)\}^*_{G_k(t_*)},~
(m_{(k)},\nu_{(k)}) \in G_k(t_*).
\end{displaymath} (4.7)

Символом $\varphi(t_*;m,\nu)=\{\psi(t_*;\cdot,\cdot)\}^*_{G_*}$ здесь обозначена выпуклая сверху оболочка функции $\psi(t_*;\cdot,\cdot)$ в области $G_*$, т.е. функция, минимальная из всех вогнутых функций, мажорирующих $\psi(t_*;m,\nu)$ при $(m,\nu)\in G_*$. Далее по индукции. Пусть для $j$ ($1<j\leq k$) уже построена функция
$\varphi_j(t_*;m_{(j)},\nu_{(j)})$, $(m_{(j)},\nu_{(j)}) \in G_j(t_*)$. Для $j-1$ определяем

\begin{displaymath}
\varphi_{j-1}(t_*;m_{(j-1)},\nu_{(j-1)})=\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}=
\{\psi_{j-1}(t_*;\cdot,\cdot)\}^*_{G_{j-1}(t_*)},~
(m_{(j-1)},\nu_{(j-1)}) \in G_{{j-1}}(t_*),
\end{displaymath} (4.8)

где
\begin{displaymath}
\psi_{j-1}(t_*;m_{(j-1)},\nu_{(j-1)})=
\Delta \psi_{j-1}(t_*;m_{(j-1)})
+\varphi_j^{'}(t_*;m_{(j-1)},\nu_{(j-1)}).
\end{displaymath} (4.9)

Здесь в первом случае (когда $h_1(\tau_j)=h_1(\tau_{j-1})$, $h_2(\tau_j)=h_2(\tau_{j-1})$) полагаем
\begin{displaymath}
\varphi_j^{'}(t_*;m_{(j-1)},\nu_{(j-1)})=
\varphi_j(t_*;m_{(j-1)},\nu_{(j-1)}).
\end{displaymath} (4.10)

Во втором в случае (когда $h_1(\tau_j)=h_1(\tau_{j-1})+1$, $h_2(\tau_j)=h_2(\tau_{j-1})$) определяем
\begin{displaymath}
\varphi_j^{'}(t_*;m_{(j-1)},\nu_{(j-1)})=
\max_{m_{(j)}}\varphi_j(t_*;m_{(j)},\nu_{(j-1)}),
\end{displaymath} (4.11)

при этом максимум вычисляется при условии
\begin{displaymath}
\begin{array}{c}
\displaystyle
m_{(j)}+X^T[t_1^{[h_1(\tau_j)...
...leq 1, \\ [2ex]
(m_{(j)},\nu_{(j-1)}) \in G_j(t_*).
\end{array}\end{displaymath} (4.12)

В третьем случае (когда $h_1(\tau_j)=h_1(\tau_{j-1})$, $h_2(\tau_j)=h_2(\tau_{j-1})+1$) полагаем
\begin{displaymath}
\varphi_j^{'}(t_*;m_{(j-1)},\nu_{(j-1)})=
\max_{(m_{(j)},\nu_{(j)})}\varphi_j(t_*;m_{(j)},\nu_{(j)}),
\end{displaymath} (4.13)

где максимум вычисляется при условии

\begin{displaymath}
m_{(j)}+X^T[t_2^{[h_2(\tau_j)]},\vartheta]l=m_{(j-1)},
\end{displaymath}


\begin{displaymath}
\mu_2^{*[h_2(\tau_j)]}(l)\leq \nu_{(j-1)}-\nu_{(j)},\quad
\nu_{(j-1)}\geq \nu_{(j)},\quad (m_{(j)},\nu_{(j)}) \in G_j(t_*).
\end{displaymath} (4.14)

Докажем далее, что справедливо равенство

\begin{displaymath}
\sup_{{\bf q}_{[1]}(\cdot)\in {\bf Q}_{[1]}(\Omega)
\vert (m...
...t_*;m_{(1)},\nu_{(1)}),\quad (m_{(1)},\nu_{(1)}) \in G_1(t_*).
\end{displaymath} (4.15)

Заметим, что для каждого $j=1,\ldots,k$ в силу теоремы Каратеодори [13] для выпуклой сверху оболочки $\varphi_j(t_*;\cdot,\cdot)$ функции $\psi_j(t_*;\cdot,\cdot)$ в области $G_j(t_*)$ для любого $(m_{(j)},\nu_{(j)}) \in G_j(t_*)$ найдется по крайней мере по одному набору $(n+1)$-мерных векторов $(r_{(j)}^{(s)},c_{(j)}^{(s)})\in G_j(t_*)$ $(r_{(j)}^{(s)}=r_{(j)}^{(s)}(m_{(j)},\nu_{(j)})$, $c_{(j)}^{(s)}=c_{(j)}^{(s)}(m_{(j)},\nu_{(j)}))$ и чисел $\beta_{(j)}^{(s)}=\beta_{(j)}^{(s)}(m_{(j)},\nu_{(j)})$, $\beta_{(j)}^{(s)}\geq 0$, $s=1,\ldots,n+2$, $\sum_{s=1}^{n+2}\beta_{(j)}^{(s)}=1$, связанных соотношениями
\begin{displaymath}
\begin{array}{c}
\displaystyle
\sum_{s=1}^{n+2}\beta_{(j)}^{...
...}(r_{(j)}^{(s)},c_{(j)}^{(s)})=(m_{(j)},\nu_{(j)}).
\end{array}\end{displaymath} (4.16)

Кроме того, по набору $\{\beta_{(j)}^{(s)}\}_{s=1}^{n+2}$ найдется хотя бы один набор $\{L_{j}^{(s)}\}_{s=1}^{n+2}=\{L_{j}^{(s)}(\beta_{(j)}^{(s)})\}_{s=1}^{n+2}$ непересекающихся борелевских множеств отрезка $0\leq\xi_j\leq 1$ таких, что:

1) $\bigcup_{s=1}^{n+2}L_{j}^{(s)}=[0,1]$;

2)$L_{j}^{(s)}$ имеют лебегову меру $P_{\xi_j}(L_{j}^{(s)})=\beta_{(j)}^{(s)}$, $s=1,\ldots,n+2$.

Определим теперь рекуррентную последовательность величин

\begin{displaymath}
{\bf q}_{[j]}^0(m_{(j)},\nu_{(j)};\cdot)=
\{{\bf q}_{[j]}^0(...
..._{(j)},\nu_{(j)};\xi_j,\ldots,\xi_k),
~\omega \in \Omega \}\in
\end{displaymath}


\begin{displaymath}
\in {\bf Q}_{(j)}(\Omega),
\qquad j=1,\ldots,k.
\end{displaymath}

Прежде всего для любого $j=1,\ldots,k$ полагаем
\begin{displaymath}
q_{[j],0}^0(m_{(j)},\nu_{(j)};\xi_j,\ldots,\xi_k)=
q_{[j],0}...
..._j)=c_{(j)}^{(s)}, \quad
\mbox{если} \ \xi_{j}\in L_{j}^{(s)}.
\end{displaymath} (4.17)

Осталось определить $q_{[j],{\alpha}}^{0[i_{\alpha}]}(m_{(j)},\nu_{(j)};\xi_j,\ldots,\xi_k)$, $i_{\alpha}=h_{\alpha}(\tau_j)+1,\ldots,N_{\alpha}$, ${\alpha}=1,2$. При $j=k$ полагаем
\begin{displaymath}
q_{[k],{\alpha}}^{0[N_{\alpha}]}(m_{(k)},\nu_{(k)};\xi_k)=
r_{(k)}^{(s)},\quad \mbox{если} \ \xi_k\in L_{k}^{(s)}.
\end{displaymath} (4.18)

При этом если $t_1^{[N_1]}=\vartheta$, то ${\alpha}=1$, если $t_2^{[N_2]}=\vartheta$, то ${\alpha}=2$. Далее по индукции. Пусть для $j$ $(1<j\leq k)$ уже построены $q_{[j],{\alpha}}^{0[i_{\alpha}]}(m_{(j)},\nu_{(j)};\xi_j,\ldots,\xi_k)$, $i_{\alpha}=h_{\alpha}(\tau_j)+1,\ldots,N_{\alpha}$, ${\alpha}=1,2$, $(m_{(j)},\nu_{(j)})\in G_{(j)}(t_*)$.

В случае, когда $h_1(\tau_j)=h_1(\tau_{j-1})$, $h_2(\tau_j)=h_2(\tau_{j-1})$, полагаем

\begin{displaymath}
\begin{array}{c}
q_{[j-1],{\alpha}}^{0[i_{\alpha}]}(m_{(j-1)...
...,\\ [2ex]
~\mbox{если} ~\xi_{j-1}\in L_{j-1}^{(s)},
\end{array}\end{displaymath} (4.19)


\begin{displaymath}
i_{\alpha}=h_{\alpha}(\tau_{j})+1,\ldots,N_{\alpha},\qquad {\alpha}=1,2.
\end{displaymath}

В случае, когда $h_1(\tau_j)=h_1(\tau_{j-1})+1$, $h_2(\tau_j)=h_2(\tau_{j-1})$, сначала каждому фиксированному вектору $(r^{(s)}_{(j-1)},c^{(s)}_{(j-1)})\in G_{j-1}(t_*)$ произвольным выбором поставим в соответствие пару векторов $\{l^{(s)},m^{(s)}_{(j)}\}=\{l^{(s)}(r^{(s)}_{(j-1)},c^{(s)}_{(j-1)})$, $m^{(s)}_{(j)}(r^{(s)}_{(j-1)},c^{(s)}_{(j-1)})\}$, $\mu_1^{*[h_1(\tau_j)]}(l^{(s)})\leq 1$, $(m^{(s)}_{(j)},c^{(s)}_{(j-1)})\in G_{j}(t_*)$, решающих задачу на максимум в (4.11) при условии (4.12), если в (4.11), (4.12) положить $m_{(j-1)}=r^{(s)}_{(j-1)}$, $\nu_{(j-1)}=c^{(s)}_{(j-1)}$. Затем определяем

\begin{displaymath}
q_{[j-1],1}^{0[h_1(\tau_{j})]}(m_{(j-1)},\nu_{(j-1)};\xi_{j-1},\xi_j,\ldots,\xi_k)=
l^{(s)},
\end{displaymath} (4.20)


\begin{displaymath}
\begin{array}{c}
q_{[j-1],{\alpha}}^{0[i_{\alpha}]}(m_{(j-1)...
...,\\ [2ex]
~\mbox{если} ~\xi_{j-1}\in L_{j-1}^{(s)},
\end{array}\end{displaymath} (4.21)


\begin{displaymath}
i_{\alpha}=h_{\alpha}(\tau_{j})+1,\ldots,N_{\alpha},\qquad {\alpha}=1,2.
\end{displaymath}

Наконец, в случае $h_1(\tau_j)=h_1(\tau_{j-1})$, $h_2(\tau_j)=h_2(\tau_{j-1})+1$ сначала каждому фиксированному вектору $(r^{(s)}_{(j-1)},c^{(s)}_{(j-1)})\in G_{j-1}(t_*)$ произвольным выбором поставим в соответствие пару векторов $\{l^{(s)},m^{(s)}_{(j)}\}=\{l^{(s)}(r^{(s)}_{(j-1)},c^{(s)}_{(j-1)})$, $m^{(s)}_{(j)}(r^{(s)}_{(j-1)},c^{(s)}_{(j-1)})\}$ и число $\nu^{(s)}_{(j)}=\nu^{(s)}_{(j)}(r^{(s)}_{(j-1)},c^{(s)}_{(j-1)})$, $\nu^{(s)}_{(j)}\geq 0$,
$\mu_2^{*[h_2(\tau_j)]}(l^{(s)})\leq c^{(s)}_{(j-1)}-\nu^{(s)}_{(j)}$, $c^{(s)}_{(j-1)}\geq \nu^{(s)}_{(j)}$, $(m^{(s)}_{(j)},\nu^{(s)}_{(j)})\in G_{j}(t_*)$, решающих задачу на максимум в (4.13) при условии (4.14), если в (4.13),(4.14) положить $m_{(j-1)}=r^{(s)}_{(j-1)}$, $\nu_{(j-1)}=c^{(s)}_{(j-1)}$. Затем определяем

\begin{displaymath}
q_{[j-1],2}^{0[h_2(\tau_{j})]}(m_{(j-1)},\nu_{(j-1)};\xi_{j-1},\xi_j,\ldots,\xi_k)=
l^{(s)},
\end{displaymath} (4.22)


\begin{displaymath}
\begin{array}{c}
q_{[j-1],{\alpha}}^{0[i_{\alpha}]}(m_{(j-1)...
...,\\ [2ex]
~\mbox{если} ~\xi_{j-1}\in L_{j-1}^{(s)},
\end{array}\end{displaymath} (4.23)


\begin{displaymath}
i_{\alpha}=h_{\alpha}(\tau_{j})+1,\ldots,N_{\alpha},\qquad {\alpha}=1,2.
\end{displaymath}

Продолжая индукцию до $j=1$, получим ${\bf q}_{[1]}^0(m_{(1)},\nu_{(1)};\xi_1,\ldots\xi_k)$,
$(m_{(1)},\nu_{(1)})\in G_{(1)}(t_*)$, $0\leq\xi_{p}\leq 1$, $p=1,\cdots,k$. Построенные функции ${\bf q}_{[j]}^0(m_{(j)},\nu_{(j)};\xi_j,\ldots,\xi_k)$ конечнозначны по $\xi_j,\ldots,\xi_k$ при каждом
$(m_{(j)},\nu_{(j)})\in G_{(j)}(t_*)$. Можно проверить, что они удовлетворяют условиям (4.1)-(4.3), так что ${\bf q}_{[j]}^0(m_{(j)},\nu_{(j)};\cdot)\in {\bf Q}_j(\Omega)$, $j=1,\ldots,k$. Покажем, что они также обладают следующими свойствами.

$1^{(j)}$. Для любого вектора $(m_{(j)},\nu_{(j)})\in G_{(j)}(t_*)$ выполняются равенства

\begin{displaymath}
m({\bf q}_{[j]}^0(m_{(j)},\nu_{(j)};\cdot))=m_{(j)},
\quad M\{q^0_{[j],0}(m_{(j)},\nu_{(j)};\omega)\}=\nu_{(j)},
\end{displaymath} (4.24)


\begin{displaymath}
~g_j(t_*;{\bf q}_{[j]}^0(m_{(j)},\nu_{(j)};\cdot))=\varphi_j(t_*;m_{(j)},\nu_{(j)}).
\end{displaymath} (4.25)

$2^{(j)}$. Для любого вектора $(m_{(j)},\nu_{(j)}) \in G_j(t_*)$, для любых ${\bf q}_{[j]}(\cdot)\in {\bf Q}_{j}(\Omega)$ таких, что $m({\bf q}_{[j]}(\cdot))=m_{(j)}$, $M\{q_{[j],0}(\omega)\}=\nu_{(j)}$, $j=1,\ldots,k$ выполняется неравенство

\begin{displaymath}
g_j(t_*;{\bf q}_{[j]}(\cdot))\leq g_j(t_*;{\bf q}_{[j]}^0(m_{(j)},\nu_{(j)};\cdot)).
\end{displaymath} (4.26)

Доказательство свойств $1^{(j)}$ и $2^{(j)}$, $j=1,\ldots,k$ проведем по индукции. Пусть $j=k$. Свойство $1^{(k)}$ вытекает непосредственно из определения $g_k(t_*;{\bf q}_{[k]}^0(m_{(k)},\nu_{(k)};\cdot))$ (4.5), построения ${\bf q}_{[k]}^0(m_{(k)},\nu_{(k)};\cdot)$ (4.17), (4.18), если учесть (4.16) при $j=k$. Проверим, что выполняется свойство $2^{(k)}$. Возьмем любую допустимую ${\bf q}_{[k]}(\xi_k)$. Она определена на вероятностном пространстве $\{\Omega_{\xi_k},B_{\xi_k},$P$_{\xi_k}\}$, где $\Omega_{\xi_k}$ - единичный отрезок, $B_{\xi_k}$ - борелевская $\sigma$-алгебра на этом отрезке, P$_{\xi_k}$ - мера Лебега. Рассмотрим также вероятностное пространство $\{\Omega_{\{r_k,\nu_k\}},B_{\{r_k,\nu_k\}},$P $_{\{r_k,\nu_k\}}\}$, где $\Omega_{\{r_k,\nu_k\}}=G_{(k)}(t_*)$, $B_{\{r_k,\nu_k\}}$ - борелевская $\sigma$-алгебра на $\Omega_{\{r_k,\nu_k\}}$, P $_{\{r_k,\nu_k\}}$ - мера Лебега. Применяя теорему о замене переменных под знаком интеграла Лебега (см. [14, стр. 213]), из вогнутости $\varphi_k(t_*;m_{(k)},\nu_{(k)})$, $(m_{(k)},\nu_{(k)})\in G_{(k)}(t_*)$, неравенства Иенсена (см. [14, стр. 209]), а также неравенства $\varphi_k(t_*;m_{(k)},\nu_{(k)})\ge \psi_k(t_*;m_{(k)},\nu_{(k)})$, $(m_{(k)},\nu_{(k)})\in G_k(t_*)$ получаем, что существует мера
$\beta^* (d(r,c)\mid (m_{(k)},\nu_{(k)})),$ для которой

\begin{displaymath}
\int \limits_{[\xi_k]}
\{q_{[k],\alpha}^{[N_{\alpha}]}(\xi_k),q_{[k],0}(\xi_k)\}d\xi_k
=\end{displaymath}


\begin{displaymath}=\int \limits_{(r,c) \in G_k(t_*)} (r,c)\beta^* (d(r,
c)\mid (m_{(k)},\nu_{(k)}))=(m_{(k)},\nu_{(k)}),
\end{displaymath}


\begin{displaymath}
g_k(t_*;{\bf q}_{[k]}(\cdot))=\int \limits_{[\xi_k]}\psi_k(t_*;
q^{[N_{\alpha}]}_{[k],\alpha}(\xi_k),q_{[k],0}(\xi_k))d\xi_k=
\end{displaymath}


\begin{displaymath}
=\int \limits_{(r,c) \in G_k(t_*)}\psi_k(t_*;r,c)\beta^* (d(...
...id (m_{(k)},\nu_{(k)})) \leq \varphi_k(t_*;m_{(k)},\nu_{(k)}).
\end{displaymath}

Здесь $\alpha=1$, если $t_1^{[N_1]}=\vartheta$ или $\alpha=2$, если $t_2^{[N_2]}=\vartheta$. Cвойство $2^{(k)}$ доказано.

Предположим теперь, что при $j$ ($1<j\le k$) выполняются свойства $1^{(j)}$ и $2^{(j)}$. Покажем, что тогда имеют место свойства $1^{(j-1)}$ и $2^{(j-1)}$ для ${\bf q}_{[j-1]}^0(m_{(j-1)},\nu_{(j-1)};\cdot))$, $(m_{(j-1)},\nu_{(j-1)})\in G_{j-1}(t_*)$. Доказательство приведем здесь для наиболее сложного случая, когда $h_1(\tau_j)=h_1(\tau_{j-1})$, $h_2(\tau_j)=h_2(\tau_{j-1})+1$. Свойство $1^{(j-1)}$ вытекает из построения (4.17), (4.26), (4.25) если в выражениях, определяющих $m({\bf q}_{[j-1]}^0(m_{(j-1)},\nu_{(j-1)};\cdot))$,
$M\{q^0_{[j-1],0}(m_{(j-1)},\nu_{(j-1)};\cdot)\}$ и $g_{j-1}(t_*;{\bf q}_{[j-1]}^0(m_{(j-1)},\nu_{(j-1)};\cdot))$ (см. (4.5)), перейти от от интегрирования по области $[\xi_{j-1},\xi_j\ldots \xi_k]$ к повторному интегрированию (см. [14, стр. 215]) сначала по области $[\xi_j\ldots \xi_k]$, а потом по $[\xi_{j-1}]$ и далее учесть свойство $1^{(j)}$, а также (4.8), (4.9), (4.13) и (4.14), (4.16). Таким образом, получаем равенства

\begin{displaymath}
m({\bf q}_{[j-1]}^0(m_{(j-1)},\nu_{(j-1)};\cdot))=
\sum_{s=1...
...[t_2^{[h_2(\tau_j)]},\vartheta]
l^{(s)}+m_{(j)}^{(s)}]=\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}=
\sum_{s=1}^{n+2}\beta_{(j-1)}^{(s)}r_{(j-1)}^{(s)}=m_{(j-1)},
\end{displaymath}


\begin{displaymath}
M\{q^0_{[j-1],0}(m_{(j-1)},\nu_{(j-1)};\omega)\}=
\sum_{s=1}^{n+2}\beta_{(j-1)}^{(s)}c_{(j-1)}^{(s)}=\nu_{(j-1)},
\end{displaymath}


\begin{displaymath}
g_{j-1}(t_*;{\bf q}_{[j-1]}^0(m_{(j-1)},\nu_{(j-1)};\cdot))=\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}=
\sum_{s=1}^{n+2}\beta_{(j-1)}^{(s)} \times
[\Delta\...
...{\bf q}_{[j]}^0(m_{(j)}^{(s)},\nu_{(j)}^{(s)};\cdot))]=\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}=
\sum_{s=1}^{n+2}\beta_{(j-1)}^{(s)}[\Delta\psi_{j-1...
...)+
\varphi_j^{'}(t_*;r_{(j-1)}^{(s)},c_{(j-1)}^{(s)})]=\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}=\varphi_{j-1}(t_*;m_{(j-1)},\nu_{(j-1)}).
\end{displaymath}

Что и доказывает свойство $1^{(j-1)}$.

Проверим выполнение свойства $2^{(j-1)}$. Возьмем $(m_{(j-1)},\nu_{(j-1)})\in$
$G_{(j-1)}(t_*)$ и какую-то допустимую ${\bf q}_{[j-1]}(\cdot)$. Далее обозначим

\begin{displaymath}
r(\xi_{j-1})=m^{(\tau_{j-1})}({\bf q}_{[j-1]}(\cdot);\xi_{j-1}),
\end{displaymath}


\begin{displaymath}
l(\xi_{j-1})=M\{q_{[j-1],2}^{[h_2(\tau_j)]}(\xi_{j-1},\xi_j,\ldots,\xi_k)\vert \xi_{j-1}\},
\end{displaymath}


\begin{displaymath}
c(\xi_{j-1})=M\{q_{[j-1],0}(\xi_{j-1},\xi_j,\ldots,\xi_k)\vert \xi_{j-1}\},
\end{displaymath}


\begin{displaymath}
m(\xi_{j-1})= r(\xi_{j-1})-X^T[t^{[h_2(\tau_j)]},\vartheta]l(\xi_{j-1}),
\end{displaymath}


\begin{displaymath}
\nu(\xi_{j-1})=M\{q_{[j-1],0}(\xi_{j-1},\xi_j,\ldots,\xi_k)-\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}-
\mu_2^{*[h_2(\tau_j)]}(q_{[j-1],2}^{[h_2(\tau_j)]}(\xi_{j-1},\xi_j,\ldots,\xi_k))\vert \xi_{j-1}\},
\end{displaymath}


\begin{displaymath}
\hat {\bf q}(\xi_{j-1};\cdot)=\left\{q_{[j-1],0}(\xi_{j-1},\...
...au_j)]}(q_{[j-1],2}^{[h_2(\tau_j)]}(\xi_{j-1},\cdot)),
\right.
\end{displaymath}


\begin{displaymath}
\left.
\{q_{[j-1],\alpha}^{[i_\alpha]}(\xi_{j-1},\cdot)\}_{i_\alpha=h_\alpha(\tau_j)+1}^{N_\alpha},\alpha=1,2
\right\}.
\end{displaymath}

Отметим, что при почти всех $\xi_{j-1}\in [0,1]$ имеем $\hat {\bf q}(\xi_{j-1};\cdot) \in {\bf Q}_{j}(\Omega)$. Опираясь на неравенство Йенсена для вогнутых функций, выпуклость норм $\mu_2^{*[i]}(\cdot)$, $i_2=h_2(\tau_j),\ldots,N_2$, получаем, что при почти всех $\xi_{j-1}\in [0,1]$ справедливы включения $(r(\xi_{j-1}),c(\xi_{j-1}))\in G_{j-1}(t_*)$ и $(m(\xi_{j-1}),\nu(\xi_{j-1}))\in G_{j}(t_*)$. Кроме того, пара $\{m(\xi_{j-1}),\nu(\xi_{j-1})\}$ удовлетворяет условию (4.14) при $m_{(j-1)}=r(\xi_{j-1})$, $\nu_{(j-1)}=c(\xi_{j-1})$ и $l=l(\xi_{j-1})$. Принимая во внимание свойство $2^{(j)}$, определение (4.13), (4.14) функции $\varphi_j^{'}(t_*;r_{(j-1)},c_{(j-1)})$, $(r_{(j-1)},c_{(j-1)})\in G_{(j-1)}(t_*)$, получаем следующую цепочку соотношений
\begin{displaymath}
g_j\left(t_*;\hat {\bf q}(\xi_{j-1};\cdot)\right)\leq
\varph...
...u(\xi_{j-1}))\leq\varphi_j^{'}(t_*;r(\xi_{j-1}),c(\xi_{j-1})),
\end{displaymath} (4.27)

имеющую место при почти всех $\xi_{j-1}\in [0,1]$. Переходя в выражении, определяющем $g_{j-1}(t_*;{\bf q}_{[j-1]}(\cdot))$ (см. (4.5)), от интегрирования по области $[\xi_{j-1},\xi_j\ldots \xi_k]$ к повторному интегрированию сначала по области $[\xi_j\ldots \xi_k]$, а потом по $[\xi_{j-1}]$, учитывая далее определение (4.5), неравенство (4.27), а также свойство $2^{(j)}$, получаем

\begin{displaymath}
g_{j-1}(t_*;{\bf q}_{[j-1]}(\cdot))=
\int \limits_{[\xi_{j-1...
...(t_*;\hat {\bf q}(\xi_{j-1};\cdot)\right)\right]d\xi_{j-1}\leq
\end{displaymath}


\begin{displaymath}
\leq\int \limits_{[\xi_{j-1}]}
\left[\Delta\psi_{j-1}(t_*;r(...
...{j-1}^{'}(t_*;r(\xi_{j-1}),c(\xi_{j-1}))\right]d\xi_{j-1} \leq
\end{displaymath}


\begin{displaymath}
\leq \varphi_{j-1}(t_*;m_{(j-1)},\nu_{(j-1)}),
\end{displaymath}

что доказывает $2^{(j-1)}$. Обоснование последнего неравенства проводится здесь аналогично доказательству свойства, проведенному на базе индукции при $j=k$. Подобным образом можно провести доказательство свойств $1^{(j-1)}$, $2^{(j-1)}$ в других случаях, используя вместо построения (4.17), (4.18), (4.22), (4.23) построение (4.17), (4.18), (4.19)-(4.21).

В силу индукции свойства $1^{(j)}$, $2^{(j)}$ справедливы при $j=1,\ldots,k$. Принимая во внимание $1^{(1)}$, $2^{(1)}$, получаем, что верхняя грань в (4.15) достигается на конечнозначной случайной величине ${\bf q}_{[1]}^0(m_{(1)},\nu_{(1)};\cdot)$, $(m_{(1)},\nu_{(1)})\in G_{(1)}(t_*)$, и (4.15) доказано. Из (4.6) и (4.15) вытекает равенство

\begin{displaymath}
e(x[t_0[\cdot]t_*],\Delta_k)=\sum_{i_1=1}^{h_1(t_*)}\mu_1^{[i_1]}(x[t_1^{[i_1]}])+
\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+ \sup_{(m_{(1)},\nu_{(1)}) \in G_1(t_*)}
[(1-\nu_{(1...
...{[i_2]}])+
\langle m_{(1)},X[\vartheta,t_*]x_* \rangle+\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+
\varphi_1(t_*;m_{(1)},\nu_{(1)})].
\end{displaymath} (4.28)

Таким образом, вычисление стохастического программного экстремума $e(\cdot)$ сводится к построению рекуррентной последовательности выпуклых сверху оболочек (4.7)-(4.14) из детерминированной программной конструкции [6], [10], предложенной для вычисления цены игры. Согласно [10] величина (4.28) обладает свойством $v$-стабильности.

Рассмотрим теперь предельный переход в обсуждаемых конструкциях при измельчении шага $\Delta_{k}$. Используя лемму 3.1, свойство $v$-стабильности величины (4.28), равенство (2.15), следуя [6, стр. 147-151], приходим к следующему утверждению.

Теорема 4.1   Каковы бы ни были исходная история $w[t_0[\cdot]\tau_*]=$
$x[t_0[\cdot]t_*]$ и последовательность разбиений % latex2html id marker 3339
$(\ref{2.2})$ $\{\Delta_k=\Delta_{k}\{\tau_{j}\}\}
(k=1,2,\ldots)$ отрезка $[t_*,\vartheta]$, $\tau_{1}=t_*$, $\tau_{k+1}=\vartheta$ c шагом $\delta_k=\max_{j}(\tau_{j+1}-\tau_{j})\to 0$ при $k\to \infty$, справедливо равенство

\begin{displaymath}
\lim_{k \to \infty}\rho(x[t_0[\cdot]t_*],\Delta_k)=
\lim_{k ...
...\infty}e(x[t_0[\cdot]t_*],\Delta_k)=
\rho^0(x[t_0[\cdot]t_*]),
\end{displaymath}

где $\rho^0(x[t_0[\cdot]t_*])$ - цена рассматриваемой дифференциальной игры
% latex2html id marker 3357
$(\ref{1.1})$-% latex2html id marker 3359
$(\ref{1.3})$.


next up previous
Next: Bibliography Up: KOVR1 Previous: 3 Стабильность стохастического программного
2003-04-28