next up previous
Next: 3 Стабильность стохастического программного Up: KOVR1 Previous: 1 Постановка задачи.

2. Стохастическая программная конструкция.

Рассмотрим $w$-модель, описываемую дифференциальным уравнением

\begin{displaymath}
{dw \over d\tau}=A(\tau)w+B(\tau)u+C(\tau)v,\ \ \ \ \tau\in[t_0,\vartheta] ,
\end{displaymath} (2.1)

где $w\in R^n,~ u\in P,~ v\in Q$.

Пусть реализовалась история $w[t_0[\cdot]\tau_*]$ движения модели (2.1), $t_0\leq \tau_*<\vartheta$. Назначим разбиение

\begin{displaymath}
\Delta_k=\Delta_k\{\tau_j\}=\{\tau_j:~\tau_1=\tau_*,~\tau_j<\tau_{j+1},~
j=1,\ldots,k,~\tau_{k+1}=\vartheta\},
\end{displaymath} (2.2)

в которое включим все моменты $t_{\alpha}^{[i_{\alpha}]}\geq \tau_*$ разбиений $\Delta_{t_{\alpha}^{[i_{\alpha}]}}$, $\alpha=1,2$. Рассмотрим вероятностное пространство $\{\Omega,B,$P$\}$, элементарные события которого $\omega=\{\xi_1,\ldots,\xi_k\}$. Здесь $\xi_j \in [0,1],~j=1,\ldots,k$ - равномерно распределенные случайные величины, связанные с моментами $\tau_j$ разбиения (2.2), $\Omega=\{\omega\}$ - единичный куб в $k$-мерном пространстве, $B$ - борелевская $\sigma$-алгебра для этого куба, P=P(B) - лебегова мера, В $\in B$. Введем стохастические неупреждающие ([2, стр. 292]) программы
$\displaystyle {u[\cdot]=\{u[\tau,\omega]=}$
$\textstyle =$ $\displaystyle u[\tau,\xi_1,\ldots,\xi_j]\in P,
\ \tau_j\leq \tau<\tau_{j+1},~j=1,\ldots,k,~
\omega\in\Omega\},$ (2.3)


$\displaystyle {
v[\cdot]=\{v[\tau,\omega]=}$
$\textstyle =$ $\displaystyle v[\tau,\xi_1,\ldots,\xi_j]\in Q,
\tau_j\leq \tau<\tau_{j+1},~j=1,\ldots,k,~
\omega\in\Omega\},$ (2.4)

которые по совокупности аргументов являются измеримыми по Борелю функциями. Символами $D_u(T\times\Omega)$ и $D_v(T\times\Omega)$ (здесь $T=[\tau_*,\vartheta)$) обозначим множества всех допустимых программ (2.3) и (2.4) соответственно. Из исходной позиции $\{\tau_*,w_*=w[\tau_*]\}$ программы $u[\cdot]\in D_u(T\times\Omega)$ и $v[\cdot]\in D_v(T\times\Omega)$ порождают случайные движения $w$-модели ([2, стр. 292]), ([15, стр. 158])
\begin{displaymath}
w_{v[\cdot],u[\cdot]}[\tau,\omega]=X[\tau,\tau_*]w[\tau_*] +...
...\tau,\eta](B(\eta)u[\eta,\omega]+
C(\eta)v[\eta,\omega])d\eta,
\end{displaymath} (2.5)

где $~\tau \in [\tau_*,\vartheta],~ \omega\in \Omega$, $X[\tau,\eta]$ - фундаментальная матрица решений уравнения $dx/d\tau=A(\tau)x$. Функции $w_{v[\cdot],u[\cdot]}[\tau,\omega]$ будут измеримы по совокупности переменных $\tau$, $\omega$. На базе $\{\Omega,B,$P$\}$ определим линейное пространство ${\bf L}^{(1)}(\Omega)$ с элементами ${\bf s}(\cdot)=\{{\bf s}(\omega),
\omega \in \Omega\}$, ${\bf s}(\omega)=\{s_1^{[1]}(\omega),\ldots,s_1^{[N_1]}(\omega),$
$s_2^{[1]}(\omega),\ldots,s_2^{[N_2]}(\omega)\}$, где компоненты $s_{\alpha}^{[i_{\alpha}]}(\omega)$ ( $i_{\alpha}=1,\ldots,N_{\alpha}$ $\alpha=1,2$) - $n$-мерные случайные величины, определенные на $\{\Omega,B,$P$\}$, для которых $M\{\mu_{\alpha}^{[i_{\alpha}]}(s_{\alpha}^{[i_{\alpha}]}(\omega))\}< \infty$. Здесь и далее символ $M\{\ldots\}=\int_{\Omega} \ldots $P$(d \omega)$ означает математическое ожидание (интеграл Лебега) ([15, стр. 197]). Определим также норму в ${\bf L}^{(1)}(\Omega)$ равенством

\begin{displaymath}
\Vert{\bf s}(\cdot)\Vert=M\left\{\sum\limits_{i_1=1}^{N_1}\m...
...eq i_2\leq N_2}\{\mu_2^{[i_2]}(s_2^{[i_2]}(\omega))\}\right\}.
\end{displaymath}

Пусть
\begin{displaymath}
g_{\alpha}(\tau)=\min\{i_{\alpha}~:t_{\alpha}^{[i_{\alpha}]}\geq \tau\},
\quad \tau \in [t_0,\vartheta], \quad \alpha=1,2.
\end{displaymath} (2.6)

Реализовавшаяся история $w[t_0[\cdot]\tau_*]$ и пара стохастических программ (2.3), (2.4) порождают в силу (2.5) элемент ${\bf y}(\cdot)={\bf y}(\cdot;w[t_0[\cdot]\tau_*],v[\cdot],u[\cdot],\Delta_k)$ из ${\bf L}^{(1)}(\Omega)$ с компонентами $y_{\alpha}^{[i_{\alpha}]}(\omega)=w[t_{\alpha}^{[i_{\alpha}]}]$, $i_{\alpha}=1,\ldots,g_{\alpha}(\tau_*)-1$, $y_{\alpha}^{[i_{\alpha}]}(\omega)=w_{v[\cdot],u[\cdot]}[t_{\alpha}^{[i_{\alpha}]},\omega]$, $i=g_{\alpha}(\tau_*),\ldots,N_{\alpha}$, $\alpha=1,2$.

Следуя методу стохастического программного синтеза ([2],[6]) и принимая во внимание вид рассматриваемого функционала качества $\gamma$ (1.3), введем величину стохастического программного максимина

\begin{displaymath}
\rho(w[t_0[\cdot]\tau_*],\Delta_k\{\tau_j\})=
\sup_{v[\cdot]...
...mega)}\Vert{\bf y}(\cdot)\Vert,
\quad t_0\leq\tau_*<\vartheta,
\end{displaymath} (2.7)

Удобно перейти к двойственному описанию величины (2.7). Через ${\bf L}^{(\infty)}(\Omega)$ обозначим пространство случайных величин ${\bf l}(\cdot)=\{{\bf l}(\omega),
\omega \in \Omega\}$, ${\bf l}(\omega)=\{l_1^{[1]}(\omega),\ldots,l_1^{[N_1]}(\omega)$, $l_2^{[1]}(\omega)$, $\ldots,l_2^{[N_2]}(\omega)\}$, где компоненты $l_{\alpha}^{[i_{\alpha}]}(\omega)$ - $n$-мерные случайные величины, определенные на $\{\Omega,B,$P$\}$, для которых
$\displaystyle \mathrm{vrai}\max_{\omega \in \Omega}\mu_{\alpha}^{*[i_{\alpha}]}
(l_{\alpha}^{[i_{\alpha}]}(\omega)) < \infty$. Здесь $\mu_{\alpha}^{*[i_{\alpha}]}(\cdot)$ - норма, сопряженная с нормой $\mu_{\alpha}^{[i_{\alpha}]}(\cdot)$, $i_{\alpha}=1,\ldots,N_{\alpha}$, $\alpha=1,2$. Норму в ${\bf L}^{(\infty)}(\Omega)$ введем по формуле

\begin{displaymath}
\Vert{\bf l}(\cdot)\Vert^*=
\max \left\{\max_{1 \leq i_1\leq...
...\max_{\omega \in \Omega}\mu_1^{*[i_1]}(l_1^{[i_1]}(\omega))\},
\end{displaymath}


\begin{displaymath}
\left.
\mathrm{vrai}\max_{\omega \in \Omega}\sum_{i_2=1}^{N_2} \mu_2^{*[i_2]}(l_2^{[i_2]}(\omega))\right\}.
\end{displaymath}

Пусть
\begin{displaymath}
h_{\alpha}(\tau)=\max\{i_{\alpha}~:t_{\alpha}^{[i_{\alpha}]}\le \tau\},
\quad \tau \in [t_0,\vartheta], \quad \alpha=1,2.
\end{displaymath} (2.8)

(Если нет ни одного номера $i_{\alpha}$ такого, что $t_{\alpha}^{[i_{\alpha}]}\le \tau$, полагаем $h_{\alpha}(\tau)=0$). Обозначим

\begin{displaymath}
m_{(\tau_*)}({\bf l}(\cdot))=\sum_{i_1=g_1(\tau_{*})}^{N_1}{X^T[t_1^{[i_1]},\vartheta]
M\{l_1^{[i_1]}(\omega)\}}+ \mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+
\sum_{i_2=g_2(\tau_{*})}^{N_2}{X^T[t_2^{[i_2]},\vartheta]
M\{l_2^{[i_2]}(\omega)\}},
\end{displaymath} (2.9)


\begin{displaymath}
m^{(\tau_j)}({\bf l}(\cdot);\xi_1,\ldots,\xi_j)=\sum_{i_1=h_...
...heta]M\{l_1^{[i_1]}(\omega)\vert\xi_1,\ldots,\xi_j\}}+ \mbox{}
\end{displaymath}


\begin{displaymath}
+\sum_{i_2=h_2(\tau_{j})+1}^{N_2}
{X^T[t_2^{[i_2]},\vartheta]M\{l_2^{[i_2]}(\omega)\vert\xi_1,\ldots,\xi_j\}},
~j=1,\ldots,k.
\end{displaymath} (2.10)

Здесь $M\{\ldots \mid \ldots\}$ - условное математическое ожидание.

Определим величину программного экстремума

\begin{displaymath}
\begin{array}{c} \displaystyle
e(w[t_0[\cdot]\tau_*],\Delta_...
...{\bf l}(\cdot)),\\ [2ex]
t_0\leq\tau_*<\vartheta.
\end{array}\end{displaymath} (2.11)

Здесь

\begin{displaymath}
\chi (w[t_0[\cdot]\tau_*],\Delta_k,{\bf l}(\cdot))=
\sigma (w[t_0[\cdot]\tau_*],{\bf l}(\cdot))+ \mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+\langle m_{(\tau_*)}({\bf l}(\cdot)),X[\vartheta,\ta...
...j}(\tau_*,m^{(\tau_j)}
({\bf l}(\cdot);\xi_1,\ldots,\xi_j))\},
\end{displaymath} (2.12)


\begin{displaymath}
\sigma (w[t_0[\cdot]\tau_*],{\bf l}(\cdot))=\sum_{i_1=1}^{g_...
...\langle M\{l_1^{[i_1]}(\omega)\},w[t_1^{[i_1]}]\rangle+\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+
\sum_{i_2=1}^{g_2(\tau_*)-1}\langle M\{l_2^{[i_2]}(\omega)\},w[t_2^{[i_2]}]\rangle,
\end{displaymath} (2.13)


\begin{displaymath}
\begin{array}{c}
\displaystyle
\Delta\psi_j(\tau_*;m)=
\int ...
...e d\tau,\\ [3ex]
\quad m\in R^n,\quad j=1,\ldots,k,
\end{array}\end{displaymath} (2.14)

где $\langle \ldots,\ldots \rangle$ - скалярное произведение векторов. При этом в (2.13) результат суммирования по убывающему индексу полагаем равным нулю. Отметим, что $\Delta\psi_j(\tau_*;m)$ - непрерывные по $m$ функции.

Проверим, что для всякой исходной истории $w[t_0[\cdot]\tau_*]$, $\tau_* \in [t_0,\vartheta)$ при всяком разбиении $\Delta_k$ (2.2) справедливо равенство

\begin{displaymath}
\rho(w[t_0[\cdot]\tau_*],\Delta_k)=e(w[t_0[\cdot]\tau_*],\Delta_k).
\end{displaymath} (2.15)

Пусть зафиксирована стохастическая программа $v^*[\cdot]\in D_v(T\times\Omega)$. Перебирая все программы $u[\cdot]\in D_u(T\times\Omega)$ получим множество:

\begin{displaymath}
{\bf Z}(v^*[\cdot])=\left\{{\bf z}(\cdot):{\bf z}(\cdot)=
{\...
...t],u[\cdot],\Delta_k),
~u[\cdot]\in D_u(T\times\Omega)\right\}
\end{displaymath}

случайных величин ${\bf z}(\cdot) \in {\bf L}^{(1)}(\Omega)$. Это множество будет непустым и выпуклым. Обозначим
\begin{displaymath}
\left({\bf l}(\cdot),{\bf s}(\cdot)\right)
=\int \limits_\Om...
...}(\omega),
s_2^{[i_2]}(\omega)\right>\right ]{\rm P}(d\omega).
\end{displaymath} (2.16)

Согласно [12, стр. 153] любой линейный функционал, определенный на элементах ${\bf s}(\cdot)\in {\bf L}^{(1)}(\Omega)$ представим в виде (2.16) при ${\bf l}(\cdot)\in
{\bf L}^{(\infty)}(\Omega)$. Опираясь на теорему об отделимости выпуклых множеств (см. [11, стр. 107]) можно показать, что для всякой программы $v[\cdot]\in D_v(T\times\Omega)$ имеет место равенство
\begin{displaymath}
\inf_{{\bf z}(\cdot) \in Z(v[\cdot])}\sup_{\Vert {\bf l}(\cd...
... \in Z(v[\cdot])}
\left({\bf l}(\cdot),{\bf z}(\cdot)\right).
\end{displaymath} (2.17)

Далее принимая во внимание (2.5), (2.13),(2.16), неупреждаемость программ (2.3), (2.4) и определение условного математического ожидания, вычисляем

\begin{displaymath}
\left({\bf l}(\cdot),{\bf z}(\cdot)\right)=
\sigma (w[t_0[\...
...tau_*)}({\bf l}(\cdot)),X[\vartheta,\tau_*]w_*\rangle +\mbox{}
\end{displaymath}


\begin{displaymath}
\mbox{}+M\left\{\sum_{j=1}^k \int \limits_{\tau_j}^{\tau_{j+...
...rtheta,\tau](B(\tau)u[\tau,\xi_1,\ldots,\xi_j]+\mbox{}
\right.
\end{displaymath}


\begin{displaymath}
\left. \vphantom{\sum_{j=1}^k}
\mbox{}+ C(\tau)v[\tau,\xi_1,\ldots,\xi_j])\rangle d\tau \right\}.
\end{displaymath} (2.18)

Построим стохастические программы $u^0[\cdot]$, $v^0[\cdot]$ из условий

$\displaystyle {\langle m^{(\tau_j)}({\bf l}(\cdot);\xi_1,\ldots,\xi_j),
X[\vartheta,\tau]B(\tau)u^0[\tau,\omega]\rangle=}$
$\displaystyle $ $\textstyle =$ $\displaystyle \min_{u \in P}\langle m^{(\tau_j)} ({\bf l}(\cdot);\xi_1,\ldots,\xi_j),
X[\vartheta,\tau]B(\tau)u \rangle,$ (2.19)


$\displaystyle {\langle m^{(\tau_j)}({\bf l}(\cdot);\xi_1,\ldots,\xi_j),
X[\vartheta,\tau]C(\tau)v^0[\tau,\omega]\rangle=}$
$\displaystyle $ $\textstyle =$ $\displaystyle \max_{v \in Q}\langle m^{(\tau_j)}({\bf l}(\cdot);\xi_1,\ldots,\xi_j),
X[\vartheta,\tau]C(\tau)v \rangle,$ (2.20)


\begin{displaymath}
\tau_j \leq \tau<\tau_{j+1},\quad j=1,...,k.
\end{displaymath}

Так построенные программы допустимы, так что $u^0[\cdot]\in D_u(T\times\Omega)$, $v^0[\cdot]\in D_v(T\times\Omega)$. Поэтому из (2.12)-(2.14), (2.18)-(2.20) вытекает равенство

\begin{displaymath}
\sup_{v[\cdot]}
\inf_{{\bf z}(\cdot) \in Z(v[\cdot])}\left({...
...t)\right)=
\chi (w[t_0[\cdot]\tau_*],\Delta_k,{\bf l}(\cdot)).
\end{displaymath} (2.21)

Из (2.17), используя затем возможность перестановки местами двух операций взятия верхней грани и учитывая (2.21), получаем равенства

\begin{displaymath}
\rho(w[t_0[\cdot]\tau_*],\Delta_k)=\sup_{v[\cdot]}\inf_{{\bf...
...t) \Vert^* \leq 1}
\left({\bf l}(\cdot),{\bf z}(\cdot)\right)=
\end{displaymath}


\begin{displaymath}
=\sup_{\Vert {\bf l}(\cdot) \Vert^* \leq 1}
\sup_{v[\cdot]}\...
...^* \leq 1}
\chi (w[t_0[\cdot]\tau_*],\Delta_k,{\bf l}(\cdot)),
\end{displaymath}

которые, согласно (2.11), доказывают равенство (2.15).

Обратимся теперь к случаю, когда $\tau_*=\vartheta$. В этом случае величины $\rho(\cdot)$ и $e(\cdot)$ определим формально равенствами $\rho(w[t_0[\cdot]\vartheta],\Delta_k)=$
$e(w[t_0[\cdot]\vartheta],\Delta_k)=$ $\gamma(w[t_0[\cdot]\vartheta]),$ где теперь символом $\Delta_k$ обозначено множество, состоящее из одной точки $\{\tau_1=\tau_*=\vartheta\}$.


next up previous
Next: 3 Стабильность стохастического программного Up: KOVR1 Previous: 1 Постановка задачи.
2003-04-28