next up previous
Next: 4 Свойства матриц Up: SAZ Previous: 2 Построение оптимального программного

3. Решение задачи о синтезе оптимального управления


Для решения задачи 1.2 введем обозначения

$\displaystyle c(k)=c\bigl(k, x(k)\bigr)=x_1-A^{N-k}x(k),$ (3.1)

$\displaystyle {\cal D}(k)=\sum_{i=k}^{N-1}S(i) S^T(i).$ (3.2)

Будем рассматривать правую часть равенства (2.10) как функцию от
$ k_0 = k,$ $ x_0=x(k).$ Получим управление, построенное по принципу обратной связи ([12, стр. 251]):

\begin{displaymath}\begin{array}{c} u^0\bigl[k, x(k)\bigr]=u^0\bigl[k; k, x(k...
... D}^+(k) c(k), \ [2ex] k=k_0,  k_0+1,\ldots,N-1. \end{array}\end{displaymath} (3.3)

В следующей теореме доказывается, что $ u^0\bigl[k, x(k)\bigr] $ (3.3) есть оптимальное управление по принципу обратной связи.

Теорема 3.1. Пусть выполнено условие 2.1, и $ u^0\left(k;\
k_0, x_0\right)$ - оптимальное программное управление, переводящее систему % latex2html id marker 3683
$ (\ref{q11})$ из состояния $ x(k_0)=x_0$ в состояние $ x(N)=x_1.$ Тогда $ u^0(k;\
k_0, x_0)$ и реализация управления, построенного по принципу обратной связи $ u^0\bigl[k; k, x(k)\bigr],$ на оптимальном движении $ x^0(k)$ совпадают, т.е.

$\displaystyle u^0\bigl[k; k, x^0(k)\bigr]= S^T(k) {\cal D}^+(k) c(k)=u^0(k; k_0, x_0)= S^T(k) {\cal D}^+(k_0) c(k_0)$ (3.4)

при всех $  k=k_0,  k_0+1,\ldots,N-1.$

Следовательно, $ u^0\bigl[k, x(k)\bigr]$ (3.3) - оптимальное управление, построенное по принципу обратной связи.

Д о к а з а т е л ь с т в о. Доказательство проводим, пользуясь методом математической индукции.

База индукции. Из (3.3) следует равенство (3.4) при $ k=k_0.$

Шаг индукции. Пусть утверждение теоремы верно для всех $ k=k_0,$ $ k_0 + 1,\ldots,$ $ q<N-1.$ Покажем, что оно выполняется и для $ k=q+1,$ т.е. что

$\displaystyle u^0\left[q+1; q+1,  x^0(q+1)\right]=u^0\left(q+1; k_0, x_0\right).
$

Согласно определению (3.3), $ u^0\bigl[q+1; q+1,  x^0(q+1)\bigr]$ - это первые $ m$ компонент вектора

\begin{displaymath}
u^{0 (q+1)}= \left[
\begin{array}{c}
u^0(q+1) \ [1ex]
u^0(q+2) \ [1ex]
\vdots \ [1ex]
u^0(N-1)
\end{array}\right],
\end{displaymath}

получаемого аналогично 2.9 при $ k_0=q+1,$ где $ u^{0 (q+1)}=$ $ H^{T (q+1)}{\cal D}^+(q+1) c(q+1)$ есть оптимальное программное управление, найденное на $ (q + 1)$-м шаге. По построению $ u^{0 (q+1)}$ является управлением с минимальной нормой среди всех допустимых управлений, приводящих систему из точки $ x^0(q+1)$ в точку $ x(N)=x_1.$ Заметим, что вышеупомянутые допустимые управления существуют; достаточно взять, например, $ u^0(q+1;\
k_0, x_0),\ldots,$ $ u^0(N-1; k_0, x_0)$ - компоненты вектора $ u^{0 (k_0)}$ оптимального программного управления.

В силу предположения индукции $ u^0\bigl[k; k, x^0(k)\bigr]=u^0\left(k;\
k_0, x_0\right)$ при $ k=k_0, k_0+1,\ldots,q ;$ значит, траектории, соответствующие обоим управлениям, до момента $ k=q+1$ совпадают. В момент $ k=q+1$ движения начинаются из одной и той же точки $ x^0(q+1)=Ax^0(q)+Bu^0(q;\
k_0, x_0)=Ax^0(q)+Bu^0\bigl[q; q, x^0(q)\bigr].$ Следовательно, $ u^0\bigl[q+1; q+1,  x^0(q+1)\bigr]$ представляет собой первые $ m$ компонент точного решения с минимальной нормой системы $ H^{(q+1)}u^{(q+1)}=c\left(q+1, 
x^0(q+1)\right).$

Допустим, что $ u^0\left[q+1; q+1,  x^0(q+1)\right]\ne u^0(q+1; k_0, x_0).$ Тогда существуют два различных оптимальных управления с минимальной нормой, переводящие систему (1.1) из $ x_0$ в $ x_1.$ Первое - программное, (2.9):

$\displaystyle u^0\left(k_0; k_0, x_0\right),  u^0\left(k_0+1; k_0, x_0\right), \ldots
$

$\displaystyle \ldots, u^0(q; k_0, x_0), u^0(q+1; k_0, x_0),\ldots, u^0(N-1; k_0, x_0).
$

Второе - с теми же компонентами, что и первое до момента $ k=q$
включительно, далее - с составляющими вектора $ u^{0 (q+1)}:$
$ \underbrace{u^0(k_0;  k_0, x_0), u^0(k_0+1;  k_0, x_0), \ldots, u^0(q; 
k_0, x_0)}_{\mbox{совпадают в силу предположения индукции}},$
$ u^0\left[q+1;  q+1, x^0(q+1)\right],$ $ u^0\left[q+2; q+1,  x^0(q+1)\right],\ldots,$ $ u^0\left[N-1; q+1\right.$, $ \left.x^0(q+1)\right].$ Но данная ситуация невозможна в силу единственности нормального решения системы (2.5), удовлетворяющего условиям $ x(k_0)=x_0, x(N)=x_1.$ Следовательно, управления $ u^0\left[q+1; q+1,  x^0(q+1)\right]$ и $ u^0\left(q+1;
k_0, x_0\right)$ совпадают. Шаг индукции выполняется. Теорема доказана.

З а м е ч а н и е. Если при построении оптимального синтеза момент времени $ k_0$ достаточно близок к $ N$ (для $ k_0>N-n$), то условие 2.1 для заданных $ k_0$ и $ x_0$ может не выполниться. При этом управление 3.4 не приводит систему 1.1 в $ x_1$, и задача 1.2 оказывается неразрешимой. Подробнее эта ситуация обсуждается в § 5.

Используя теорему 3.1, докажем вспомогательное утверждение, полезное при дальнейшем анализе свойств оптимального управления (3.3).

Утверждение 3.1. Пусть выполнено условие $ 2.1.$ Тогда для любого $ k$ такого, что $  k_0\le k\le N-
2,$ справедливо равенство

$\displaystyle c(k+1)={\cal D}(k+1) {\cal D}^+(k) c(k).$ (3.5)

Д о к а з а т е л ь с т в о. Рассмотрим разность

$\displaystyle c(k+1)-c(k)=\left(x_1-A^{N-(k+1)}x^0(k+1)\right)-\left(x_1-A^{N-k}x^0(k)\right)={}
$

$\displaystyle {}=-A^{N-k-1}x^0(k+1)+A^{N-k}x^0(k)=-A^{N-k-1}\bigl(x^0(k+1)-Ax^0(k)\bigr).
$

Поскольку $ x^0(k+1)=Ax^0(k)+Bu^0(k),$ где $ u^0(k)=u^0[k, x]$ - оптимальное управление по принципу обратной связи, получаем

$\displaystyle c(k+1)-c(k)=-A^{N-k-1}Bu^0(k)=-S(k)u^0(k),
$

откуда, учитывая (3.3), находим:

$\displaystyle c(k+1)=c(k)-S(k)S^T(k){\cal D}^+(k) c(k).
$

Согласно утверждению 2.1, $ c(k)=\sum\limits_{i=k}^{N-1}S(i) u^0(i)$ при $ k=k_0,$ $ k_0+1,\ldots, N-1,$ причем, в силу теоремы 3.1, в качестве $ u^0(i)$ можем взять компоненты решения $ u^{0 (k)}$ системы $ H^{(k)}u^{(k)}=c(k).$ Тогда

$\displaystyle c(k)=\sum\limits_{i=k}^{N-1}S(i)\Bigl[S^T(i){\cal D}^+(k) c(k)\Bigr]={}
$

$\displaystyle {}=
\left( \sum\limits_{i=k}^{N-1}S(i) S^T(i)\right) {\cal D}^+(k) c(k)=
{\cal D}(k){\cal D}^+(k) c(k).
$

Значит,

$\displaystyle c(k+1)={\cal D}(k){\cal D}^+(k) c(k)- S(k)S^T(k)
{\cal D}^+(k) c(k)={}
$

$\displaystyle {}=\left({\cal D}(k)-S(k)S^T(k)\right){\cal D}^+(k) c(k).
$

Но, согласно (3.2), $ {\cal D}(k)-S(k)S^T(k)=$ $ \sum\limits_{i=k+1}^{N-1}S(i)S^T(i)=$ $ {\cal
D}(k+1),$ откуда находим

$\displaystyle c(k+1)={\cal D}(k+1){\cal D}^+(k) c(k),
$

что и требовалось доказать.


next up previous
Next: 4 Свойства матриц Up: SAZ Previous: 2 Построение оптимального программного
2003-08-29