next up previous
Next: Bibliography Up: KISELEV Previous: 3 Линейная задача быстродействия


4. Задача минимизации функционала типа "энергия" на траекториях линейных систем при эллипсоидальном геометрическом ограничении на многомерное управление


4.1. Постановка задачи

Рассмотрим задачу оптимального управления

\begin{displaymath}
\left\{
\begin{array}{ll}
\dot x =Ax+u; \quad 0 \le t \le ...
...t \to \min\limits_{u(\cdot)}.
\end{array} \right.
\eqno{(43)}
\end{displaymath}

Здесь $x$ - $n$-мерный фазовый вектор; $u$ - $n$-мерное управление, которое принимает значения из эллипсоидальной области управления $U$, размеры и форма которой определяются симметричной положительно определенной матрицей $M$ порядка $n$; $x_0 \ne 0$ - заданное начальное состояние управляемого объекта; $T>0 $ - заданная длительность процесса управления, подчиненная неравенству

\begin{displaymath}
T > T_{op} (x_0),
\eqno{(44)}
\end{displaymath}

где $T_{op} (x_0)$ - время быстродействия рассматриваемой управляемой системы из начального состояния $x_0$ в начало координат.

Требуется найти: оптимальное управление $u_{op}(t),0 \le t \le T,$ оптимальную траекторию $x_{op}(t),0 \le t \le T,$ и оптимальное значение функционала $L_{op}$. Для решения задачи (43) применяется принцип максимума Понтрягина.

4.2. Краевая задача принципа максимума Понтрягина

Выпишем функцию Гамильтона-Понтрягина и положим $\psi_0=-1$:

\begin{displaymath}
K=-\frac{1}{2} \Vert u \Vert^2 + (\psi, Ax+u).
\end{displaymath}

Из условия максимума

\begin{displaymath}
K \ \to \max_{u \in U}
\end{displaymath}

найдем экстремальное управление (максимизатор функции $K$ по аргументу $u$ на множестве $U$)

\begin{displaymath}
u_*(\psi)=\mbox{arg} \, \max_{u \in U} K, \quad \psi \in {\mathbb{R}}^n.
\eqno{(45)}
\end{displaymath}

Нам необходимо более подробное изучение функции (45). Рассматривая вспомогательную задачу безусловной максимизации функции $K$

\begin{displaymath}
K \ \to \max_{u \in {\mathbb{R}}^n},
\end{displaymath}

найдем ее решение (максимизатор функции $K$ по аргументу $u$ на всем пространстве)

\begin{displaymath}
\bar u_*(\psi) =\mbox{arg} \, \max_{u \in {\mathbb{R}}^n} \equiv \psi,
\end{displaymath}

привлекая уравнение $
K'_u \equiv -u+\psi =0.
$ Этот же результат становится очевидным, если представить функцию $K$ в форме

\begin{displaymath}
K=-\frac{1}{2} \Vert u- \psi \Vert^2 +\frac{1}{2} \Vert \psi \Vert^2 + (\psi,Ax).
\eqno{(46)}
\end{displaymath}

Поэтому

\begin{displaymath}
u_*(\psi) = \bar u_*(\psi) =\psi, \quad \mbox{если} \quad \psi \in U,
\end{displaymath}


\begin{displaymath}
u_*(\psi)= \pi(\bar u_*(\psi))=\pi (\psi) \ne \psi,
\quad \mbox{если} \quad \psi \notin U,
\end{displaymath}

где $\pi(\psi)$ - проекция внешней по отношению к множеству $U$ точки $\psi$ на это множество $U$. Это утверждение вытекает из того, что поверхностями уровня функции $K$ (в пространстве аргумента $u$) являются сферы $\Vert u - \psi \Vert=const$ с центром в точке $\psi$, см. (46). Напомним, что под проекцией точки на множество понимается точка множества, наименее удаленная от проектируемой точки. Таким образом,

\begin{displaymath}
u_* (\psi) =\pi (\psi) \quad \forall \psi \in {\mathbb{R}}^n,
\end{displaymath}

причем

\begin{displaymath}
u_*(\psi)=\left\{
\begin{array}{ll}
\psi, \qquad & \mbox{е...
... \quad & \mbox{если} \quad \psi \notin U.
\end{array} \right.
\end{displaymath}

Функция $ u_*(\cdot): {\mathbb{R}}^n \mapsto U $ из (45) определена и непрерывна на всем пространстве ${\mathbb{R}}^n$ и является гладкой на ${\mathbb{R}}^n \setminus \partial U.$ На границе $\partial U \equiv \{u: u^* Mu=1 \}$ области управления $U$ гладкость этой функции нарушается. Привлекая экстремальное управление (45), запишем краевую задачу принципа максимума для задачи оптимального управления (43):

\begin{displaymath}
\left\{
\begin{array}{ll}
\dot x =Ax + u_*(\psi),\quad & x\v...
...si =-A^* \psi, & 0 \le t \le T.
\end{array}\right.
\eqno{(47)}
\end{displaymath}

Эта краевая задача нелинейна, поскольку нелинейна функция (45), описывающая экстремальное управление. Алгоритм вычисления этой функции описан в следующем подразделе.

4.3. Вычисление проекции на эллипсоид

Рассмотрим задачу вычисления проекции $\pi(\psi)$ точки $\psi$ на эллипсоид $U$ (п. 4.1). Если $\psi \in U$, то $\pi(\psi)=\psi$. Поэтому ниже рассматривается основной случай

\begin{displaymath}
\psi \notin U \quad \Longleftrightarrow \quad \psi^* M \psi -1 >0.
\eqno{(48)}
\end{displaymath}

Так как вектор

\begin{displaymath}
(u^* M u)'_u =2Mu, \quad u \in \partial U,
\end{displaymath}

определяет внешнюю нормаль к $\partial U$ в точке $u \in \partial U$ и $
\pi(\psi) \in \partial U,
$ то имеет место равенство

\begin{displaymath}
\psi = \pi(\psi) + \lambda M \pi(\psi) \eqno{(49)}
\end{displaymath}

при некотором положительном числе $\lambda$. Отсюда следует, что

\begin{displaymath}
\pi(\psi) = ( I + \lambda M )^{-1} \psi, \eqno{(50)}
\end{displaymath}

где $I$ - единичная матрица. Условие принадлежности точки (50) границе эллипсоида $U$ приводит к следующему уравнению для вычисления параметра $\lambda$:

\begin{displaymath}
G(\lambda, \psi)=0. \eqno{(51)}
\end{displaymath}

Здесь

\begin{displaymath}
G(\lambda,\psi) \equiv
\hat \eta(\lambda,\psi)^* \ M \ \hat \eta (\lambda,\psi) -1,
\eqno{(52)}
\end{displaymath}


\begin{displaymath}
\hat \eta(\lambda,\psi) \equiv (I+\lambda M )^{-1} \psi. \eqno{(53)}
\end{displaymath}

Функция (52) обладает следующими свойствами:

\begin{displaymath}
\begin{array}{l}
G(\lambda,\psi)\vert _{\lambda=0}=\psi^* M...
...bda \lambda}(\lambda,\psi)>0, \quad \lambda \ge 0.
\end{array}\end{displaymath}

Поэтому уравнение (51) имеет единственный положительный корень

\begin{displaymath}
\lambda_*(\psi)>0, \qquad \psi \notin U.
\end{displaymath}

Этот корень может быть вычислен с помощью итерационного процесса Ньютона

\begin{displaymath}
\left\{
\begin{array}{l}
\displaystyle \lambda_{k+1}=\lambd...
...*(\psi)>0, \quad k \to \infty.
\end{array}\right.
\eqno{(54)}
\end{displaymath}

Таким образом, имеет место следующее утверждение.

Теорема 1. Если $\psi \notin U$, то проекция $\pi(\psi)$ точки $\psi$ на эллипсоид $U$ допускает представление

\begin{displaymath}
\pi (\psi) =( I + \lambda _*(\psi) M )^{-1} \psi, \eqno{(55)}
\end{displaymath}

где $\lambda_*(\psi)$ - единственный положительный корень уравнения $(51)$, который может быть вычислен итерационным процессом $(54)$.

З а м е ч а н и е 1. Доопределим функцию $\lambda_*(\psi)$ на все пространство, полагая

\begin{displaymath}
\lambda_*(\psi)=0 \quad \mbox{при} \quad \psi \in U.
\end{displaymath}

Теперь функция $\lambda_*(\cdot): {\mathbb{R}}^n \mapsto {\mathbb{R}}^1_+$ определена и непрерывна во всем пространстве, а ее градиент $\lambda'_*(\psi)$ имеет конечный скачок на границе эллипсоида $U$. Таким образом, при любом векторе $\psi \in {\mathbb{R}}^n$ проекция $\pi(\psi)$ допускает представление (55). Исследованное выше экстремальное управление $
u_*(\psi)=\pi(\psi)
$ можно рассматривать как многомерный аналог, связанный с эллипсоидом $U$, функции насыщения (18), с помощью которой записывалось экстремальное управление в задаче (1а).

З а м е ч а н и е 2. В работе [14] рассмотрена нелинейная версия метода Ньютона для вычисления проекции на эллипсоид на основе дробно-рациональной аппроксимации функции $G$. Эта версия имеет ряд преимуществ перед классической схемой (54). Сравнение различных вычислительных схем для поиска проекции можно найти в работе [15].

4.4. Решение краевой задачи. Экстремальное описание неизвестного начального значения сопряженной переменной. Потенциал задачи (43)

Введем обозначение $
\psi \vert _{t=0}=p \in {\mathbb{R}}^n
$ для начального значения сопряженной переменной. Решить краевую задачу (3) - значит, найти такой вектор $p=p_0$, который позволяет свести задачу к решению задач Коши, а задачу Коши можно рассматривать как стандартную вычислительную задачу. Для параметра $p=p_0$ будет установлено экстремальное описание

\begin{displaymath}
p_0=\mbox{arg} \! \min_{p \in {\mathbb{R}}^n} \ V(p), \eqno{(56)}
\end{displaymath}

где $V(p)$ - гладкая выпуклая функция, которую будем называть потенциалом задачи (43). Функция $V(p)$, которая ниже будет описана конструктивно, строится по исходным данным задачи (43). Таким образом, разрешающий параметр $p_0$ является минимизатором в задаче безусловной выпуклой минимизации

\begin{displaymath}
V(p) \to \min_{p \in {\mathbb{R}}^n}. \eqno{(57)}
\end{displaymath}

Задача (57) является одной из простейших задач математического программирования, для решения которой можно пользоваться широким спектром методов конечномерной безусловной оптимизации.

В результате этих рассуждений мы видим, что применение принципа максимума Понтрягина к задаче оптимального управления (43) сводит проблему построения оптимального управления (функции) к конечномерной задаче минимизации (57) для отыскания параметра $p_0 \in {\mathbb{R}}^n.$ Обратимся сейчас к построению потенциала задачи (43).

Задача Коши для сопряженного уравнения $
\dot \psi =-A^* \psi,\quad \psi \vert _{t=0}=p,
$ имеет решение $
\psi(t,p)=e^{-t A^*}p.
$ Подстановка этого решения в первое уравнение задачи (47) приводит, вместе с ее начальным условием, к следующей задаче Коши

\begin{displaymath}
\dot x = Ax + u_*(\psi(t,p)),\quad x \vert _{t=0}=x_0.
\end{displaymath}

Решение этой задачи, линейной по $x$, запишем, используя формулу Коши:

\begin{displaymath}
x(t,p)= e^{tA} \left( x_0 + \int\limits_0^t e^{-sA} \ u_*(\psi(s,p)) \, ds \right).
\eqno{(58)}
\end{displaymath}

Требование, чтобы последняя функция удовлетворяла второму краевому условию задачи (47), приводит к следующему векторному уравнению для определения неизвестного вектора $p$:

\begin{displaymath}
x(t,p)\vert _{t=T}=0. \eqno{(59)}
\end{displaymath}

Уравнение (59), в силу (58), равносильно следующему уравнению, имеющему градиентную форму:

\begin{displaymath}
V'(p) \equiv x_0 + \int\limits_0^T e^{-sA} \ u_* \left( e^{-sA^*}p \right) \, ds =0.
\eqno{(60)}
\end{displaymath}

Утверждение о градиентной форме уравнения (60) является следствием градиентного свойства экстремального управления $u_*(\psi)$.

Теорема 2. Существует единственная гладкая выпуклая функция

\begin{displaymath}
U_*(\cdot): {\mathbb{R}}^n \mapsto {\mathbb{R}}^1, \quad U_*(0)=0,
\eqno{(61)}
\end{displaymath}

с непрерывным градиентом

\begin{displaymath}
U'_*(\psi) = u_*(\psi) \quad \forall \ \psi \in {\mathbb{R}}^n.
\eqno{(62)}
\end{displaymath}

Функция $(61), \ (62)$ определяется следующей формулой

\begin{displaymath}
U_*(\psi)=(\pi(\psi),\psi) - \frac{1}{2} \Vert \pi(\psi) \Vert^2, \eqno{(63)}
\end{displaymath}

где $\pi(\psi)$ - проекция точки $\psi$ на эллипсоид $U$.

Д о к а з а т е л ь с т в о. Тот факт, что (63) влечет (61), (62) установлен в [16, леммы 4.2-4.4]. Теперь докажем обратное утврждение.

При $\psi \in U$ справедливы равенства $u_* (\psi) = \pi (\psi) = \psi$ (см. (46)). Отсюда показывается, что единственной функцией, удовлетворяющей условиям (61), (62) при $\psi \in U$, будет функция

\begin{displaymath}
U_*(\psi)=\frac{1}{2} \Vert\psi\Vert^2.
\end{displaymath}

Пусть теперь $\psi \notin U$. Заметим, что на луче

\begin{displaymath}
L(\psi) \equiv \{y \in {\mathbb{R}}^n: y=\pi(\psi) +
\lambda [\psi - \pi(\psi) ],\ \lambda \ge 0 \}, \quad \psi \notin U,
\end{displaymath}

проекция сохраняет постоянное значение:

\begin{displaymath}
\pi(y)=\pi(\psi) \quad \forall y \in L(\psi). \eqno{(64)}
\end{displaymath}

Запишем $U_*(\psi)$ в форме

\begin{displaymath}
U_*(\psi)=[ U_*(\psi) -U_*(\pi(\psi)) ] + U_*(\pi(\psi)). \eqno{(65)}
\end{displaymath}

Последний член в (65) в силу включения $\pi(\psi) \in U$ может быть представлен в виде

\begin{displaymath}
U_*(\pi(\psi))=\frac{1}{2} \Vert \pi(\psi) \Vert^2. \eqno{(66)}
\end{displaymath}

Остается вычислить приращение

\begin{displaymath}
U_*(\psi) - U_*(\pi(\psi))
\end{displaymath}

функции (61) на луче $L(\psi)$.
Привлекая (64), (62), получаем:

\begin{displaymath}
\begin{array}{l}
U_*(\psi) - U_*(\pi(\psi))
\displaystyle =U...
...(\psi))=
(\pi(\psi),\psi) -\Vert \pi(\psi) \Vert^2.
\end{array}\end{displaymath}

Последнее соотношение вместе с (65), (66) приводит к выражению (63). Таким образом,

\begin{displaymath}
U_*(\psi)=\left\{
\begin{array}{ll}
\displaystyle \frac{1}{...
...
\quad & \mbox{если} \quad \psi \notin U.
\end{array} \right.
\end{displaymath}

Выпуклость этой функции проверяется следующей выкладкой:

\begin{displaymath}
\begin{array}{l}
[\psi - \chi]^* [U_*'(\psi) - U_*'(\chi)] ...
...-u_*(\chi)] +
\chi^* [u_*(\chi)- u_*(\psi)] \ge 0;
\end{array}\end{displaymath}

(детали можно восстановить, обратившись к доказательству следующей ниже теоремы 3). Теорема 2 доказана.

Лемма. Справедливы утверждения:

(a) $ U_*(\psi) -\sqrt{\psi^* M^{-1} \psi} \to 0 \quad
\mbox{при} \quad \Vert \psi \Vert \to \infty;$

(b) существует положительное число $C$ такое, что

\begin{displaymath}
\vert U_*(\psi) - \sqrt{\psi^* M^{-1} \psi } \vert \le C \quad \forall \psi
\in R^n;
\end{displaymath}

(c) имеет место следующее неравенство

\begin{displaymath}
\vert R(p) \vert \le CT \quad \forall p \in R^n, \eqno{(67)}
\end{displaymath}

где

\begin{displaymath}
R(p) = \int\limits_0^T \left[\ U_* (\psi) - \sqrt{\psi^* M^{-1} \psi} \
\right]_{\psi = \psi (s,p)} \, ds.
\end{displaymath}

Д о к а з а т е л ь с т в о. В силу (55) можно записать равенство

\begin{displaymath}
( \pi (\psi ), \psi ) = \Vert \pi (\psi) \Vert^2 + \lambda_* (\psi) \
\pi^* (\psi) M \pi (\psi).
\eqno{(68)}
\end{displaymath}

Далее считаем $ \psi \notin U,$ тогда $\pi^* (\psi) M \pi (\psi)=1$ и, в силу (68), получаем

\begin{displaymath}
( \pi (\psi ), \psi ) = \lambda_* (\psi) + \Vert \pi (\psi) \Vert^2 ,
\eqno{(69)}
\end{displaymath}

причем проекция $\pi(\psi) \in U$ ограничена. По геометрическим соображениям,

\begin{displaymath}( \pi (\psi ), \psi ) \to \infty, \mbox{ поэтому }
\ \ \lambd...
...uad \mbox{ при}
\quad \Vert \psi \Vert \to \infty.
\eqno{(70)}
\end{displaymath}

Привлекая (55), имеем

\begin{displaymath}
\begin{array}{l}
{ \psi^* M^{-1} \psi }
= { \pi (\psi)^* [I+...
... (\psi) - \Vert \pi (\psi) \Vert^4
]
}.
\end{array}\eqno{(71)}
\end{displaymath}

Из (63), (69), (70), считая по-прежнему $\psi \notin U$ , имеем

\begin{displaymath}
U_* (\psi) - \sqrt{ \psi^* M^{-1} \psi } =
\end{displaymath}


\begin{displaymath}-
{\displaystyle {\pi^* (\psi) M^{-1} \pi (\psi) - \Vert \pi ...
...\pi^* (\psi) M^{-1} \pi (\psi) - \Vert \pi (\psi) \Vert^4]}}}
-\end{displaymath}


\begin{displaymath}
-\frac{1}{2} \Vert \pi (\psi) \Vert^2.\eqno{(72)}
\end{displaymath}

Отсюда, в силу ограниченности проекции $\pi(\psi)$ и предельного соотношения (70), следует (a). Тогда из непрерывности функции $U_*(\psi) - \sqrt{\psi^* M^{-1} \psi}$ следует ограниченность этой функции во всем пространстве, т.е. имеет место (b), а следовательно, и (c).

Теорема 3. Потенциал задачи $(43)$ имеет вид

\begin{displaymath}
V(p)=p^* x_0 + \int\limits_0^T U_* \left( e^{-sA^*} p \right) \, ds,
\eqno{(73)}
\end{displaymath}

где функция $U_*(\psi)$ - потенциал экстремального управления $u_*(\psi)$ $($см. $(62)$$)$ - описана в теореме $2$. Функция $V$ выпукла и неогpаниченно растет при $\Vert p\Vert\to\infty$ $($см. (73)).

Д о к а з а т е л ь с т в о. Функция (73)

\begin{displaymath}
V(p)=p^*x_0 + \int\limits_0^T U_*(\psi) \left\vert _{\psi=\psi(s,p)} \right. \, ds
\end{displaymath}

имеет непрерывный градиент $V'(p)$ (см. (60))

\begin{displaymath}
V'(p)= x_0 + \int\limits_0^T e^{-sA} u_* (\psi) \left\vert _{\psi (s,p)}\right. \, ds.
\eqno{(74)}
\end{displaymath}

Нужно доказать выпуклость функции $V(p)$ и свойство

\begin{displaymath}
V(p) \to + \infty \quad \mbox{при } \quad \Vert p \Vert \to \infty.
\eqno{(75)}
\end{displaymath}

Выпуклость функции $V(p)$ следует из неравенства

\begin{displaymath}[q-p]^* [V'(q) - V'(p)] \ge 0 \quad \forall p,q \in {\mathbb{R}}^n.
\eqno{(76)}
\end{displaymath}

Действительно, из условия максимума для экстремального управления (45) следует неравенство

\begin{displaymath}
K(x,\psi,u_* (\psi) ) \ge K(x, \psi, v ) \quad \forall \psi \in {\mathbb{R}}^n,
\forall v \in U,
\end{displaymath}

которое запишем в форме

\begin{displaymath}
\psi^* [u_*(\psi) -v] \ge \frac{1}{2} \Vert u_*(\psi) \Vert^2 -
\frac{1}{2} \Vert v \Vert^2 \quad \forall v
\in U.
\end{displaymath}

Полагая в последнем неравенстве сначала

\begin{displaymath}
\psi = \psi(s,q), \quad v=u_*( \psi(s,p) ),
\end{displaymath}

затем

\begin{displaymath}
\psi = \psi(s,p), \quad v=u_*( \psi(s,q) ),
\end{displaymath}

и складывая полученные неравенства, находим:

\begin{displaymath}
\begin{array}{l}
\psi (s,q)^* [u_*( \psi(s,q) ) - u_* ( \ps...
...0
\quad \forall p,q \in {\mathbb{R}}^n.
\end{array}\eqno{(77)}
\end{displaymath}

Далее, привлекая (74) и (77), имеем

\begin{displaymath}
\begin{array}{l}
[q-p]^* [V'(q) -V'(p)]= \\ [2ex]
\displayst...
...,p) ) - u_* ( \psi (s,q) ) ] \right\}
\, ds \ge 0.
\end{array}\end{displaymath}

Неравенство (76) доказано, и, тем самым, выпуклость функции $V(p)$ проверена.

Докажем теперь (75). Предположение (44) влечет утверждение:

\begin{displaymath}
\exists\, r >0: \quad p^* x_0 + \int\limits_0^T c(U, \psi (s...
... \Vert p \Vert \quad \forall p \in {\mathbb{R}}^n,
\eqno{(78)}
\end{displaymath}

где $c(U,\psi)= \sqrt{\psi^* M^{-1 } \psi } $ - опорная функция эллипсоида $U$, см. (43). Привлекая (78), запишем для функции (73) оценку снизу

\begin{displaymath}
V(p) \ge r \Vert p \Vert + R(p) \quad \forall p \in {\mathbb{R}}^n,
\eqno{(79)}
\end{displaymath}

Для завершения доказательства заметим, что из неравенств (79) и (67) следует

\begin{displaymath}
V(p) \ge r \Vert p \Vert - CT \quad \forall p \in R^n,
\end{displaymath}

что влечет за собой соотношение (75). Теорема 3 доказана. 2

В заключение отметим следующую формулу для функции (63):

\begin{displaymath}
\begin{array}{l}
\displaystyle U_* (\psi) = \lambda_* (\psi)...
...i) \Vert^2, & \psi \not \in U.
\end{array} \right.
\end{array}\end{displaymath}





Поступила 17.02.1998



next up previous
Next: Bibliography Up: KISELEV Previous: 3 Линейная задача быстродействия
2003-08-11