next up previous
Next: 3 Линейная задача быстродействия Up: KISELEV Previous: 1 Введение

Subsections

2. Минимизация функционала типа "обобщенная энергия" на траекториях линейной управляемой системы

В этом разделе на примере данной простой задачи описывается схема потенциалов; в п.п. 2.1, 2.2 рассмотрены случаи неограниченного и ограниченного управления соответственно.

2.1. Задача без геометрических ограничений на управление

Рассмотрим задачу управления в ${\mathbb{R}}^n$ на заданном отрезке времени $[0,T]$

\begin{displaymath}
\left\{
\begin{array}{l}
\dot x=Ax+bu, \quad 0 \le t \le T; ...
...quad \to \min\limits_{u(\cdot)}.
\end{array}\right.
\eqno{(1)}
\end{displaymath}

Здесь $x$ - вектор фазовых координат, $u$ - скалярное управление. Матрица $A \in{\mathbb{R}}^{n \times n}$, столбец $b \in {\mathbb{R}}^n$, начальное состояние $x_0 \in {\mathbb{R}}^n$, длительность процесса управления $T>0 $ и параметр $\alpha \in (1,+ \infty)$ заданы.

Задача минимизации функционала $J_{\alpha}(u)$ равносильна задаче минимизации нормы

\begin{displaymath}\left( \int\limits_0^T \vert u(t)\vert^{\alpha})\, dt \right)^{1/ \alpha} =
\Vert u\Vert _{L_{\alpha}}. \end{displaymath}

Предполагается выполненным условие управляемости

\begin{displaymath}
\det(b,Ab,\dots,A^{n-1}b) \ne 0.
\eqno{(2)}
\end{displaymath}

Поиск оптимального решения задачи (1) требует решения краевой задачи принципа максимума Понтрягина

\begin{displaymath}
\left\{
\begin{array}{ll}
\dot x =Ax+b \ u_*(\psi), & x(0)=x...
...psi =-A^* \psi, & 0 \le t \le T,
\end{array}\right.
\eqno{(3)}
\end{displaymath}

в которой $u_*(\psi)$ - экстремальное управление, определяемое из условия максимума $K \to \max\limits_{ u \in {\mathbb{R}}^1}$ для функции Гамильтона-Понтрягина

\begin{displaymath}
K= -\frac{1}{\alpha} \vert u\vert^{\alpha} +(\psi,Ax+bu).
\end{displaymath}

Это экстремальное управление имеет вид

\begin{displaymath}
u_*(\psi) = h_{\alpha} ( b^* \psi ),
\eqno{(4)}
\end{displaymath}


\begin{displaymath}
h_{\alpha}( \theta) =\vert \theta \vert^{\frac{1}{\alpha -1...
...ox{sign} (\theta),
\quad \theta \in {\mathbb{R}}^1.
\eqno{(5)}
\end{displaymath}

При решении краевой задачи (3) подлежит определению параметр $p$, являющийся начальным значением сопряженной переменной $\psi$:

\begin{displaymath}
\psi \vert _{t=0} =p \in {\mathbb{R}}^n.
\end{displaymath}

Искомое значение $p=p_0$, позволяющее решить краевую задачу (3), допускает экстремальное описание, к которому мы обратимся ниже (см. (11)).

После нахождения вектора $p_0$ краевая задача (3) сводится к решению задачи Коши для дифференциальных уравнений из (3) с начальными условиями

\begin{displaymath}
x\vert _{t=0} = x_0, \quad \psi \vert _{t=0} = p_0.
\end{displaymath}

Решение

\begin{displaymath}
x(t,p_0),\quad \psi(t,p_0), \qquad 0 \le t \le T
\eqno{(6)}
\end{displaymath}

этой задачи дает решение краевой задачи (3). Оптимальное управление $u_{op}(t)$ задачи (1) получаем подстановкой сопряженной переменной из (6) в формулу (4) для экстремального управления:

\begin{displaymath}
u_{op}(t) = h_{\alpha} (b^* \psi)\vert _{\psi=\psi(t,p_0)}; \quad 0 \le t \le T,
\qquad \psi (t,p_0) = e^{-t A^*} p_0.
\end{displaymath}

Оптимальная траектория $x_{op}(t)$ совпадает с первой компонентой реше-
ния (6):

\begin{displaymath}
x_{op}(t) = x(t,p_0), \quad 0 \le t \le T.
\end{displaymath}

Оптимальное значение функционала $J_{\alpha}$ равно

\begin{displaymath}
\min J_{\alpha} = \int\limits_0^T \vert b^* e^{-tA^*} p_0 \vert^{\beta} \, dt,
\quad \beta = \frac{ \alpha }{\alpha -1}.
\end{displaymath}

Неизвестное начальное значение сопряженной переменной определяется векторным уравнением

\begin{displaymath}x(T,p)=0. \eqno{(7)} \end{displaymath}

Уравнение (7) после умножения слева на невырожденную матрицу $e^{-TA}$ приобретает градиентную форму

\begin{displaymath}
V'(p) \equiv x_0 + \int\limits_0^T e^{-s A}b \
h_{\alpha} \left( b^* e^{-s A^* } p \right) \, ds = 0
\eqno{(8)} \end{displaymath}

с потенциалом

\begin{displaymath}
V(p) = p^*x + \int\limits_0^T H_{\alpha} \left( b^*e^{-sA^*}p \right) \, ds,
\eqno{(9)} \end{displaymath}

где

\begin{displaymath}
H_{\alpha} (t) =\int\limits_0^t h_{\alpha}(\theta) \, d \th...
...y, \quad
\frac{1}{ \alpha} + \frac{1}{ \beta} =1.
\eqno{(10)}
\end{displaymath}

Функция $V(p)$ непрерывна и выпукла в ${\mathbb{R}}^n$, имеет там непрерывный градиент $V'(p)$ (см. (8)), причем

\begin{displaymath}
V(p) \to + \infty \quad \mbox{при} \quad \Vert p\Vert \to \infty. \eqno{}
\end{displaymath}

Поэтому существует минимизатор потенциала (9)

\begin{displaymath}
p_0= \mbox{arg} \min_{p \in {\mathbb{R}}^n} \, V(p),
\eqno{(11)}
\end{displaymath}

который является решением уравнения (8). Единственность решения уравнения (8) является следствием свойства монотонности отображения $V'(p)$:

\begin{displaymath}[q-p]^* [V'(q)-V'(p)] >0 \qquad \forall p,q \in {\mathbb{R}}^n,\ \ p \ne q.
\eqno{(12)} \end{displaymath}

Неравенство (12) легко установить, опираясь на представление (8) градиента $V'(p)$, условие (2) и строгое возрастание функции (5).

Таким образом, для начального значения $p_0$ сопряженной переменной установлена единственность и получено экстремальное описание (11). Для вычисления $p_0$ следует решить выпуклую задачу безусловной минимизации

\begin{displaymath}
V(p) \to \min_{p \in {\mathbb{R}}^n}. \eqno{(13)}
\end{displaymath}

П р и м е р 1. При $ \alpha =2$ ( $J_{\alpha}$ - функционал типа "энергия") имеем

\begin{displaymath}
\beta =2,\quad h_{\alpha}(\theta)=\theta, \quad
H_{\alpha}(t)={t^2 \over 2}, \quad u_* (\psi)=b^* \psi,
\end{displaymath}


\begin{displaymath}
V(p) = \frac{1}{2} p^* Mp + p^*x_0, \quad \ V'(p) = Mp+x_0,
\quad \ V''(p) = M,
\quad p_0 = -M^{-1}x_0;
\end{displaymath}

здесь

\begin{displaymath}
M=\int\limits_0^T e^{-sA} b \ b^* e^{-sA^*} \, ds
\end{displaymath}

- матрица управляемости, симметричная и, при условии (2), положительно определенная.

П р и м е р 2. При $\alpha =1 + \frac{1}{2m+1}, \ m=0,1,2,\dots,$ имеем

\begin{displaymath}
\beta=2m+2,\quad h_{\alpha}(\theta)=\theta^{2m+1}, \quad
H_{...
...(t)=\frac{t^{2m+2}}{2m+2}, \quad u_* (\psi) =(b^*\psi)^{2m+1},
\end{displaymath}


\begin{displaymath}
V(p)= p^* x_0 + (2m+2)^{-1}
\int\limits_0^T e^{-sA} b \ b^* e^{-sA^*} \
\left( b^* e^{-sA^*} p \right)^{2m+2} \, ds,
\end{displaymath}


\begin{displaymath}
V'(p)= x_0 + \int\limits_0^T e^{-sA} b \
\left( b^* e^{-sA^*} p \right)^{2m+1} \, ds,
\end{displaymath}


\begin{displaymath}
V''(p)=(2m+1) \int\limits_0^T e^{-sA} b \ b^* e^{-sA^*}\
\left( b^* e^{-sA^*} p \right)^{2m} \, ds.
\end{displaymath}

Матрица $V''(p)$ при $p \ne 0$ является положительно определенной. При больших значениях $m$ параметр $ \alpha >1$ близок к единице и функционал $J_{\alpha}(u)$ аппроксимирует функционал типа "расход топлива" $
\displaystyle \int_0^T \vert u(t)\vert \, dt = \Vert u\Vert _{L_1}.
$

П р и м е р 3. При $\alpha = 2m+2, \ m=0,1,2,\dots,$ имеем

\begin{displaymath}
\beta=\frac{2m+2}{2m+1}, \quad
h_{\alpha}(\theta) = \vert\th...
...ha}(t) = \frac{2m+1}{2m+2} \ \vert t\vert^{\frac{2m+2}{2m+1}}.
\end{displaymath}

Для больших значений $m$ задача минимизации функционала $J_{\alpha} (u)^{{1}/{\alpha}}$ аппроксимирует задачу минимизации нормы $\Vert u\Vert _{L_{\infty}}.$

2.2. Задача с ограниченным управлением

Рассмотрим теперь задачу управления (1) при ограниченном скалярном управлении $u$, подчиненном ограничению

\begin{displaymath}
\vert u\vert \le 1. \eqno{(14)}
\end{displaymath}

Кроме того, при исследовании новой задачи предполагаются выполненными условие (2) (которое обеспечивает локальную управляемость объекта в начале координат), и следующее дополнительное условие на длительность процесса управления

\begin{displaymath}
T > T_{op}(x_0), \eqno{(15)}
\end{displaymath}

где $T_{op} (x_0)$ - время быстродействия для новой управляемой системы.

В последующем мы будем называть новую задачу задачей (1а).

Для задачи (1а) краевая задача принципа максимума Понтрягина записывается в форме (3), где экстремальное управление $u_*(\psi)$, определяемое из условия максимума $K \to \max\limits_{\vert u\vert \le 1},\ $ имеет вид

\begin{displaymath}
u_*( \psi) = \bar h_{\alpha}(b^* \psi), \eqno{(16)}
\end{displaymath}


\begin{displaymath}
\bar h_{\alpha}(\theta)=\mbox{sat} (h_{\alpha}(\theta)) =
h_{\alpha}( \mbox{sat} (\theta)),
\eqno{(17)}
\end{displaymath}


\begin{displaymath}
\mbox{sat} (s)=
\left\{
\begin{array}{ll}
s, & \vert s\ve...
...gn} {(s)}, & \vert s\vert > 1.
\end{array}\right.
\eqno{(18)}
\end{displaymath}

Здесь sat$(s)$ - функция насыщения, а скалярная функция $h_{\alpha}(\theta)$ имеет
вид (5).

Искомое начальное значение сопряженной переменной, с помощью которого разрешается краевая задача (3), (16)-(18), определяется векторным уравнением

\begin{displaymath}
W'(p) \equiv
x_0 + \int\limits_0^T e^{-sA} b \
\bar h_{\alpha} \left( b^*e^{-sA^*} p \right) \, ds =0,
\eqno{(19)}
\end{displaymath}

имеющим градиентную форму, причем

\begin{displaymath}
W(p)= p^* x_0+\int\limits_0^T\bar H_{\alpha}\left( b^* e^{-sA^*} p \right)
\,ds,\eqno{(20)}
\end{displaymath}


\begin{displaymath}
\bar H_{\alpha}(t) = \int\limits_0^t \bar h_{\alpha}(\theta) \, d \theta.
\eqno{(21)}
\end{displaymath}

Функция $W(p),$ непрерывная вместе с градиентом $W'(p)$ и выпуклая в ${\mathbb{R}}^n,$ удовлетворяет условию роста

\begin{displaymath}
W(p) \to + \infty \quad \mbox{при} \quad \Vert p\Vert \to \infty.
\eqno{(22)}
\end{displaymath}

(При обосновании соотношения (22) существенно используются предположения (2) и (15)). Поэтому существует минимизирующая точка потенциала (20)

\begin{displaymath}
p_0 = \mbox{arg} \ \min_{p \in {\mathbb{R}}^n}\ W(p).
\eqno{(23)}
\end{displaymath}

В отличие от п. 2.1, здесь единственность минимизирующей точки имеет место не всегда. Точка (23), решающая выпуклую задачу безусловной минимизации

\begin{displaymath}
W(p) \to \min_{p \in {\mathbb{R}}^n}, \eqno{(24)}
\end{displaymath}

является также решением уравнения (19) и это позволяет решить краевую задачу (3), (16)-(18). Оптимальное управление $u_{op}(t)$ задачи (1а) определяется равенством

\begin{displaymath}
u_{op} (t) =u_* (\psi)\vert _{\psi = \psi (t, p_0)}, \quad 0 \le t \le T,
\end{displaymath}

где $u_*(\psi)$ - экстремальное управление (16), $\psi(t,p_0)=e^{-sA^*}p_0$ - сопряженная переменная, начальным значением которой служит минимизирующая точка (23).

П р и м е р 4. При $ \alpha =2$ (функционал типа "энергия", см. [13]) имеем

\begin{displaymath}
\beta=2, \ \bar h_{\alpha}(\theta) = \mbox{sat} (\theta), \...
...nd{array} \right. \\
\quad u_*(\psi) = \mbox{sat} (b^* \psi),
\end{displaymath}


\begin{displaymath}
V(p)=p^* x_0 + \int\limits_0^T \bar H_{\alpha}
\left( b^* e...
..._0^T e^{-sA} b \ \mbox{sat}
\left( b^* e^{-sA^*} p \right) ds.
\end{displaymath}

Обоснование свойства (22) при $ \alpha =2$ имеется в [13]; аналогичные построения позволяют установить (22) при любых $ \alpha \in (1, + \infty ).$

П р и м е р 5. В случае $\alpha =1 + \frac{1}{2m+1}, \ m=0,1,2,\dots,$ имеем

\begin{displaymath}
\beta =2m+2,\ \ \ \ \bar h_{\alpha}(\theta) = \mbox{sat}^{2m+1}(\theta),
\end{displaymath}


\begin{displaymath}
\bar H_{\alpha} (t)= \left\{
\begin{array}{ll}
\displaysty...
...(2m+1) \over (2m+2)}, & \vert t\vert > 1.
\end{array} \right.
\end{displaymath}

Приведенные выше результаты позволяют построить вычислительные схемы для решения задач (1) и (1а); в этих схемах центральная роль принадлежит решению выпуклой задачи безусловной минимизации потенциала ((13) или (24)) - простейшей задаче математического программирования. Для решения таких задач можно рекомендовать квазиньютоновские методы [12]. После нахождения минимизатора $p_0$ остается решить задачу Коши.


next up previous
Next: 3 Линейная задача быстродействия Up: KISELEV Previous: 1 Введение
2003-08-11