next up previous
Next: 3 Постановка задачи Up: SHOR Previous: 1 Введение

2 Описание задачи

На заданном целочисленном промежутке времени  $ \overline{0,\rm T}=
\{0,1,\cdots, $ $ \rm T\}~(\rm T>0) $ рассматривается многошаговая динамическая система, которая состоит из двух управляемых объектов - объекта $ I $ (управляемого преследователем $ P $) и объекта $ II $ (управляемого уклоняющимся $ E $). Движение объекта $ I $ описывается линейным дискретным рекуррентным векторным уравнением

\begin{displaymath}
y(t+1)=A(t)y(t)+B(t)u(t)
\end{displaymath} (2.1)

и движение объекта $ II $ описывается аналогичным уравнением
\begin{displaymath}
z(t+1)=C(t)z(t)+D(t)v(t).
\end{displaymath} (2.2)

Здесь $ t\in\overline{0,\rm T-1} $; $ y\in{\bf R}^r $ и $ z \in{\bf R}^s $ - фазовые векторы объектов $ I $ и $ II $, соответственно ($ r,s\in{\bf N} $, где N - множество всех натуральных чисел; для $ n\in{\bf N} $, $ {\bf R}^n $ - n-мерное евклидово векторное пространство); $ u(t)\in{\bf R}^p $ и $ v(t)\in{\bf R}^q $ - управления преследователя $ P $ и уклоняющегося $ E $, соответственно, стесненные множествами

\begin{displaymath}
u(t)\in{\rm U_1}\subset{\bf R}^p,\quad v(t)\in{\rm V_1}\subset{\bf R}^q
\quad (p,q\in{\bf N});
\end{displaymath} (2.3)

$ A(t), B(t), C(t) $ и $ D(t) $ есть действительные матрицы размера $ r\times r, r\times p, s\times s $ и $ s\times q, $ соответственно; предполагается, что для всех $ t\in\overline{0,\rm T} $ фазовый вектор $ z(t)\in{\bf R}^s $ объекта $ II $, формируемый согласно (2.2), (2.3), удовлетворяет ограничению
\begin{displaymath}
z(t)\in{\rm Z}^*\subset{\bf R}^s;
\end{displaymath} (2.4)

все множества $ {\rm U}_1 $, $ {\rm V}_1 $ и $ {\rm Z}^* $ - выпуклые замкнутые и ограниченные многогранники (с конечным числом вершин) в пространствах $ {\bf R}^p $, ${\bf R}^q $ и $ {\bf R}^s $ соответственно.

Опишем информационные возможности преследователя $ P $ в процессе преследования-уклонения (адаптивного минимаксного управления в процессе преследования объекта $ II $ объектом $ I $).

Предполагается, что для некоторого $ \vartheta\in\overline{1,\rm T} $ и некоторого целочисленного промежутка времени $ {\overline{0,\vartheta}\subseteq
\overline{0,\rm T}} $ к моменту времени $ \vartheta $ в процессе преследования-уклонения преследователем $ P $ измеряются и запоминаются следующие величины: $ y(0)=y_0 $ - начальное фазовое состояние объекта $ I $; $ u(\cdot)=\{u(t)\}_{t\in\overline{0,\vartheta-1}} $ - история реализации управления преследователя $ P $ на промежутке $ \overline{0,\vartheta} $; $ \omega(\cdot)=\{\omega(t)\}_{t\in\overline{0,\vartheta}} $ ( $ \omega(t)\in{\bf R}^m $; $ m\in\bf N $, $ m\le s $) - история реализации сигнала на промежутке $ \overline{0,\vartheta}, $ значения которого $ \omega(t) $ ( $ \omega(0)=\omega_0 $ - фиксировано) для всех $ t\in\overline{0,\vartheta} $ генерируются дискретным векторным уравнением

\begin{displaymath}
\omega(t)=E(y(t))z(t)+F(t)\xi(t),
\end{displaymath} (2.5)

где $ \xi(t) $ есть ошибка измерений, удовлетворяющая ограничению
\begin{displaymath}
\xi(t)\in\Xi_1\subset{\bf R}^l~~\ (l\in\bf N).
\end{displaymath} (2.6)

Для всех $ t\in\overline{0,\rm T} $ и фазовых векторов $ y(t)\in{\bf R}^r $ объекта $ I $ предполагается, что $ E(y(t)) $ и $ F(t) $ - действительные матрицы размера $ m\times s $ и $ m\times l $ соответственно и для всех $ y(t) $ матрица $ E(y(t)) $ имеет ранг $ m, $ который равен размерности вектора $ \omega(t) $; $ \Xi_1 $ - выпуклый, замкнутый и ограниченный многогранник (с конечным числом вершин) в пространстве $ {\bf R}^l $. В течение процесса преследования-уклонения преследователь $ P $ также знает множество $ {Z(0)=Z_0
\subseteq{\rm Z}^*\subset{\bf R}^s} $ возможных начальных состояний объекта $ II $, которые совместимы [1] с начальным сигналом $ \omega_0 $. Все уравнения и ограничения (2.1)-(2.6) для него также известны.

Рассматриваемый процесс преследования-уклонения оценивается значением расстояния между обоими объектами $ I $ и $ II $ в пространстве $ {\bf R}^k $ (где $ k\in{\bf N}; k\le r $; $ k\le s $) в момент времени $ \rm T $.

Тогда для системы (2.1)-(2.6) цель адаптивного минимаксного управления для процесса преследования-уклонения с точки зрения преследователя $ P $ может быть сформулирована следующим образом: на заданном промежутке времени $ \overline{0,\rm T} $ требуется, чтобы преследователь $ P $ организовал управление $ u(\cdot)=\{u(t)\}_{t\in\overline{0,\rm T-1}} $ (для всех $ t\in\overline{0,\rm T-1} $, $ u(t)\in{\rm U}_1 $) позиционным образом (как реализацию адаптивной минимаксной стратегии из выбранного класса допустимых адаптивных стратегий), используя возможную (в силу (2.1)-(2.6)) реализацию сигнала $ \omega(\cdot)=\{\omega(t)\}_{t\in\overline{0,\rm T}} $ совместно со всей другой доступной информацией об этом процессе, таким образом, чтобы было минимальным максимальное значение расстояния между реализациями векторов $ \{y(\rm T)\}_k=(y_1(\rm T),y_2(\rm T),
\cdots,y_k(\rm T))^{\prime}\in{\bf R}^k $ и $ \{z(\rm T)\}_k=
(z_1(\rm T),z_2(\rm T),\cdots,z_k(\rm T))^{\prime}\in{\bf R}^k $ (где $ y(\rm T) $ есть реализация фазового вектора объекта $ I $ в момент $ \rm T $, соответствующая управлению $ u(\cdot) $ и $ z(\rm T) $ есть допустимая реализация фазового вектора объекта $ II $ в момент $ \rm T $, который можно оценить в этом процессе только как элемент его информационного множества [2]-[5]).

Предполагается, что уклоняющийся $ E $ может иметь полную информацию о параметрах системы (2.1)-(2.6) на промежутке времени $ \overline{0,\rm T} $ и его цель в процессе преследования-уклонения является диаметрально противоположной цели преследователя $ P $.


next up previous
Next: 3 Постановка задачи Up: SHOR Previous: 1 Введение
2003-08-21