next up previous
Next: Bibliography Up: albreht Previous: 3 Оптимальные стратегии


4. Примеры

В этом параграфе приводятся модельные примеры, в которых выполнены условия теоремы 3.1. Сначала дается пример, в котором динамика управляемого процесса удовлетворяет требованиям условия 2.1. Такие ситуации типичны, когда совпадают размерности управляющей силы и фазовых координат, или, наряду с ограничениями на управляющие силы, имеются также ограничения на скорости изменения фазовых координат управляемого процесса. Затем приводится пример, в котором динамика удовлетворяет требованиям условия 2.2. После этого формулируются игровые задачи о сближении объектов с аналогичной динамикой, в которых имеет место регулярный случай. Во втором примере даются результаты вычисления опорной функции области достижимости и оптимальных стратегий игроков.

П р и м е р 4.1. Рассмотрим задачу об управлении вращением свободного абсолютно твердого симметричного тела вокруг его центра тяжести в безвоздушном пространстве. Пусть $A, B, C$ - главные центральные моменты инерции тела, причем $B=A$ и $\lambda = (B-C)/B$ - достаточно малая величина. Величины $Aw^*_1, Bw^*_2, Cw^*_3$ означают управляющие моменты, создаваемые двигателями относительно главных центральных осей инерции. Обозначив через $x_1, x_2, x_3$ проекции вектора угловой скорости вращения тела на глвные центральные оси инерции, запишем динамические уравнения Эйлера

\begin{displaymath}
\dot x_1 = \lambda x_1x_2+w^*_1=w_1, \quad
\dot x_2 = -\lambda x_1x_2+w^*_2=w_2, \quad
\dot x_3 = w^*_3=w_3.
\end{displaymath} (4.1)

Предположим, что задано ограничение ${w^*_1}^2+{w^*_2}^2+{w^*_3}^2 \le \zeta^2.$ Разрешив правую часть уравнений (4.1) относительно компонент вектора $w^*$, получим, что множество $R(t, x, \lambda)$ в (2.2) описывается равенством

\begin{displaymath}
R(x,\lambda_1) = \{w \in R^3: (w_1 - \lambda x_3x_2)^2 +
(w_2 + \lambda x_3x_1)^2 + w_3^2 \le \zeta^2 \}.
\end{displaymath}

Очевидно, что в данном примере выполнены все требования условия 2.1.

П р и м е р 4.2. Рассмотрим материальную точку $M$ переменной массы $m(t)$, движущуюся по идеально гладкой горизонтальной плоскости $x, y$ под действием заданной силы притяжения (отталкивания) к началу координат $F = \lambda m(t)\{x^2, y^2\}$, где $\lambda$ - некоторая малая постоянная. Реактивная масса выбрасывается с постоянной по величине относительной скоростью $c$. Проектируя уравнение Мещерского на оси координат $x$ и $y$, получим следующие уравнения движения точки $M$

\begin{displaymath}
m(t)\ddot x = \lambda m(t) x^2 + c \dot m(t) \cos\alpha_x (t...
...m(t)\ddot y = \lambda m(t) y^2 + c \dot m(t) \cos\alpha_y (t),
\end{displaymath}

где $\alpha_x (t)$ и $\alpha_y (t)$ - углы между вектором относительной скорости и осями $x$ и $y$ соответственно. В качестве управляющего воздействия введем в рассмотрение вектор $u$ с компонентами

\begin{displaymath}
u_1 = c \frac{\dot m}{m} \cos\alpha_x (t),\quad
u_2 = c \fra...
...t), \quad
u_1^2 + u_2^2 = c^2\bigg (\frac{\dot m}{m}\bigg )^2.
\end{displaymath}

Полагая теперь, что $x = x_1, y = x_2$, запишем уравнения движения точки в нормальной форме
\begin{displaymath}
\dot x_1 = x_2,\quad \dot x_2 = \lambda {x_2}^2 + u_1,\quad
\dot x_3 = x_4, \quad \dot x_2 = \lambda {x_3}^2 + u_2.
\end{displaymath} (4.2)

Пусть на управления наложено ограничение ${u_1}^2 + {u_2}^2 \le \zeta^2$. Для системы (4.2) вычислим опорную функцию $\rho [l, \vartheta, t, x, \lambda]$ сечения области достижимости $G(\vartheta, t_0, x_0, \lambda)$ плоскостью $\{x_1, x_3\}.$ Это значит, что описанные выше вычисления следует вести при условии, что вектор $l \in S$ имеет вид $l = \{l_1, 0, l_3, 0\}.$ Вектор-функция $g(l, \vartheta, \tau) \in R^2$ (2.4) имеет вид

\begin{displaymath}
g(l, \vartheta, \tau) = ( \vartheta, - t)\{l_1, l_3\}),
\end{displaymath}

поэтому в данном случае имеет место условие 2.2. Выполнив необходимые вычисления, найдем опорную функцию, удовлетворяющую уравнению Гамильтона - Якоби (2.4) с точностью до значений $\lambda$ в первой степени
$\displaystyle \rho [l, \vartheta, t, x, \lambda]$ $\textstyle =$ $\displaystyle l_1(x_1 + (\vartheta - t)x_2) +
l_3(x_3 + (\vartheta - t)x_4) + {\zeta (\vartheta - t)^2 \over 2}+$  
  $\textstyle +$ $\displaystyle \lambda
\left\{
l_1 \left[{x_1^2(\vartheta - t)^2 \over 2} +
{x_1x_2(\vartheta - t)^3 \over 3} +
{x_2^2(\vartheta - t)^4 \over 12}\right] +
\right.$  
  $\textstyle +$ $\displaystyle l_3 \left[{x_3^2(\vartheta - t)^2 \over 2} +
{x_3x_4(\vartheta - t)^3 \over 3} +
{x_4^2(\vartheta - t)^4 \over 12}\right] +$  
  $\textstyle +$ $\displaystyle {\zeta \over 12 }
\left[l_1^2(\vartheta - t)^4
\left( x_1 +
{3x_2...
...ta - t)^4 \left( x_3 +
\vphantom{{3x_4(\vartheta - t) \over 5 }}
\right.\right.$  
  $\textstyle +$ $\displaystyle \left. \left.\left.
{3x_4(\vartheta - t) \over 5 }\right)\right] ...
...l_3^3)(\vartheta - t)^6 \over 120}
\right\} + \dots \qquad \qquad \qquad \qquad$ (4.3)

Отметим, что условие 2.2(в) существенно. Опорная функция области достижимости системы (4.2) в пространстве $\{x_1, x_2, x_3, x_4\}$ при $\lambda = 0$ определяется равенством

\begin{displaymath}
\rho [l, \vartheta, t, x, 0] = l_1(x_1 + (\vartheta - t)x_2) + l_2x_2 +
l_3(x_3 + (\vartheta - t)x_4) + l_4x_4 +
\end{displaymath}


\begin{displaymath}
+ \zeta \int\limits_t^\vartheta \sqrt
{[l_1(\vartheta - \tau) + l_2 ]^2 +
[l_3(\vartheta - \tau) + l_4 ]^2}d\tau.
\end{displaymath}

Условие 2.2(в) здесь не выполнено, поскольку подынтегральная функция обращается в нуль при $\tau = \vartheta$ и любом $l= \{l_1, 0, l_3, 0\}$. Нетрудно проверить, что это ведет к неограниченности вторых производных опорной функции по $l$.

П р и м е р 4.3. Рассмотрим задачу выравнивания угловых скоростей
двух симметричных тел вращающихся вокруг центров тяжести в пространстве перед стыковкой, когда тело, с которым необходимо состыковаться, вращается под действием неизвестной ограниченной помехи.

Пусть $y_1, y_2, y_3$ и $z_1, z_2, z_3$ - проекции векторов угловой скорости вра- щения тел на главные центральные оси инерции, $M_1, M_2, M_3$ и $N_1, N_2, N_3$ - главные моменты внешних сил, $I_1=I, I_2=I, I_3$ и $J_1=J, J_2=J, J_3$ - моменты инерции относительно этих осей первого и второго тела соответственно. Предположим, что достаточно малы величины $\lambda_1 = (I - I_3)/I$ и $\lambda_2 = (J - J_3)/J$. В соответствии с (4.1) движения тел вокруг центров тяжести происходят по законам

\begin{displaymath}
\dot y_1 = \lambda_1 y_3y_2 + \frac{1}{I}M_1 = u_1, \quad
\d...
...frac{1}{I}M_2 = u_2, \quad
\dot y_3 = \frac{1}{I_3} M_3 = u_3,
\end{displaymath}


\begin{displaymath}
\dot z_1 = \lambda_2 z_3z_2 + \frac{1}{J}N_1 = v_1, \quad
\d...
...frac{1}{J}N_2 = v_2, \quad
\dot z_3 = \frac{1}{J_3} N_3 = v_3.
\end{displaymath}

Пусть заданы ограничения

\begin{displaymath}
(\frac{1}{I}M_1)^2 + (\frac{1}{I}M_2)^2 + (\frac{1}{I_3} M_3...
...N_1)^2 + (\frac{1}{J}N_2)^2 + (\frac{1}{J_3} N_3)^2 \le \nu^2.
\end{displaymath}

Тогда, множества $P(y,\lambda_1)$ и $Q(z,\lambda_2)$ имеют вид

\begin{displaymath}
P(y,\lambda_1) = \{u \in R^3: (u_1 - \lambda_1 y_3y_2)^2 +
(u_2 + \lambda_1 y_3y_1)^2 + u_3^2 \le \mu^2 \},
\end{displaymath}


\begin{displaymath}
Q(z,\lambda_2) = \{v \in R^3: (v_1 - \lambda_2 z_3z_2)^2 +
(v_2 + \lambda_2 z_3z_1)^2 + v_3^2 \le \nu^2 \}.
\end{displaymath}

Плата игры описывается равенством

\begin{displaymath}
\sigma (y - z) = \sigma (x) = [(y_1 - z_1)^2 + (y_2 - z_2)^2 +
(y_3 - z_3)^2]^{1/2}.
\end{displaymath}

При $\lambda = 0$ объекты однотипны, следовательно, при $\mu - \nu \ge
\delta > 0$ будет иметь место регулярный случай и для вычисления экстремальных стратегий игроков можно использовать результаты теоремы 3.1.

П р и м е р 4.4. Рассмотрим задачу сближения-уклонения двух точек $M$ и $N$ переменной массы, движущихся по идеально гладкой горизонтальной плоскости под действием заданной силы притяжения (отталкивания) к началу координат. В соответствии с (4.2) движения точек происходят по законам

\begin{displaymath}
\dot y_1 = y_2,\quad \dot y_2 = \lambda {y_2}^2 + u_1,\quad
\dot y_3 = y_4, \quad \dot y_2 = \lambda {y_3}^2 + u_2.
\end{displaymath}


\begin{displaymath}
\dot z_1 = z_2,\quad \dot z_2 = \lambda {z_2}^2 + v_1,\quad
\dot z_3 = z_4, \quad \dot z_2 = \lambda {z_3}^2 + v_2.
\end{displaymath}

Пусть на управления $u$ и $v$ наложены геометрические ограничения

\begin{displaymath}u_1^2 + u_2^2 \le \mu^2, \quad v_1^2 + v_2^2 \le \nu^2, \quad
\mu - \nu \ge \delta >0,\end{displaymath}

и плата игры описывается равенством

\begin{displaymath}\sigma (y - z) = \sigma (x) = [(y_1 - z_1)^2 +
(y_3 - z_3)^2]^{1/2}.\end{displaymath}

Из (4.3) вытекает, что при $\lambda = 0$ области достижимости точек $M$ и $N$ являются кругами с центрами в точках

\begin{displaymath}
\{y_1 + (\vartheta - t)y_2,  y_3 + (\vartheta - t)y_4\},\quad
\{z_1 + (\vartheta - t)z_2,  z_3 + (\vartheta - t)z_4\}
\end{displaymath}

и радиусами

\begin{displaymath}
{{\mu (\vartheta - t)^2 \over 2}}, \quad\quad {{\nu (\vartheta - t)^2 \over 2}}.
\end{displaymath}

Следовательно, при достаточно малых значениях параметра $\lambda$ имеет место регулярный случай.

Величина программного максимина (3.5) определяется равенством

\begin{eqnarray*}
\lefteqn{\varepsilon^0(\vartheta, t, y, z, \lambda)=}  [2ex]...
...l_1^3+l_3^3)(\vartheta - t)^6 \over 120}\right]+ \dots
\right\}.
\end{eqnarray*}

Вектор $l^0 = l^0(\vartheta, t, y, z, \lambda),$ на котором достигается максимум в правой части этого равенства, ищем в виде

\begin{displaymath}
l_i^0=l_i^{(0)}+\lambda l_i^{(1)}+\dots, \quad (i=1,3).
\end{displaymath}

Выполнив необходимые вычисления, получим

\begin{displaymath}
l_i^{(0)}=-a_i{\parallel a \parallel}^{-1},
\end{displaymath}


\begin{displaymath}
l_1^{(1)}=\alpha l_3^{(0)}{\parallel a \parallel}^{-2}, \qquad
l_3^{(1)}=-\alpha l_1^{(0)}{\parallel a \parallel}^{-2},
\end{displaymath}

где $a=\{a_1,a_3\} \in R_2, \quad \alpha \in R,$ причем

\begin{displaymath}
a_i=x_i+(\vartheta - t)x_{i+1},
\end{displaymath}


\begin{displaymath}
\alpha=b_1l_3^{(0)}-b_3l_1^{(0)}+l_1^{(0)}l_3^{(0)}[2(c_1-c_3)+
3d(l_1^{(0)}-l_3^{(0)})],
\end{displaymath}


\begin{displaymath}
b_i= {(z_i^2-y_i^2)(\vartheta - t)^2 \over 2}+
{(z_iz_{i+1}-...
...3 \over 3}+
{(z_{i+1}^2-y_{i+1}^2)(\vartheta - t)^4 \over 12},
\end{displaymath}


\begin{displaymath}
c_i= {(\nu z_i-\mu y_i)(\vartheta - t)^4 \over 12}+
{(\nu z_{i+1}-\mu y_{i+1})(\vartheta - t)^5 \over 20},
\end{displaymath}


\begin{displaymath}
d= {(\nu^2-\mu^2)(\vartheta - t)^6 \over 120}.
\end{displaymath}

Определим экстремальные стратегии $U_e$ и $V_e$ игроков. В области $\varepsilon^0 > 0, t< \vartheta$ множества $U_e^*$ и $V_e^*$ состоят из единственной точки

\begin{displaymath}
u_{1e}=\mu l_1^{(0)} \left[ 1+\lambda \left({l_1^{(1)} \over l_1^{(0)}}+\beta_1
(l_3^{(0)})^2 \right)\right],
\end{displaymath}


\begin{displaymath}
u_{2e}=\mu l_3^{(0)} \left[ 1+\lambda \left({l_3^{(1)} \over l_3^{(0)}}-\beta_1
(l_1^{(0)})^2 \right)\right],
\end{displaymath}


\begin{displaymath}
v_{1e}=\nu l_1^{(0)} \left[ 1+\lambda \left({l_1^{(1)} \over l_1^{(0)}}+\beta_2
(l_3^{(0)})^2 \right)\right],
\end{displaymath}


\begin{displaymath}
v_{2e}=\nu l_3^{(0)} \left[ 1+\lambda \left({l_3^{(1)} \over l_3^{(0)}}-\beta_2
(l_1^{(0)})^2 \right)\right],
\end{displaymath}


\begin{displaymath}
\beta_1=(\vartheta - t)^2 \left[ {(y_1-y_3) \over 3}+
{(y_2-...
...
\mu {(l_1^{(0)}-l_3^{(0)})(\vartheta - t)^2 \over 20}\right],
\end{displaymath}


\begin{displaymath}
\beta_1=(\vartheta - t)^2 \left[ {(z_1-z_3) \over 3}+
{(z_2-...
...
\nu {(l_1^{(0)}-l_3^{(0)})(\vartheta - t)^2 \over 20}\right].
\end{displaymath}





Поступила 05.08.99


next up previous
Next: Bibliography Up: albreht Previous: 3 Оптимальные стратегии
2003-06-05