next up previous
Next: Об этом документе...

О МОМЕНТАХ ПЕРЕКЛЮЧЕНИЯ ЭКСТРЕМАЛЬНЫХ
УПРАВЛЕНИЙ В ЛИНЕЙНОЙ ЗАДАЧЕ
ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ

Е.Н. Хайлов

Аннотация:

В работе рассматривается задача оптимального по быстродействию перевода линейной системы со скалярным ограниченным управлением из некоторого начального состояния в конечное, которые отличны от начала координат фазового пространства. Для нее локально исследуется существование некоторой вектор-функции переключений, которая определенным образом характеризует моменты переключения экстремального управления и длительность управляемого процесса, задаваемого им. Это дает возможность строить приближенные методы решения задачи оптимального быстродействия.

В работе рассматривается задача оптимального по быстродействию перевода линейной системы со скалярным, ограниченным по абсолютной величине управлением из некоторого начального состояния в конечное, которые отличны от начала координат фазового пространства. Для такой задачи принцип максимума Понтрягина является лишь необходимым условием оптимальности. Поэтому наряду с оптимальным управлением он определяет и так называемые экстремальные управления. При некоторых предположениях эти управления обладают релейной структурой, а число переключений устанавливает известная теорема Фельдбаума. Конечномерная параметризация множества достижимости исходной системы моментами переключения кусочно-постоянных управлений позволяет локально исследовать существование вектор-функции переключений, которая определенным образом характеризует моменты переключения экстремального управления и длительность управляемого процесса, задаваемого им. Это дает возможность строить приближенные методы решения задачи оптимального быстродействия.

Рассмотрим задачу оптимального быстродействия для линейной управляемой системы:
displaymath2351

displaymath2353
где A - действительная матрица порядка tex2html_wrap_inline2357; tex2html_wrap_inline2359; tex2html_wrap_inline2361.

Под классом допустимых управлений D(T) понимается класс измеримых функций u(t) , удовлетворяющих неравенству


displaymath2367

п.в. на [0,T] .

Предположим, что собственные значения матрицы A вещественны и векторы tex2html_wrap_inline2373 линейно независимы.

Считаем, что для сформулированной задачи (1.1)-(1.3) определено хотя бы одно допустимое управление tex2html_wrap_inline2375, для которого выполнены равенства (1.1), (1.2). Тогда ([1,2]) для точек tex2html_wrap_inline2377 существует единственное оптимальное управление tex2html_wrap_inline2379 задачи (1.1)-(1.3), удовлетворяющее условию максимума Понтрягина:
displaymath2381

п.в. на tex2html_wrap_inline2383 для некоторого вектора tex2html_wrap_inline2385, где tex2html_wrap_inline2387. При этом, как следует из соотношения (1.4), функция tex2html_wrap_inline2389 кусочно-постоянна, принимает значения -1 и +1 и имеет не более (n-1) моментов переключения. Здесь через tex2html_wrap_inline2395 обозначено время оптимального быстродействия, а через tex2html_wrap_inline2397 - экспоненциал матрицы B .

Поскольку условие максимума (1.4) является лишь необходимым условием оптимальности по быстродействию, равенству (1.4) могут удовлетворять не только оптимальное управление tex2html_wrap_inline2389, но и так называемые экстремальные управления tex2html_wrap_inline2403, соответствующие векторам tex2html_wrap_inline2405. При этом каждое экстремальное управление tex2html_wrap_inline2407 также является кусочно-постоянной функцией:

tex2html_wrap_inline2409 п.в. на tex2html_wrap_inline2411,

имеющей на интервале tex2html_wrap_inline2413 не более (n-1) переключений. Тогда для нахождения оптимального управления tex2html_wrap_inline2379, переводящего фазовую точку системы (1.1) из положения tex2html_wrap_inline2419 в положение tex2html_wrap_inline2421, необходимо найти все экстремальные управления tex2html_wrap_inline2403, переводящие систему (1.1) из tex2html_wrap_inline2419 в tex2html_wrap_inline2421, а затем выбрать из их числа то единственное, которое осуществляет этот переход за наименьшее время. Поскольку решение задачи оптимального быстродействия (1.1)-(1.3) сводится таким образом к анализу соответствующих экстремальных управлений, изучим последние более подробно.

Обозначим через tex2html_wrap_inline2429 и tex2html_wrap_inline2431 границу и внутренность компакта tex2html_wrap_inline2433.

Следуя схеме рассуждений теоремы 11 ([1]) можно показать, что справедлива

Лемма 1. Пусть tex2html_wrap_inline2435 - экстремальные управления задачи (1.1)-(1.3), заданные на отрезке tex2html_wrap_inline2411. Тогда эти управления совпадают, т.е.

tex2html_wrap_inline2443 п.в. на tex2html_wrap_inline2411 .

Теперь для произвольного T > 0 рассмотрим множество
displaymath2449

Учитывая результаты леммы 1, несложно обосновать справедливость утверждения.

Лемма 2. Допустимое управление tex2html_wrap_inline2403 является экстремальным в задаче (1.1)-(1.3) тогда и только тогда, когда выполнено включение
displaymath2457

Далее, введем множество
displaymath2459
и отображение tex2html_wrap_inline2461
displaymath2463

В работе [3] установлено соотношение
displaymath2465
при этом
displaymath2467
и сужение отображения tex2html_wrap_inline2469 на множество tex2html_wrap_inline2471 взаимно однозначно.

Это означает, что множество (1.7) и отбражение (1.8) задают конечномерную параметризацию множества (1.5).

Из включения (1.6) и равенств (1.9), (1.10) следует существование точки tex2html_wrap_inline2473, для которой имеет место формула
displaymath2475

Дальнейшие исследования экстремальных управлений tex2html_wrap_inline2403 заключаются в нахождении условий существования в малой окрестности tex2html_wrap_inline2479 вектор-функции tex2html_wrap_inline2481, удовлетворяющей уравнению (1.11) и равенству tex2html_wrap_inline2483. Поскольку в общем случае включение
displaymath2485
или эквивалентное ему в силу (1.9), (1.10) включение
displaymath2487
может не выполняться при малых tex2html_wrap_inline2489, имеет смысл рассматривать множества:
displaymath2491

displaymath2493

Справедлива

Лемма 3. Для всех T > 0 выполнены включения
displaymath2497

В работе [4] доказана выпуклость множества Y(T) и взаимная однозначность сужения отображения tex2html_wrap_inline2469 на внутренность tex2html_wrap_inline2503.

Из приведенных выше рассуждений следует,что изучение экстремальных управлений задачи (1.1)-(1.3) состоит в определении удовлетворяющей системе (1.11) функции tex2html_wrap_inline2481, совпадающей при tex2html_wrap_inline2507 с tex2html_wrap_inline2509 и принимающей свои значения в множестве (1.12) при tex2html_wrap_inline2511 или tex2html_wrap_inline2513.

З а м е ч а н и е. В случае tex2html_wrap_inline2515 результаты подобных исследований представлены в [5].

З а м е ч а н и е. Наличие функции tex2html_wrap_inline2481, обладающей перечисленными выше свойствами, позволяет строить приближенные методы решения задачи оптимального быстродействия (1.1)-(1.3). Для других задач такие алгоритмы подробно описаны в работе [6].

Пусть задано экстремальное управление tex2html_wrap_inline2403 исходной задачи (1.1)-(1.3), которое имеет на интервале tex2html_wrap_inline2413 tex2html_wrap_inline2523 переключений tex2html_wrap_inline2525.

Сформулируем

О п р е д е л е н и е. Пару точек tex2html_wrap_inline2527 называем локально регулярной, если для соответствующего ей экстремального управления tex2html_wrap_inline2407 имеет место одна из ситуаций:
displaymath2531

displaymath2533

displaymath2535
В противном случае называем пару tex2html_wrap_inline2527 локально нерегулярной.

З а м е ч а н и е. При разных значениях времени tex2html_wrap_inline2479 паре точек tex2html_wrap_inline2527 соответствуют разные экстремальные управления tex2html_wrap_inline2407. В зависимости от этого пара tex2html_wrap_inline2527 является локально регулярной или локально нерегулярной.

В предположении локальной регулярности точек tex2html_wrap_inline2527 определим вектор tex2html_wrap_inline2473 следующим образом:
displaymath2551

displaymath2553

displaymath2555

displaymath2557

Справедлива

Теорема. Для локально регулярной пары точек tex2html_wrap_inline2527 и соответствующего им экстремального управления tex2html_wrap_inline2403 существует определенная на интервале tex2html_wrap_inline2563, tex2html_wrap_inline2565 функция tex2html_wrap_inline2481, обладающая свойствами:

1) для каждого tex2html_wrap_inline2571 компонента tex2html_wrap_inline2573 является аналитической функцией на интервале tex2html_wrap_inline2563,

2) выполняется равенство
displaymath2579

3) для всех tex2html_wrap_inline2583 имеет место соотношение
displaymath2585

4) для всех tex2html_wrap_inline2583 справедливо включение
displaymath2591

Д о к а з а т е л ь с т в о. Определенная равенствами (1.14) точка tex2html_wrap_inline2509 соответствует экстремальному управлению tex2html_wrap_inline2407, и потому удовлетворяет нелинейной системе уравнений (1.11). Рассмотрим (1.11) как систему относительно неизвестных tex2html_wrap_inline2597. Соответствующая матрица Якоби в точке tex2html_wrap_inline2509 невырождена, поскольку ее столбцами являются вектора tex2html_wrap_inline2601, линейно независимые в силу вытекающего из (1.14) включения tex2html_wrap_inline2603. Поэтому, согласно теореме о неявной функции [7], локально существует аналитическое решение tex2html_wrap_inline2481 уравнения (1.11), соответственно (1.16), удовлетворяющее равенству (1.15) и включению (1.17). После чего, дифференцируя тождественно по T соотношение (1.16) на интервале существования tex2html_wrap_inline2481 и учитывая (1.17), получаем следующую задачу Коши:
displaymath2611

displaymath2613
где через tex2html_wrap_inline2615 обозначена матрица Якоби отображения tex2html_wrap_inline2469. Применяя к (1.18) теорему о непродолжаемом решении [8], имеем требуемую функцию tex2html_wrap_inline2481, tex2html_wrap_inline2621. Утверждение доказано.

Следствие. Для всех tex2html_wrap_inline2583 выполняется включение
displaymath2625

Доказательство соотношения (1.19) вытекает из равенства (1.13) и включения (1.17).

Пусть пара точек tex2html_wrap_inline2527 является локально нерегулярной для некоторого экстремального управления tex2html_wrap_inline2403. Это означает, что количество l моментов переключения удовлетворяет неравенству:
displaymath2633

displaymath2635
Ограничимся рассмотрением канонической модели системы (1.1) ([9]).

П р и м е р 1. Пусть n = 2 . Матрица A и вектора tex2html_wrap_inline2641 системы (1.1), (1.2) имеют вид:
displaymath2643
Из системы (1.16) для нахождения функции tex2html_wrap_inline2645 после надлежащих преобразований получаем формулы:
displaymath2647

displaymath2649
Локальную нерегулярность паре tex2html_wrap_inline2527 обеспечивает экстремальное управление tex2html_wrap_inline2653. Из равенства (1.11) имеем выражение tex2html_wrap_inline2655 и следующие ограничения на координаты векторов tex2html_wrap_inline2377:
displaymath2659
Учитывая эти соотношения, находим из (1.20) при малых tex2html_wrap_inline2661 формулы компонент вектор-функции tex2html_wrap_inline2481:
displaymath2665
Из анализа полученных выражений заключаем, что, во-первых,
displaymath2667
и, во-вторых, tex2html_wrap_inline2669 лишь при tex2html_wrap_inline2511.

П р и м е р 2. Пусть n = 3 . Матрица A и вектора tex2html_wrap_inline2641 системы (1.1), (1.2) имеют вид:
displaymath2679
Из системы (1.16) для нахождения функции tex2html_wrap_inline2681 после надлежащих преобразований получаем формулы:
displaymath2683

displaymath2685

displaymath2687

displaymath2689
Локальную нерегулярность паре точек tex2html_wrap_inline2527 обеспечивают несколько типов экстремальных управлений tex2html_wrap_inline2407. Рассмотрим каждый из них в отдельности.

Случай 1. Экстремальное управление задано выражением tex2html_wrap_inline2653. Из равенства (1.11) имеем выражение tex2html_wrap_inline2697 и следующие ограничения на координаты векторов tex2html_wrap_inline2377:
displaymath2701
При этом, если tex2html_wrap_inline2703, то, выполняя несложные вычисления в выражениях (1.21), находим формулы компонент вектор-функции tex2html_wrap_inline2481, аналогичные полученным ранее в [5] для tex2html_wrap_inline2515. Если же tex2html_wrap_inline2709, то преобразования в (1.21) приводят к следующим соотношениям:
displaymath2711

displaymath2713

displaymath2715
Анализ этих выражений позволяет сказать, что, во-первых,
displaymath2717

displaymath2719
и, во-вторых,
displaymath2721

Случай 2. Экстремальное управление задано выражением tex2html_wrap_inline2723. Из равенства (1.11) имеем выражение tex2html_wrap_inline2725 и следующие ограничения на координаты векторов tex2html_wrap_inline2377:
displaymath2729

displaymath2731
При этом, если tex2html_wrap_inline2733, то, выполняя несложные вычисления в выражениях (1.21), находим для компонент вектор-функции tex2html_wrap_inline2481 формулы
displaymath2737
из которых вытекают, во-первых, равенства
displaymath2739
и, во-вторых, включение
displaymath2741
а также формулы:
displaymath2743
отличие которых от ранее установленных лишь в том, что полученное включение имеет место при tex2html_wrap_inline2513. Если же tex2html_wrap_inline2747, то преобразования в (1.21) приводят к следующим соотношениям:
displaymath2749

displaymath2751

displaymath2753
Анализ этих выражений позволяет сказать, что, во-первых,
displaymath2755

displaymath2757
и, во-вторых,
displaymath2759

Случай 3. Экстремальное управление задано выражением tex2html_wrap_inline2761, если tex2html_wrap_inline2763 и tex2html_wrap_inline2765, если tex2html_wrap_inline2767, где tex2html_wrap_inline2769. Рассмотрим вспомогательные функции:
displaymath2771
Пусть координаты векторов tex2html_wrap_inline2377 таковы, что tex2html_wrap_inline2775. Значит, tex2html_wrap_inline2777. Поэтому, tex2html_wrap_inline2779. Выполняя несложные вычисления в выражениях (1.21), находим для компонент вектор-функции tex2html_wrap_inline2481 формулы:
displaymath2783
из которых вытекают, во-первых, равенства
displaymath2785
и, во-вторых, включение
displaymath2741
а также формулы:
displaymath2789
отличие которых от ранее установленных лишь в том, что полученное включение имеет место при tex2html_wrap_inline2513.

Пусть теперь tex2html_wrap_inline2793. Возможны две различные ситуации.

1. Координаты векторов tex2html_wrap_inline2377 удовлетворяют условиям:
displaymath2797
Тогда из равенства (1.11) имеем выражения
displaymath2799
Преобразования в (1.21) приводят к следующим соотношениям:
displaymath2801

displaymath2803

displaymath2805
Анализ этих соотношений позволяет сказать, что в случае
displaymath2807
выполняются равенства
displaymath2809
В случае же
displaymath2811
имеют место выражения:
displaymath2813
При этом в обоих случаях tex2html_wrap_inline2815 и включение tex2html_wrap_inline2669 справедливо при tex2html_wrap_inline2513.

2. Координаты векторов tex2html_wrap_inline2377 удовлетворяют условиям:
displaymath2823
Тогда из равенства (1.11) имеем выражения
displaymath2825
Преобразования в (1.21) приводят к следующим соотношениям:
displaymath2827

displaymath2829

displaymath2831
Анализ этих соотношений позволяет сказать, что в случае
displaymath2833
выполняются равенства
displaymath2835
В случае же
displaymath2837
имеют место выражения:
displaymath2839
При этом в обоих случаях tex2html_wrap_inline2815 и включение tex2html_wrap_inline2669 справедливо при tex2html_wrap_inline2511.

Отметим, что во всех рассмотренных ситуациях первые координаты векторов tex2html_wrap_inline2377 удовлетворяют формуле
displaymath2849

З а м е ч а н и е. Все указанные здесь случаи локально нерегулярных пар точек tex2html_wrap_inline2527 являются невырожденными в том смысле, что соответствующая функция переключений tex2html_wrap_inline2481 определена в двусторонней окрестности точки tex2html_wrap_inline2507.

З а м е ч а н и е. В рассмотренных невырожденных случаях локально нерегулярных пар tex2html_wrap_inline2527 найденная функция tex2html_wrap_inline2481 является аналитической в области своего определения.

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, код 93-011-16129.

Поступила 16.03.95

СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ

  1. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов.- М.: Наука, 1983.- 392 c.
  2. Болтянский В.Г. Математические методы оптимального управления.- М.: Наука, 1969.- 408 c.
  3. Хайлов Е.Н. Об аналитической параметризации множества управляемости в линейной задаче управления // Мат. заметки.- 1988.- T.44, вып.3.- С.405-406.
  4. Хайлов Е.Н. Конечномерные методы в задачах оптимального управления. Дис. ... канд. физ.-мат. наук: 01.01.02/ MГУ. М., 1989.
  5. Хайлов Е.Н. О поведении моментов переключения в линейной задаче быстродействия // Вест. Моск. ун-та. Сер.15. Вычисл. математика и кибернетика.- 1988.- N 4.- С.65-67.
  6. Хайлов Е.Н. О нахождении моментов переключения экстремального управления в нелинейной задаче быстродействия // Дифференц. уравнения.- 1992.- T.28, N 11.- С. 1988-1993.
  7. Вайнберг М.М., Треногин В.А. Теория ветвления решений нелинейных уравнений.- М.: Наука, 1969.- 527 c.
  8. Понтрягин Л.С. Обыкновенные дифференциальные уравнения.- М.: Наука, 1974.- 322 c.
  9. Скляр Г.М. Точное описание областей управляемости и достижимости для канонической системы // Развитие и применение метода функций Ляпунова. Новосибирск: Наука, 1992.- С. 215-219.


next up previous
Next: