next up previous
Next: Функция цены Up: УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ (БЕЛЛМАНА) В Previous: УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ (БЕЛЛМАНА) В

1. Постановка задачи оптимального управления

Пусть движение объекта управления описывается системой дифференциальных уравнений
equation21
где tex2html_wrap_inline918 - соответственно n- и m-мерныe функции времени; f(t,x,v) - n-мерная вектор-функция; B(t,x,v) - tex2html_wrap_inline930-матрица-функция; tex2html_wrap_inline932 Производные в (1.1) следует понимать в обобщенном смысле [2]. Пусть tex2html_wrap_inline934; определим множество
displaymath936
где tex2html_wrap_inline938 - банахово пространство m-мерных функций ограниченной вариации,
displaymath942
(точная верхняя грань берется по всем конечным разбиениям tex2html_wrap_inline944 отрезка tex2html_wrap_inline946 - p-норма вектора v. Назовем tex2html_wrap_inline952 множеством допустимых управлений.

Заметим, что при tex2html_wrap_inline954 выполняется включение tex2html_wrap_inline956.

Пусть функции f(t,x,v) и B(t,x,v) удовлетворяют следующим требованиям:
equation39

equation42
для всех tex2html_wrap_inline962 Согласно [3, с. 155,], в этом случае множество допустимых траекторий равномерно ограничено, т.е. для всех tex2html_wrap_inline954 соответствующая траектория tex2html_wrap_inline966 принимает значения в tex2html_wrap_inline968 где Q - компакт.

Условие (А). Пусть функции f(t,x,v) и B(t,x,v) подчиняются требованиям (1.2), (1.3) и являются непрерывными по совокупности переменных (t,x,v) в области tex2html_wrap_inline976 а матрица-функция tex2html_wrap_inline978 обладает непрерывными частными производными tex2html_wrap_inline980 и tex2html_wrap_inline982 по x и v в той же области, и выполняется условие Фробениуса
displaymath988

displaymath990
Кроме того, пусть существует число K>0 такое, что
displaymath994
для всех tex2html_wrap_inline996

Под решением (1.1), соответствующим функции ограниченной вариации v(t), будем, как и в  [3, с. 148,], понимать вектор-функцию tex2html_wrap_inline1000, являющуюся поточечным пределом последовательности tex2html_wrap_inline1002, порожденной последовательностью абсолютно непрерывных функций tex2html_wrap_inline1004, сходящейся поточечно к функции v(t), если x(t) не зависит от выбора последовательности tex2html_wrap_inline1004.

Согласно [3, с. 164,], условие (А) является достаточным для того, чтобы для любого tex2html_wrap_inline1014 существовала единственная траектория tex2html_wrap_inline1016 определенная на интервале tex2html_wrap_inline1018 и удовлетворяющая уравнению
eqnarray81
Здесь tex2html_wrap_inline1020 - непрерывная составляющая функции v(t); второй интеграл в (1.4) - интеграл Римана-Стилтьеса [4]; tex2html_wrap_inline1024 - точки левого разрыва функции v(t); tex2html_wrap_inline1028 - точки правого разрыва функции v(t); tex2html_wrap_inline1032 tex2html_wrap_inline1034 а функция tex2html_wrap_inline1036 называемая левым (правым) скачком функции x, определяется равенством
eqnarray90
где z - решение задачи Коши
displaymath1042

Сформулируем задачу оптимального управления: требуется минимизировать функционал Больца
displaymath1044
вдоль траекторий системы (1.1), где g и h - скалярные функции, удовлетворяющие следующему условию.

Условие (Б). Пусть функции g(x) и h(t,x) непрерывны по всем своим переменным в области tex2html_wrap_inline1054, tex2html_wrap_inline1056; кроме того, пусть существует число K>0 такое, что
displaymath1060
для всех tex2html_wrap_inline1062


next up previous
Next: Функция цены Up: УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ (БЕЛЛМАНА) В Previous: УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ (БЕЛЛМАНА) В