next up previous
Next: Литература Up: УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ (БЕЛЛМАНА) В Previous: Уравнение Гамильтона-Якоби (Беллмана)

5. Пример

Рассмотрим следующую задачу оптимального управления. Пусть tex2html_wrap_inline1736 и движение объекта управления описывается дифференциальным уравнением
equation478

displaymath1738
При tex2html_wrap_inline1740 множество допустимых управлений -
displaymath1742
Нетрудно проверить, что для уравнения (5.1) условие (А) выполнено.

Траектория tex2html_wrap_inline1016 отвечающая допустимому управлению tex2html_wrap_inline1748 имеет вид:
displaymath1750
Остановимся на функции скачков: согласно (1.5),
displaymath1752
где
displaymath1754
Таким образом,
equation492
т.е. момент подачи импульса и пре-ущее значение управления на величину скачка не влияют.

Пусть минимизируемый функционал представляет собой расстояние до нуля в конечный момент:
displaymath1756
Условие (Б) для нашей задачи выполнено.

Функция цены
displaymath1760
должна удовлетворять следующим краевому и граничному условиям:
equation498
и
equation503
Рассмотрим подробно условие (5.3). Пусть tex2html_wrap_inline1762 где tex2html_wrap_inline1764 - параметр, tex2html_wrap_inline1766 Функция f(a) достигает экстремальных значений на концах отрезка [k,1]:
displaymath1772

displaymath1774
Минимальное из этих значений и есть правая часть (5.3):
equation511
Равенства (5.2), (5.4) и (5.5) подсказывают нам следующую оптимальную стратегию: в начальный (или любой другой) момент времени подаем импульс tex2html_wrap_inline1776 в остальное время управляющее воздействие не применяется. Пусть траектория tex2html_wrap_inline1778 отвечает выбранному управлению; положим
displaymath1780
Покажем, что функция tex2html_wrap_inline1782 является функцией цены задачи, то есть tex2html_wrap_inline1782 есть вязкое решение на множестве tex2html_wrap_inline1370 уравнения Гамильтона-Якоби
equation517
Частные производные tex2html_wrap_inline1788 существуют и непрерывны во всей области tex2html_wrap_inline1790 частная производная tex2html_wrap_inline1792 не определена только в точках вида (t,0,v,k). Это точки субдифференцируемости функции tex2html_wrap_inline1796 субградиенты имеют вид tex2html_wrap_inline1798 где tex2html_wrap_inline1800 Таким образом, мы имеем:
displaymath1802
Следовательно, tex2html_wrap_inline1782 - верхнее вязкое решение уравнения (5.6) в точках (t,0,v,k). Во всех остальных точках множества tex2html_wrap_inline1370 функция tex2html_wrap_inline1782 непрерывно дифференцируема, и
displaymath1812

displaymath1814

displaymath1816

displaymath1818
Подставляя эти значения в уравнение (5.6), получаем тождество, т.е.
tex2html_wrap_inline1782 - классическое решение на множестве tex2html_wrap_inline1822

Замечание. Случай tex2html_wrap_inline1824 не укладывается в общую схему оптимального управления, поскольку
displaymath1826
для всех tex2html_wrap_inline1828

Поступила 08.09.97