Определим гамильтонианы
(i=1,2), где
следующим образом:
и функцию
Далее будет доказано, что функция цены V является единственным вязким
решением на множестве уравнения
(где - градиент функции V), называемого
уравнением Гамильтона-Якоби (Беллмана)
(далее для краткости будем называть его уравнением
Гамильтона-Якоби).
Аппарат вязких решений, используемый ниже,
восходит к работам [5], [8].
Аналогичный подход к задачам оптимизации используется
в [7], [9].
Существенным отличием данной работы являются
более общий вид функционала, а также возможность отказа от
вспомогательнной задачи импульсного расширения
(см. [9]).
Приведем из [8] определение вязкого решения. Нам
понадобятся следующие обозначения:
если то
если (соответственно
), то
(Множества и
называются, соответственно,
супер- и субдифференциалами функции
в точке
,
а их элементы - супер- и субградиентами).
Определение 4.1.
Непрерывная на множестве функция
называется
вязким верхним (нижним) решением уравнения
,
если
функция удовлетворяющая одновременно
и
, называется вязким решением
.
Теорема 4.1. Пусть выполнены условия (А) и (Б). Тогда
функция цены V есть единственное вязкое решение на
множестве
уравнения
;
V удовлетворяет краевым условиям
и
.
Доказательство.
Покажем сначала, что V - нижнее решение. Пусть
и
т.е., существуют число
и непрерывная на
функция
такие, что
для всех Ясно, что функция F(y) дифференцируема в
точке
и
Из второго равенства метода динамического программирования мы
имеем для всех
Перенесем в правую часть неравенства, разделим обе части на
и устремим
к нулю.
Нетрудно убедиться в том,
что
при
для всех
В силу дифференцируемости функции F в точке
получаем:
Осталось показать, что
Пусть
на
.
Из (3.1) для любого
мы имеем:
Заметим, что для подобных управлений траектория
есть решение задачи Коши
Разделим неравенство (4.4) на s и устремим s к нулю, получая
что и требовалось доказать.
Остается проверить, что V - верхнее решение уравнения
(4.1).
Пусть
и пусть
т.е., существуют число
и непрерывная на
функция
такие, что
для всех Требуется доказать, что либо
либо
Из (3.2) мы имеем:
для некоторых
Допустим,
т.е. импульсное управление оптимально.
Пользуясь следствием 1 из Леммы 3.1, получаем
для всех
Следовательно,
Как и раньше, разделим на и в пределе при
получим:
Используя обратный ход рассуждений, из неравенства
получаем
для всех Иными словами, оптимальное
управление непрерывно на интервале
для некоторого
Покажем, что если справедливо (4.5), то
Предположим противное, т.е.
Пусть
- оптимальное
непрерывное на
управление;
введем обозначение
и
рассмотрим разность
Согласно (4.6) и
свойствам интеграла Лебега-Стилтьеса [4],
справедливо следующее:
Введем обозначения: пусть
и
Рассмотрим интеграл
Разобьем интервал
на подинтервалы
так,
чтобы на каждом из
указанных подинтервалов
все компоненты
вектор-функции
были монотонны.
Тогда для всех
мы имеем:
где если
не убывает на
(
если
не возрастает на
),
и
Справедливо следующее равенство:
где - некоторая непрерывная функция, причем
для всех
Положим Тогда
Следовательно,
Нетрудно проверить, что обе суммы в
(4.7) неотрицательны.
Таким образом,
Поскольку то
Данное неравенство
противоречит оптимальности
управления на
т.е.
что и требовалось доказать.
Остается отметить, что уравнение (4.1) удовлетворяет требованиям теорем единственности решения уравнения Гамильтона-Якоби (см., например, [5], [6], [8]).
Теорема доказана.
Предложение 4.1.
Уравнение эквивалентно в смысле теории
вязких решений уравнению
где
Доказательство. Далее будем пользоваться эквивалентным определением вязкого решения, использующим приближение с помощью гладких функций (см., например, [7], [9]).
Пусть функция V - вязкое решение (4.1) на множестве
. Очевидно, что в этом
случае V является нижним решением для (4.8) на
.
Остается проверить, что V есть верхнее решение
(4.8). Итак, пусть функция
- гладкая и
достигает локального минимума,
равного нулю, в точке
Тогда по определению вязкого решения,
где
Если то
Значит, по определению
гамильтониана
V - верхнее решение в точке
уравнения (4.8). С другой стороны,
пусть
Тогда исходя из
(4.8), мы имеем:
Следовательно, V - вязкое верхнее решение
(4.8) на всем множестве
Тот факт, что вязкое решение (4.8) является вязким решением (4.1), доказывается аналогично.
Поскольку решения V и W уравнений (4.1) и (4.8)
единственны на множестве они тождественно совпадают в этой
области.
Предложение 4.1 доказано.
Следствие 1.
Помимо и
,
функция цены V удовлетворяет в смысле теории
вязких решений уравнению
где и
Уравнение (4.9) подробно изучалось в работе [9].
Замечание.
Уравнения (4.1), (4.8) и (4.9)
позволяют в некоторых случаях судить об оптимальности того
или иного управления.
Допустим W(y)=W(t,x,v,k) - произвольное
вязкое решение уравнения
Гамильтона-Якоби
на множестве , удовлетворяющее краевому
и граничному условиям (2.7) и (2.8).
a) Пусть - точка
дифференцируемости функции W(y).
Если
то постоянное управление оптимально на
некотором интервале
s>0.
Если
то
скачок управления в момент
является оптимальным.
б) Пусть - точка
субдифференцируемости функции W(y),
- субградиент.
Если
то постоянное управление является оптимальным на
некотором интервале
s>0;
если
то импульсное
управление оптимально.
в)
Наконец, пусть - точка
супердифференцируемости функции W(y), и
-
суперградиент. Тогда можно судить о неоптимальности
импульсного и постоянного управлений (соответственно, при
и
)
Более детально связь между решением уравнения Гамильтона-Якоби (4.9) и оптимальностью данного конкретного управления рассматривается в работе [9].
Присутствие бесконечности в уравнении (4.8) объясняется скачками управления: мгновенное изменение влечет бесконечную производную по времени.