Введем ряд определений, которые необходимы для строгой математической формулировки задачи адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе (2.1)-(2.6).
Для фиксированных и
введем
- метрическое пространство
функций целочисленного аргумента
,
где метрика
определяется следующим образом:
Используя ограничение (2.3), определим множество
допустимых управлений
преследователя
на промежутке времени
соотношением
На основании ограничений (2.3) и (2.6) аналогичным
образом определим множества
и
допустимых управлений
уклоняющегося
и допустимых ошибок измерений
сигнала на промежутке времени
соответственно.
Обозначим через
множество допустимых, в силу (2.1)-(2.6),
реализаций сигнала
на промежутке времени
.
Назовем набор
(
есть множество допустимых фазовых состояний
объекта
в момент времени
,
-
-позицией преследователя
в дискретной динамической системе
(2.1)-(2.6), где множество
непусто и определяется соотношением
Для всех
определим также множество
всех допустимых
-позиций преследователя
.
Далее, для фиксированных промежутка времени
, допустимых в силу
(2.1)-(2.6) реализаций
-позиции
,
управления
преследователя
и сигнала
определим через
множество всех пар
совместимых
[1]-[5] с этой информацией на промежутке времени
Назовем множество
Для фиксированного промежутка времени
,
-позиции
преследователя
и его
управления
определим следующие множества:
Используя определения (3.1)-(3.4) и условия, оговоренные для системы (2.1)-(2.6), аналогично результатам, полученным в работе [5], можно доказать, что справедливо следующее вспомогательное утверждение.
Пусть
есть многошаговое отображение, ставящее в соответствие набору
-позицию
, а именно
Далее, сформулируем для преследователя следующую
многошаговую задачу построения его допустимых позиций
в динамической системе (2.1)-(2.6).
З а д а ч а 1. Для фиксированной реализации набора
который соответствует дискретной динамической системе
(2.1)-(2.6) и известен в конце промежутка времени
, требуется определить многошаговое отображение
как реализацию последовательности только одношаговых операций.
В следующем разделе описывается общая рекуррентная схема
для решения этой задачи и будет иметься возможность
построения информационного множества
, которое
является основным элементом решения задачи
апостериорной минимаксной фильтрации [4,5]
для системы (2.1)-(2.6)
и будет необходимо для решения рассматриваемой
задачи преследования-уклонения.
Тогда, для оценивания качества процесса преследования-уклонения
в динамической системе (2.1)-(2.6) на промежутке времени
преследователем
определим функционал
таким образом, что для реализации набора
его значение определяется соотношением
Далее, введем несколько определений.
Допустимой стратегией адаптивного управления
преследователя
для процесса
преследования-уклонения (2.1)-(2.6)
на промежутке времени
будем называть отображение
, которое каждому моменту времени
и возможной реализации
-позиции
назначает множество
управлений
преследователя
. Обозначим множество всех допустимых
стратегий адаптивного управления преследователя
для этого процесса через
.
Определим стратегию адаптивного минимаксного управления
для процесса преследования-уклонения
(2.1)-(2.6) как реализацию специфической
стратегии адаптивного управления
из класса допустимых стратегий адаптивного управления
, которая формально описывается следующими соотношениями:
1) для всех
и
-позиций
пусть
2) для всех
и
-позиций
пусть
Здесь
для допустимых истории реализаций на промежутке времени
управления
преследователя
и сигнала
-позиция
формируется согласно (3.9), а именно
Пусть реализации управления
преследователя
и
сигнала
являются результатом использования стратегии адаптивного
минимаксного управления
на промежутке времени
и сигнал
удовлетворяет следующему соотношению
Тогда назовем число
Принимая во внимание приведенные выше определения, можно сформулировать основную задачу адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе (2.1)-(2.6).
З а д а ч а 2. Для начальной позиции
преследователя
в дискретной динамической системе (2.1)-(2.6)
требуется определить его стратегию адаптивного минимаксного управления
и оптимальный гарантированный
результат
, соответствующий
реализации этой стратегии на промежутке времени
для процесса преследования-уклонения,
как реализацию последовательности только одношаговых операций.
В следующем разделе описывается общая рекуррентная схема для решения этой задачи.