Введем ряд определений, которые необходимы для строгой математической формулировки задачи адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе (2.1)-(2.6).
Для фиксированных и
введем
- метрическое пространство
функций целочисленного аргумента
,
где метрика определяется следующим образом:
Используя ограничение (2.3), определим множество
допустимых управлений
преследователя на промежутке времени
соотношением
На основании ограничений (2.3) и (2.6) аналогичным образом определим множества и допустимых управлений уклоняющегося и допустимых ошибок измерений сигнала на промежутке времени соответственно.
Обозначим через множество допустимых, в силу (2.1)-(2.6), реализаций сигнала на промежутке времени .
Назовем набор
( есть множество допустимых фазовых состояний
объекта в момент времени ,
-
-позицией преследователя
в дискретной динамической системе
(2.1)-(2.6), где множество
непусто и определяется соотношением
Для всех определим также множество всех допустимых -позиций преследователя .
Далее, для фиксированных промежутка времени
, допустимых в силу
(2.1)-(2.6) реализаций
-позиции
,
управления
преследователя и сигнала
определим через
множество всех пар
совместимых
[1]-[5] с этой информацией на промежутке времени
Назовем множество
Для фиксированного промежутка времени
,
-позиции
преследователя и его
управления
определим следующие множества:
Используя определения (3.1)-(3.4) и условия, оговоренные для системы (2.1)-(2.6), аналогично результатам, полученным в работе [5], можно доказать, что справедливо следующее вспомогательное утверждение.
Пусть
есть многошаговое отображение, ставящее в соответствие набору
-позицию
, а именно
Далее, сформулируем для преследователя следующую многошаговую задачу построения его допустимых позиций в динамической системе (2.1)-(2.6).
З а д а ч а 1. Для фиксированной реализации набора
который соответствует дискретной динамической системе
(2.1)-(2.6) и известен в конце промежутка времени
, требуется определить многошаговое отображение
как реализацию последовательности только одношаговых операций.
В следующем разделе описывается общая рекуррентная схема для решения этой задачи и будет иметься возможность построения информационного множества , которое является основным элементом решения задачи апостериорной минимаксной фильтрации [4,5] для системы (2.1)-(2.6) и будет необходимо для решения рассматриваемой задачи преследования-уклонения.
Тогда, для оценивания качества процесса преследования-уклонения
в динамической системе (2.1)-(2.6) на промежутке времени
преследователем определим функционал
таким образом, что для реализации набора
его значение определяется соотношением
Далее, введем несколько определений.
Допустимой стратегией адаптивного управления преследователя для процесса преследования-уклонения (2.1)-(2.6) на промежутке времени будем называть отображение , которое каждому моменту времени и возможной реализации -позиции назначает множество управлений преследователя . Обозначим множество всех допустимых стратегий адаптивного управления преследователя для этого процесса через .
Определим стратегию адаптивного минимаксного управления
для процесса преследования-уклонения
(2.1)-(2.6) как реализацию специфической
стратегии адаптивного управления
из класса допустимых стратегий адаптивного управления
, которая формально описывается следующими соотношениями:
1) для всех
и
-позиций
пусть
2) для всех
и -позиций
пусть
Здесь
для допустимых истории реализаций на промежутке времени
управления
преследователя и сигнала
-позиция
формируется согласно (3.9), а именно
Пусть реализации управления
преследователя и
сигнала
являются результатом использования стратегии адаптивного
минимаксного управления
на промежутке времени
и сигнал
удовлетворяет следующему соотношению
Тогда назовем число
Принимая во внимание приведенные выше определения, можно сформулировать основную задачу адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе (2.1)-(2.6).
З а д а ч а 2. Для начальной позиции преследователя в дискретной динамической системе (2.1)-(2.6) требуется определить его стратегию адаптивного минимаксного управления и оптимальный гарантированный результат , соответствующий реализации этой стратегии на промежутке времени для процесса преследования-уклонения, как реализацию последовательности только одношаговых операций.
В следующем разделе описывается общая рекуррентная схема для решения этой задачи.