Зафиксируем промежуток времени
. Для фиксированных
фазовых векторов
и
объекта ,
набора
и сигнала
,
определим в силу (2.1)-(2.6) множества
Для фиксированных -позиции
реализаций управления
и сигнала
сконструируем в силу (2.1), (4.2) и (4.3)
-позицию
преследователя используя рекуррентные
формулы
Аналогично определению из [4], назовем систему одношаговых соотношений (4.2)-(4.5) информационно-сопряженной для дискретной динамической системы (2.1)-(2.6). Принимая во внимание (3.1)-(3.10), (4.2)-(4.5) и условия, которые оговорены для системы (2.1)-(2.6), можно доказать [5], что справедливо следующее утверждение.
Отметим, что теорема 1 дает возможность разрабатывать
конструктивные численные алгоритмы, реализующие отображение
на промежутке времени
в форме последовательности
только одношаговых операций, т.е. решающих многошаговую задачу 1.
В результате этого имеется описание
-позиции
преследователя , которая
формирует состояние процесса преследования-уклонения в системе
(2.1)-(2.6),
не противоречащее информации, доступной к моменту времени
, и является основным элементом реализации
процесса апостериорной минимаксной фильтрации на промежутке времени
(см. [4,5]),
генерируемым на выходе фильтра.
Зафиксируем промежуток времени
и набор
, где есть выпуклый, замкнутый
и ограниченный многогранник (с конечным числом вершин)
пространства . Пусть множество
соответствует (4.2). Тогда из определения (4.2)
и сделанных выше предположений следует, что для всех
множество есть выпуклый,
замкнутый и ограниченный многогранник (с конечным числом вершин)
пространства . Известно также (см., например,
[9]), что точка выпуклого, замкнутого и ограниченного
многогранника представима в виде
Предположим, что множество уже сконструировано. Тогда легко доказать следующее вспомогательное утверждение.
Тогда (здесь и ниже есть множество всех вершин многогранника , и есть выпуклая оболочка этого множества).
Сформулируем подобное утверждение для управляющей части уравнения (2.2).
Тогда .
Справедливо следующее утверждение.
Доказательство этой теоремы дано в [5].
Для фиксированного вектора
, матрица
, фигурирующая в (2.5), по предположению имеет ранг
. Пусть и
есть матрица размера соответствующая
базисному минору матрицы .
Без уменьшения общности, предположим, что минор, соответствующий
матрице
находится в верхнем левом углу
матрицы , т.е. первые координат
вектора
- базисные переменные
векторного уравнения (2.5).
Тогда для фиксированных векторов
и
которые допустимы в силу (2.1)-(2.6),
соотношение (2.5) представимо в виде
Принимая во внимание (4.6), (4.7),
(4.3) и введенные выше предположения,
для фиксированных и допустимых в силу (2.1)-(2.6)
векторов
и
имеем
Тогда .
Тогда .
На основании соотношения (4.8), лемм 4 и 5 аналогично доказательству теоремы 2 нетрудно показать справедливость следующего утверждения.
Тогда имеет место следующее равенство:
Используя предыдущие леммы 1-5, теоремы 1-3, рекуррентные соотношения (4.4) и (4.5) нетрудно показать индукцией по числу шагов , соответствующих промежутку времени , на котором рассматривается процесс преследования-уклонения, справедливость следующего утверждения.
Нетрудно доказать, что справедливо следующее утверждение.
Тогда .
Зафиксируем начальную позицию , где множество есть выпуклый замкнутый и ограниченный многогранник (с конечным числом вершин) пространства и реализации управления и сигнала на промежутке времени
Тогда с учетом введенных выше определений и сформулированных утверждений, общая схема решения задачи 2 конструирования стратегии адаптивного минимаксного управления для процесса преследования-уклонения в дискретной динамической системе (2.1)-(2.6) может быть представлена как реализация последовательности следующих только одношаговых операций.
I. Для вычисляются следующие элементы решения.
1.1. Пусть если , то перейти на пункт II; иначе - перейти на пункт 1.2.
1.2. Вектор вычисляется по рекуррентным формулам (4.4), используя вектор и управление .
1.3. Область достижимости вычисляется при предположении, что есть выпуклый замкнутый и ограниченный многогранник (с конечным числом вершин), который уже определен , т.е. известно множество всех вершин многогранника (общая схема построения этого множества описывается в пункте III алгоритма). На основании изложенного выше, эта область может быть сконструирована с использованием следующей схемы.
1.3.1. Используя известные матрицы и ,
множества
и
всех вершин многогранников
и соответственно,
конструируем следующие множества
1.3.2. Пусть ; тогда рассматривается следующая задача линейного программирования.
З а д а ч а 3. Для фиксированных
и набора переменных
требуется установить
совместность следующей системы линейных соотношений:
Эта задача решается с помощью модифицированного
симплекс-метода (см., например, [10]), который используется
для задачи линейного программирования с ограничениями
(4.9) и поиска минимума целевой функции
достаточно произвольного вида, например,
Отметим, что такой выбор целевой функции значительно упрощает проверку совместности ограничений (4.9) на первом шаге модифицированного симплекс-метода. При этом из свойств системы (4.9) следует, что если она совместна, то точка не является вершиной многогранника ; в противном случае имеем .
Тогда, решая задачу 3 для всех значений параметра , найдем все вершины многогранника , так как в силу теоремы 2 имеет место равенство .
II. Для фиксированных и множество вычисляется в соответствии со следующей схемой.
2.1. В соответствии с изложенным выше по известной матрице
находится матрица
размера
, которая существует в силу сделанных
предположений и имеет вид
2.2. Используя матрицы
и , множества
и
всех вершин многогранников
и соответственно, конструируем множества
2.3. Пусть
; тогда, решая задачу 3
для этого множества и для всех значений параметра
, найдем все вершины многогранника
,
так как в силу теоремы 3 имеет место равенство
III. Используя модифицированные рекуррентные формулы
(4.5), вычисляем следующие множества:
3.1. Используя множества или всех вершин многогранников или соответственно, которые известны к началу этого пункта, вычисляем крайние опорные гиперплоскости [9] соответствующего многогранника.
В связи с этим напомним, что опорной гиперплоскостью выпуклого многогранника называется гиперплоскость вида , где для всех и хотя бы для одного . Если опорная гиперплоскость содержит аффинно-независимых [9] точек множества , то она называется крайней опорной гиперплоскостью этого множества.
3.2. Крайние опорные гиперплоскости многогранника
вычисляется с использованием известного множества
всех его вершин.
3.3. Используя сконструированные гиперплоскости многогранников или и находим общее решение системы неравенств, состоящей из всех неравенств, порожденных крайними опорными гиперплоскостями этих многогранников, соответствующих фиксированному моменту времени которое описывает в частном случае множество - всех вершин многогранника
В результате реализации предыдущих пунктов для всех вычисляется -позиция преследователя , где и есть информационное множество процесса апостериорной минимаксной фильтрации для дискретной динамической системы (2.1)-(2.6). Отметим, что это есть множество все допустимых реализаций фазовых векторов объекта в момент времени , которые совместимы со всей информацией об этой системе, известной преследователю на промежутке времени .
IV. В этом пункте вычисляются все параметры стратегии адаптивного минимаксного управления преследователя для некоторого момента времени .
Эта процедура реализуется следующим образом.
4.1. Используя известные матрицы и
вектор
и множество
всех вершин
многогранника конструируем следующие множества:
4.2. Пусть , тогда, решая задачу 3 для этого множества и для всех значений параметра найдем все вершины многогранника , так как из теоремы 5 следует справедливость равенства .
Используя это множество, можно вычислить также множество
всех вершин многогранника
(например, путем решения соответствующей
задачи 3) и множество всех его крайних
опорных гиперплоскостей.
Тогда множество
описывается следующей системой
линейных неравенств
4.3. Используя известные матрицы и ,
множества
и
всех вершин многогранников
и соответственно, сконструируем множества
Пусть , тогда, решая задачу 3 для этого множества и для всех значений параметра , найдем все вершины многогранника , так как из теоремы 2 следует справедливость равенства .
4.4. Используя множество
всех вершин многогранника
, сформированного в предыдущем пункте,
можно вычислить множество
всех вершин многогранника
и ввести для
функционалы
4.5. Вводится дополнительная переменная
и используя функционалы
и соотношения
(4.11) конструируется система выпуклых и линейных неравенств
4.6. Рассматривается следующая задача выпуклого
программирования
Эта задача решается с использованием, например, алгоритма метода Зойтендейка (случай нелинейных ограничений-неравенств) (см., например, [10]).
Пусть
есть решение этой задачи, которое удовлетворяет соотношению
Тогда для
,
используя приведенные выше леммы 1-6, теоремы 1-5 и соотношения
(4.10)-(4.12)
нетрудно доказать справедливость следующих равенств:
Используя этот алгоритм с пункта I до пункта IV, и снова с пункта I
для всех моментов времени
и
всех -позиций
можно сконструировать следующие множества
Тогда определим стратегию управления преследователя для процесса преследования-уклонения (2.1)-(2.6) на промежутке времени из класса допустимых стратегий управления , которая формально описывается следующими соотношениями:
1) для всех
и
-позиций
пусть
2) для всех
и -позиций
пусть
Пусть набор
состоящий из реализаций управления
преследователя и сигнала
соответственно, сформирован в результате
использования этой стратегии на промежутке времени
и такой, что
и
удовлетворяют соотношению
(4.13) при
Тогда можно вычислить следующее число
Из приведенного выше алгоритма и соотношений (4.12)-(4.16) получим следующее утверждение, которое является основным результатом данной работы.
Необходимо также отметить, что для реализаций управления
преследователя
и сигнала
которые являются результатом использования стратегии
адаптивного минимаксного управления
на промежутке времени
и для всех
удовлетворяют
соотношению (4.13), для всех допустимых реализаций
сигналов
для всех допустимых реализаций управления
преследователя
существует сигнал
такой,
что для всех
в силу (3.6) и (4.13)
имеют место следующие соотношения: