Том 6 N 2 2000
УДК 517.977
В теории позиционных дифференциальных игр хорошо известно, что непрерывные стратегии, вообще говоря, не доставляют наилучшего возможного результата. В данной работе приводится простой пример, показывающий, что похожее свойство выполняется для конфликтно управляемых систем, в которых один из двух игроков выбирает программное управление, а другой выбирает момент окончания игры, в который подсчитывается плата. Функционал платы зависит от фазового состояния в этот момент времени. Показано, что в этой управляемой системе никакое правило выбора момента окончания, описываемое непрерывным отображением, не может гарантировать соответствующему игроку ненулевой результат. Однако простые разрывные отображения могут обеспечить требуемый ненулевой результат. Приводятся два примера таких разрывных правил. Одно из них требует измерения фазового состояния только в один момент времени.
Позиционные дифференциальные игры [1-5] интенсивно изучаются в последние десятилетия. Свойства непрерывных стратегий в сравнении с разрывными изучались в [6]. Многозначные полунепрерывные сверху стратегии рассматривались в [7]. Наряду с другими вопросами, в [8] исследовались свойства стратегий, описываемых функциями Каратеодори. Систематическое введение в теорию позиционных дифференциальных игр требует обсуждения этих вопросов в некоторой форме. Так в [2] на стр. 17-24 обсуждался класс позиционных стратегий и соответствующие движения управляемой системы. В этой связи на стр. 18-21 в [2] был приведен пример двумерной дифференциальной игры, для которой был найден гарантированный результат по отношению к классам разрывных и непрерывных стратегий. Соответствующее доказательство в [2] использовало теорему Шаудера о неподвижной точке.
В [9] вышеупомянутая дифференциальная игра была модифицирована так, что один из двух игроков может выбирать момент времени, когда должна подсчитываться плата. Плата зависит от нормы фазового вектора в этот момент времени. Таким образом, показатель качества содержит переменную точку, которая может задавать момент окончания игры, назначаемый по обратной связи на основе измерений текущих значений фазового вектора. Интересно отметить, что эта постановка задачи напоминает хорошо известный вопрос о выборе правила остановки для случайного процесса [10, 11].
В [9] было показано, что в этой дифференциальной игре способы управления по обратной связи, описываемые непрерывными отображениями, имеют ограниченные возможности даже в случае практически полной текущей информации о процессе (включая его историю) во все моменты времени. С другой стороны, было сконструировано простое разрывное отображение, описывающее закон управления, доставляющий требуемый результат, используя лишь очень ограниченную текущую информацию и скромные возможности влиять на процесс.
Доказательство в [9] использовало теорему Какутани о неподвижной точке (соответствующее отображение в [9] оказывалось многозначным по техническим причинам.) Эффективность закона управления в упомянутой задаче непосредственно связана с существованием или несуществованием решений некоторой нелинейной краевой задачи в обыкновенных производных с зависящей от решения точкой в одном из двух краевых условий. Соответствующее краевое условие описывается нелинейным функционалом специального вида. Отметим, что нелинейные краевые задачи для функционально-дифференциальных уравнений с зависящими от решения точками в краевых условиях, возникающие в связи с тепловыми конфликтно управляемыми системами, рассматривались в [12, 13].
Цель статьи [9] состояла в рассмотрении модификации хорошо известной управляемой системы, используемой в теории дифференциальных игр в качестве модельного примера. Однако похожими свойствами, связанными с выбором момента окончания, обладают и некоторые более простые системы. В данной работе приводится такой пример. Рассматриваемая ниже управляемая система описывается простым скалярным дифференциальным уравнением, что позволяет значительно упростить доказательства и обойтись без теорем о неподвижных точках. Вместо них мы используем хорошо известный факт, что скалярная непрерывная функция, принимающая значения разных знаков на концах отрезка, обращается в нуль в некоторой точке.
При рассмотрении правил, которые ставят траектории в соответствие момент времени, естественно налагать условие неупреждаемости, см. (NA) ниже. Условия этого типа возникали в связи с различными задачами управления. Многозначный вариант условия, похожего на (NA), был введен в [14] на стр. 41 и использовался в [15] для конструирования процедур управления для моментов коррекции, количество которых ограничено сверху данной величиной. Процедуры позиционного выбора моментов коррекции игрового управления рассматривались в [16]. Стохастический вариант условия неупреждаемости для правил остановки можно найти например в [17], разд. III.6.