Моделирование одной антагонистической дифференциальной игры при динамических и информационных помехах в классе смешанных стратегий

Красовский Андрей Николаевич

Аннотация статьи

Рассматривается одна конкретная дифференциальная антагонистическая игра двух лиц. Задача решается при неполной информации о действующей помехе. Объект описывается нелинейным векторным дифференциальным уравнением, правая честь которого не удовлетворяет так называемому условию седловой точки в маленькой игру. Задача решается в классе смешанных стратегий, то есть используется некоторый вероятностны механизм формирования управляющих воздействий и помех по принципу обратной связи двух лиц. Задача решается при неполной информации о действующей помехе. одна конкретная дифференциальная антагонистическая игра. Объект описывается нелинейным векторным дифференциальным уравнением, правая честь которого не удовлетворяет так называемому условию седловой точки в маленькой игру. Задача решается в классе смешанных стратегий, то есть используется некоторый вероятностны механизм формирования управляющих воздействий и помех по принципу обратной связи.

Текст статьи

Введение. Рассматривается задача управления по принципу обратной связи конфликтно управляемым нелинейным динамическим объектом [11]. Так как для уравнения движения объекта нелинейного по управлению и помехе не выполняется условие седловой точки для маленькой игры [8]. Известно, что в таком случае задача эффективно решается в классе смешанных стратегий управления [3, 14], то есть используется некоторый вероятностный механизм формирования управлений и помех. Критерий качества процесса управления задаётся в виде некоторого конкретного функционала от движения объекта. Решается задача на минимакс и максимин выбранного критерия качества. При этом гарантированный результат достигается с вероятностью [10] сколь угодно близкой к единице. Особенность рассматриваемой дифференциальной игры заключается в наличии информационных и динамических случайных помех, ограниченных по математическому ожиданию [10]. Задача решается методом экстремального сдвига на сопутствующие точки, разработанным автором [2, 4, 14]. Приводятся результаты численной симуляции рассматриваемого процесса на ЭВМ. При решении задачи также используется блок взаимного отслеживания движений реального объекта и его виртуальной (компьютерной) модели [3, 5, 13, 14].

Управляемый объект. Рассматривается объект, движение которого описывается обыкновенным векторным нелинейным дифференциальным уравнением

(1)

Вектор управления u и вектор помехи υ стеснены условиямиЗдесь x – n-мерный фазовый вектор управляемого объекта; t – время, моменты времени начальный t₀ и конечный ϑ зафиксированы; u – r-мерный вектор управления, υ – s-мерный вектор помехи. Точка над буквой обозначает производную по времени.

u ∈ P, υ ∈ Q, (2)

где P и Q – ограниченные замкнутые множества векторов, т.е. – компакты. Они определяют ресурсы соответственно управляющего органа U и органа V, вырабатывающего помехи в схеме управления по принципу обратной связи (рис. 1).

В уравнении (1) h_ДИН – n-мерный вектор некоторой действующей на управляемую систему случайной динамической помехи (шума), про которую нам известно лишь, что она ограничена

где символ E{…} – математическое ожидание [10].

Кроме того в рамках концепции екатеринбургской школы по оптимальному управлению и дифференциальным играм рассматривается такая задача, когда помеха υ – и правило (стратегия), по которому она формируется в схеме управления по принципу обратной связи (рис. 1).

Рис. 1. Обратная связь

На рис. 1 информационный образ [3, 6], где Δ_inf – случайная информационная ошибка, такая, что в каждый момент времени

мы знаем только искаженную позицию (рис. 2) .

Рис. 2. Информационная ошибка

и ограничения на ошибку

Рассмотрим случай, когда выполняются условия

Кроме того, рассмотрим случай, когда множества P, Q (2) являются конечными наборами векторов управлений и помех, т.е.

В таком случае рассмотрим х-объект (1), (2), описываемый дифференциально-разностным уравнением [3, 5, 13]

(3)

Рассмотрим одну конкретную конфликтно-управляемую динамическую систему вида (3). А именно – систему вида

(4)

Такая нелинейная система не удовлетворяет так называемому условию седловой точки для маленькой игры [8], т.е. – условию

для любого двумерного вектора l.

Известно, что в таком случае задачу эффективно решать в классе смешанных стратегий [2, 3, 11, 14].

Критерий качества. Рассмотрим следующий конкретный критерий качества [2, 14, 15] процесса управления

и в рамках концепции антагониститческой дифференциальной игры двух лиц (игроков) [1-7; 9; 11-15] рассмотрим задачу о конструировании управлений, минимизирующих критерий качества и о формировании помех, максимизирующих его, т.е.

1 игрок:

2 игрок:

Такая задача рассматривалась и была представлена автором на пленарном докладе Международной конференции [15]. Решение этой задачи базируется на взаимном отслеживании движений моделей –лидеров первого и второго игроков [3, 5, 12, 13, 15] и на методе экстремального сдвига на сопутствующие точки [2, 4, 14].

Результаты численного эксперимента. Приведем результаты численного моделирования на ЭВМ рассматриваемой конкретной дифференциальной игры при следующих данных

В этом случае получили следующую картину оптимального с точки зрения обоих игроков движения

Рис. 3. Картина оптимального процесса

Как видно оптимальное движение объекта (ломанная линия) следует между движениями модели-поводыря первого игрока (нижняя кривая и модели-лидера второго игрока (верхняя линия.

Заключение. В работе приводится одна конкретная дифференциальная антагонистическая игра двух лиц. При решении этой игры используется метод управления по принципу обратной связи в классе смешанных стратегий [3, 14]. Результаты численного эксперимента достаточно хорошо иллюстрируют применяемую теорию, разработанную автором в работах [2, 4, 14].

Список литературы

Айзекс Р. Дифференциальные игры. – M.: Мир, 1967.
Красовский А.Н. О формализации позиционной дифференциальной игры // Докл. АН СССР. 1981. Т. 257. № 4.
Красовский А.Н. Блок взаимного отслеживания реального нелинейного динамического объекта и его компьютерной модели-лидера при динамических и информационных помехах // Актуальные исследования. 2021. №1.
Красовский А.Н., Куанышев В.Т. Метод экстремального сдвига для оптимального управления в позиционной дифференциальной игре // Актуальные исследования. 2019. № 1.
Красовский А.Н., Куанышев В.Т., Чой Я.С. Об устойчивом взаимном отслеживании реального динамического объекта и его виртуальной модели-поводыря // Актуальные исследования. 2020. № 5.
Красовский А.Н. Ладейщиков А.Н. Задача игрового управления при дефиците информации // Математическая теория игр и ее приложения. 2012. Т. 4. Вып. 2.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. – M.: Наука, 1974.
Мак-Кинси Дж. Введение в теорию игр. – М: Мир, 1960.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. – М.: Физматгиз, 1961.
Ширяев А.Н. Вероятность – М: Наука, 1980.
Krasovskii A.A., Krasovskii A.N. Nonlinear positional differential game in the class of mixed strategies //Proceedings of the Steklov Institute of Mathematics. 2012. Vol. 277.
Krasovskii A.N. Stochastic Stable Mutual Tracking Block for a Real -Dynamical Object and a Virtual Model-Leader. International Institute for Applied Systems Analysis, Interim Report IR-02-055 Laxenburg, Austria.
Krasovskii A.N., Choi Y.S. Stochastic Control with the Leaders-Stabilizers. Institute of Mathematics and Mechanics Ural Branch of RAS, Ekaterinburg (in English).
Krasovskii A.N., Krasovskii N.N. Control Under Lack of Information. Boston: Birkhauzer, 1994.
Krasovskii A.N. Construction of mutual tracking of motions of a real nonlinear dynamical system and its virtual model-leader // Materials of III International Seminar CGS 2020, dedicated to the 75th anniversary of Academician A.I. Subbotin. Ekaterinburg. October 2020 (ISBN 978-5-8295-0729-9).

Моделирование одной антагонистической дифференциальной игры при динамических и информационных помехах в классе смешанных стратегий

Похожие статьи

Другие статьи из раздела «Математика»