Обратная связь в задаче оптимального управления в классе смешанных стратегий

Красовский Андрей Николаевич

Аннотация статьи

Рассматривается и обосновывается схема и конструкция обратной связи на примере решения одной задачи оптимального управления по принципу обратно связи нелинейной динамической системой в классе смешанных стратегий. Задача решается при дефиците информации о действующей помехе. Критерий качества определяется расстоянием объекта до выбранного центра в момент окончания процесса управления.

Текст статьи

Введение. В работе рассматривается конструкция обратной связи для задачи оптимального конфликтного управления конкретным динамическим объектом – материальной точкой на горизонтальной плоскости [4]. Критерий качествапроцесса управления – расстояние от точки на плоскости в конечный момент времени до заданного центра (начала координат). Так как для конфликтно-управляемой динамической системы не выполняется так называемое условие седловой точки для маленькой игры [9] эффективное решение задачи установлено в классе смешанных стратегий в классе смешанных стратегий [2, 4, 12], т.е. используется некоторый вероятностный механизм формирования управления. Задача на минимакс выбранного критерия качества решается в рамках концепции, разрабатываемой в уральской школе по оптимальному управлению и дифференциальным играм Н.Н. Красовского [7, 8, 12] и решается методом экстремального сдвига на сопутствующие точки, предложенным автором [3, 5]. Основную роль в рассматриваемой конструкции играет некоторая модель-поводырь. Работа продолжает исследования автора по решению задач оптимального управления по принципу обратной связи [2, 4, 12].

Рис. 1. Движение объекта

Движение объекта. Рассмотрим объект (материальная точка М), двигающийся в горизонтальной плоскости в декартовой системе координат {q₁, q₂} под действием силы k[t] из работы [4] (рис. 1), описываемый векторным нелинейным дифференциальным уравнение в форме второго закона Ньютона [10]

(1)

где u₁, u₂ – суть проекции вектора силы управления u на оси q₁, q₂ (рис. 1), υ – помеха – угол люфта управляющей силы, t – время, начальный и конечный моменты времени t₀ и ϑ зафиксированы, P и Q – соответственно множества векторов u и углов υ, определяющие ресурсы органа управления U и органа V, вырабатывающего помехи (рис.2).В данном конкретном примере [4] множества P и Q определены следующим образом

(2)

Приведем систему (1) к нормальной форме [7]. Введем фазовый вектор

(3)

Тогда система (1) в нормальной форме принимает вид

(4)

где

(5)

Показатель качества. Как и в работе [4], цель управления – минимизировать расстояние от точки М в конечный момент времени t=ϑ от некоторого центра О (рис. 1). Тогда показатель (критерий) качества процесса управления задаётся в виде функционалаγ от движения
q[t₀[⋅]ϑ] = {q[t], t₀≤t≤ϑ} объекта (1-5)

(6)

Модель-поводырь. Будем рассматривать задачу [1-9, 11, 12] о выборе управленийu помех υ, соответственно минимиизирующих и максимизирующих критерий качества γ (6). В рассматриваемом случае для объекта (4, 5) не выполняется условие седловой точки для маленькой игры [9], т.е. – равенство

для любого вектора l ∈ R⁴. Известно, что в этом случае задача эффективно решается в классе, так называемых, смешанных стратегий [2, 10]. При этом используется некоторый вероятностный механизм для конструирования управлений

где P – набор из четырёх единичных, взаимно перпендикулярных векторов (2) и

(7)

моменты выбранного разбиения отрезка времени управления. В рассматриваемом случае роль такого поводыря для движения реального объекта играет некоторая виртуальная у-модель, включаемая в следующую схему управления по принципу обратной связи (рис. 2).

Рис. 2. Схема управления по принципу обратной связи в классе смешанных стратегий

Состояние такой компьютерной модели в текущий момент времени t определяется ее фазовым вектором y[t], размерность которого совпадает с размерностью фазового вектора x (3). Дифференциальное уравнение у-модели строится следующим образом. Каждой четверке аргументов t, x, y, ε, где ε>0 – некоторый малый параметр, выбираемый нами самими и влияющий на точность решения задачи, поставим в соответствие наборы чисел

(8)

Движение у-модели-поводыря определяется как решение пошагового дифференциального уравнения

(9)

при выбранных разбиении (7) и условиях (2), (5), (8).

Смешанная стратегия. Ключевым моментом рассматриваемой задачи является построение оптимальнойсмешанной стратегии управления, формирующей движение х-объекта (4), (5) по шагам выбранного разбиения (7). А именно, назовём смешанной стратегией в процессе управления с у-моделью-поводыремсовокупность S трёх функций

(10)

где функция

(11)

участвует в построении движенияx-объекта (4), (5) следующим образом. Движение объекта есть решение пошагового дифференциального уравнения

(12)

Здесь

(13)

Символ P(B) обозначает вероятность события В, P– множество (2). В (12) помеха – есть реализация помехи

– кусочно-измеримая по времени t функция – воздействие, формируемое либо внешней средой, либо предполагаемым противником в органе V (рис. 2).

Оптимальная смешанная стратегия

существует [2, 12]. При этом для её построения используются два метода – метод экстремального сдвига на сопутствующие точки, предложенный автором [3, 5, 12] и метод взаимного устойчивого отслеживания движении реального объекта (4) и его виртуальной модели-поводыря (9) [6, 12]. Реализация траектории движения объекта (1), порожденного оптимальной смешанной стратегией при конкретных исходных данных приведена в работе [4].

Список литературы

Айзекс Р. Дифференциальные игры. – M.: Мир, 1967.
Красовский А.А., Красовский А.Н. Нелинейная позиционная дифференциальная игра в классе смешанных стратегий // Тр. МИАН, 277, МАИК, – М., 2012.
Красовский А.Н. О формализации позиционной дифференциальной игры // Докл. АН СССР. 1981. Т. 257. № 4.
Красовский А.Н Ободной задаче оптимального управления в классе смешанных стратегий // Актуальные исследования. 2020. № (10) 13.
Красовский А.Н., Куанышев В.Т. Метод экстремального сдвига для оптимального управления в позиционной дифференциальной игре // Актуальные исследования. 2019. №1.
Красовский А.Н., Куанышев В.Т., Чой Ё. Об устойчивом взаимном отслеживании движений реального динамического объекта и его виртуальной модели-поводыря// Актуальные исследования. 2020. № (5) 8.
Красовский Н.Н. Теория управления движением. – М.: Наука, 1968.
Красовский Н.Н. Управление динамической системой. Задача на минимум гарантированного результата. – М.: Наука, 1985.
Мак-Кинси Дж. Введение в теорию игр. – М.: Мир, 1960.
Ньютон И. Математические начала натуральной философии / пер. с лат. и прим. А.Н. Крылова. – М.: Наука, 1989.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. – М.: Физматгиз, 1961.
Krasovskii A.N., Krasovskii N.N. Control Under Lack of Information. Boston: Birkhauser, 1994.

Обратная связь в задаче оптимального управления в классе смешанных стратегий

Похожие статьи

Другие статьи из раздела «Математика»