Обратная связь в задаче оптимального управления в классе смешанных стратегий
научный журнал «Актуальные исследования» #18 (21), сентябрь '20

Обратная связь в задаче оптимального управления в классе смешанных стратегий

Рассматривается и обосновывается схема и конструкция обратной связи на примере решения одной задачи оптимального управления по принципу обратно связи нелинейной динамической системой в классе смешанных стратегий. Задача решается при дефиците информации о действующей помехе. Критерий качества определяется расстоянием объекта до выбранного центра в момент окончания процесса управления.

Аннотация статьи
смешанная стратегия
обратная связь
вероятность
помеха
управление
нелинейная динамическая система
Ключевые слова

Введение. В работе рассматривается конструкция обратной связи для задачи оптимального конфликтного управления конкретным динамическим объектом – материальной точкой на горизонтальной плоскости [4]. Критерий качествапроцесса управления – расстояние от точки на плоскости в конечный момент времени до заданного центра (начала координат). Так как для конфликтно-управляемой динамической системы не выполняется так называемое условие седловой точки для маленькой игры [9] эффективное решение задачи установлено в классе смешанных стратегий в классе смешанных стратегий [2, 4, 12], т.е. используется некоторый вероятностный механизм формирования управления. Задача на минимакс выбранного критерия качества решается в рамках концепции, разрабатываемой в уральской школе по оптимальному управлению и дифференциальным играм Н.Н. Красовского [7, 8, 12] и решается методом экстремального сдвига на сопутствующие точки, предложенным автором [3, 5]. Основную роль в рассматриваемой конструкции играет некоторая модель-поводырь. Работа продолжает исследования автора по решению задач оптимального управления по принципу обратной связи [2, 4, 12].

Рис. 1. Движение объекта

Движение объекта. Рассмотрим объект (материальная точка М), двигающийся в горизонтальной плоскости в декартовой системе координат {q1q2} под действием силы k[t] из работы [4] (рис. 1), описываемый векторным нелинейным дифференциальным уравнение в форме второго закона Ньютона [10]

 (1)

где u1u2 – суть проекции вектора силы управления u на оси q1q2 (рис. 1), υ – помеха – угол люфта управляющей силы, t – время, начальный и конечный моменты времени t0 и ϑ зафиксированы, P и Q – соответственно множества векторов u и углов υ, определяющие ресурсы органа управления U и органа V, вырабатывающего помехи (рис.2).В данном конкретном примере [4] множества и Q определены следующим образом

 (2)

Приведем систему (1) к нормальной форме [7]. Введем фазовый вектор

  (3)

Тогда система (1) в нормальной форме принимает вид

  (4)

где

 (5)

Показатель качества. Как и в работе [4], цель управления – минимизировать расстояние от точки М в конечный момент времени t=ϑ от некоторого центра О (рис. 1). Тогда показатель (критерий) качества процесса управления задаётся в виде функционалаγ от движения 
q
[t0[⋅]ϑ] = {q[t], t0≤t≤ϑ} объекта (1-5)

 (6)

Модель-поводырь. Будем рассматривать задачу [1-9, 11, 12] о выборе управленийu помех υсоответственно минимиизирующих и максимизирующих критерий качества γ (6). В рассматриваемом случае для объекта (4, 5) не выполняется условие седловой точки для маленькой игры [9], т.е. – равенство

для любого вектора l ∈ R4. Известно, что в этом случае задача эффективно решается в классе, так называемых, смешанных стратегий [2, 10]. При этом используется некоторый вероятностный механизм для конструирования управлений

где P – набор из четырёх единичных, взаимно перпендикулярных векторов (2) и

(7)

моменты выбранного разбиения отрезка времени управления. В рассматриваемом случае роль такого поводыря для движения реального объекта играет некоторая виртуальная у-модель, включаемая в следующую схему управления по принципу обратной связи (рис. 2).

Рис. 2. Схема управления по принципу обратной связи в классе смешанных стратегий

Состояние такой компьютерной модели в текущий момент времени t определяется ее фазовым вектором y[t], размерность которого совпадает с размерностью фазового вектора x (3). Дифференциальное уравнение у-модели строится следующим образом. Каждой четверке аргументов t, x, y, ε, где ε>0 – некоторый малый параметр, выбираемый нами самими и влияющий на точность решения задачи, поставим в соответствие наборы чисел

 (8)

Движение у-модели-поводыря определяется как решение пошагового дифференциального уравнения


(9)

при выбранных разбиении (7) и условиях (2), (5), (8).

Смешанная стратегия. Ключевым моментом рассматриваемой задачи является построение оптимальнойсмешанной стратегии управления, формирующей движение х-объекта (4), (5) по шагам выбранного разбиения (7). А именно, назовём смешанной стратегией в процессе управления с у-моделью-поводыремсовокупность S трёх функций

(10)

где функция

 (11)

участвует в построении движенияx-объекта (4), (5) следующим образом. Движение объекта есть решение пошагового дифференциального уравнения

 (12)

Здесь

 (13)

Символ P(B) обозначает вероятность события В, P– множество (2). В (12) помеха – есть реализация помехи 

 – кусочно-измеримая по времени t функция – воздействие, формируемое либо внешней средой, либо предполагаемым противником в органе V (рис. 2).

Оптимальная смешанная стратегия

существует [2, 12]. При этом для её построения используются два метода – метод экстремального сдвига на сопутствующие точки, предложенный автором [3, 5, 12] и метод взаимного устойчивого отслеживания движении реального объекта (4) и его виртуальной модели-поводыря (9) [6, 12]. Реализация траектории движения объекта (1), порожденного оптимальной смешанной стратегией при конкретных исходных данных приведена в работе [4].

Текст статьи
  1. Айзекс Р. Дифференциальные игры. – M.: Мир, 1967.
  2. Красовский А.А., Красовский А.Н. Нелинейная позиционная дифференциальная игра в классе смешанных стратегий // Тр. МИАН, 277, МАИК, – М., 2012.
  3. Красовский А.Н. О формализации позиционной дифференциальной игры // Докл. АН СССР. 1981. Т. 257. № 4.
  4. Красовский А.Н Ободной задаче оптимального управления в классе смешанных стратегий // Актуальные исследования. 2020. № (10) 13.
  5. Красовский А.Н., Куанышев В.Т. Метод экстремального сдвига для оптимального управления в позиционной дифференциальной игре // Актуальные исследования. 2019. №1.
  6. Красовский А.Н., Куанышев В.Т., Чой Ё. Об устойчивом взаимном отслеживании движений реального динамического объекта и его виртуальной модели-поводыря// Актуальные исследования. 2020. № (5) 8.
  7. Красовский Н.Н. Теория управления движением. – М.: Наука, 1968.
  8. Красовский Н.Н. Управление динамической системой. Задача на минимум гарантированного результата. – М.: Наука, 1985.
  9. Мак-Кинси Дж. Введение в теорию игр. – М.: Мир, 1960.
  10. Ньютон И. Математические начала натуральной философии / пер. с лат. и прим. А.Н. Крылова. – М.: Наука, 1989.
  11. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. – М.: Физматгиз, 1961.
  12. Krasovskii A.N., Krasovskii N.N. Control Under Lack of Information. Boston: Birkhauser, 1994.
Список литературы
Ведется прием статей
Прием материалов
c 15 мая по 21 мая
Осталось 6 дней до окончания
Публикация электронной версии статьи происходит сразу после оплаты
Справка о публикации
сразу после оплаты
Размещение электронной версии журнала
25 мая
Загрузка в eLibrary
25 мая
Рассылка печатных экземпляров
02 июня