Блок взаимного отслеживания реального нелинейного объекта и его компьютерной модели-лидера при динамических и информационных помехах
научный журнал «Актуальные исследования» #1 (28), январь '21

Блок взаимного отслеживания реального нелинейного объекта и его компьютерной модели-лидера при динамических и информационных помехах

Рассматривается задача взаимного устойчивого отслеживания реального нелинейного по управлениям и помехам динамического объекта и его виртуальной – компьютерной модели-лидера. Используется схема управления по принципу обратной связи в классе смешанных стратегий управления. Задача решается при дефиците информации о действующих на объект динамических помехах. Для формирования управляющих воздействий используется информационный образ с учётом информационных помех. Задача эффективно решается методом экстремального сдвига на сопутствующие точки, разработанным автором.

Аннотация статьи
экстремальный сдвиг
помеха
управление
модель-лидер
информационная ошибка
нелинейная система
близость движений
Ключевые слова

Ведение. Рассматривается задача [1-13] о построении блока взаимного устойчивого отслеживания реального динамического нелинейного объекта и его компьютерной (виртуальной модели-лидера (поводыря). Задача решается в условиях дефицита (неполной информации о действующих на объект динамических помехах. Кроме того рассматривается случай когда информации о позиции объекта в каждый текущий момент времени в схеме управления по принципу обратной связи поступает с искажением (неточность или ошибка в измерении), что вообще говоря, соответствует реальной ситуации позиционного управления. Рассматривается случай когда нелинейная по управлению и помехе функция f(…) не удовлетворяет так называемому условию седловой точки в маленькой игре [12]. Поэтому задача взаимного отслеживания движений объекта и модели-поводыря решается в классе смешанных стратегий, т.е. используется некоторый вероятностны механизм формирования управлений для объекта и модели. Однако, доказывается что при этом близость движений на всем отрезке времени управления обеспечивается (гарантируется) с вероятностью сколь угодно близкой к единице. Такие задачи отслеживания движений реального объекта и его компьютерной модели занимают достаточно большое место среди задач управления в технике, экономике и т.д. Задача решается в рамках концепции, разрабатываемой в уральской школе по оптимальному управлению и дифференциальным играм Н.Н. Красовского [6, 12]. Для построения оптимальной стратегии управления, используется метод экстремального сдвига [2, 3], предложенный автором. Задача докладывалась в пленарном докладе автора на международной конференции в октябре 2020 года [13].

Управляемый объект. Рассматривается объект, движение которого описывается обыкновенным векторным нелинейным дифференциальным уравнением

  (1)

Здесь x  – n-мерный фазовый вектор управляемого объекта; t – время, моменты времени начальный t0 и конечный ϑ зафиксированы; u – r-мерный вектор вектор управления,  υ – s-мерный вектор помехи. Точка над буквой обозначает производную по времени.

Вектор управления  и вектор помехи  стеснены условиями

  (2)

В уравнении (1)  n-мерный вектор некоторой действующей на управляемую систему случайной динамической помехи (шума), про которую нам известно лишь, что она ограниченагде P и Q – ограниченные замкнутые множества векторов, т.е. – компакты. Они определяют ресурсы соответственно управляющего органа U и органа V, вырабатывающего помехи в схеме управления по принципу обратной связи (рис. 1).

где символ E{…} – математическое ожидание [8].

Кроме того в рамках концепции екатеринбургской школы по оптимальному управлению и дифференциальным играм рассматривается такая задача, когда помеха  - и правило (стратегия), по которому она формируется в схеме управления по принципу обратной связи [1-13] (рис. 1).

Рис. 1. Обратная связь

На рис. 1

информационный образ и Δinf

случайная информационная ошибка, такая, что в каждый момент времени

мы знаем только искаженную позицию (рис. 2)

и ограничения на ошибку

Рис. 2. Информационная ошибка

Рассмотрим случай, когда выполняются условия

Кроме того, рассмотрим случай, когда множества P, Q (2) являются конечными наборами векторов управлений и помех, т.е.

В таком случае рассмотрим х-объект (1), (2), описываемый дифференциально-разностным уравнением

  (3)

Модель-лидер. Для x-объекта (3) рассмотрим следующую z-модель-лидер (поводырь)

(4)


где

И вектор-функция f и множества PQ те же, что и для х-объекта (3).

Конструкции управлений для х-объекта и z-модели. Укажем способ формирования правлений u для х объекта, основанный на некотором вероятностном механизме и «управлений» q для z-модели, обеспечивающий близость движений объекта и модели на всем отрезке времени управления. Этот способ основан на методе экстремального сдвига [2, 3, 12].

В момент tk мы выбираем вектор

для реального х-объекта (3) с помощью случайного теста с вероятностью [8]

при условиях

Эти вероятности мы выбираем из так называемого условия минимаксного экстремального сдвига

 (5)

В (5) мы имеем (рис. 3)  

Рис. 3. Экстремальный сдвиг

Далее, пусть «управления» - вероятности

для компьютерной z-модели-лидера выбираются из условия максиминного экстремального сдвига

 (6)

При этом вероятности {qj}, которые определяют стохастические помехи

Для х-объекта (3) и “действия” {pi} для z-модели (4) могут быть любыми, удовлетворяющими условиям

Взаимное отслеживание в комбинированном процессе {x-объект, z-модель-лидер}. Справедлива следующая теорема.

Теорема. При описанном выше выборе (5) и (6) случайного действия u для x-объекта (3) и «действий» q для z-модели (4), для любых выбранных заранее чисел

существуют достаточно малые числа

такие, что выполняется следующее неравенство (условие близости)

(7)

если

где вt (7)

(8)

функция Ляпунова, λ>0 – постоянная, ограничивающая норму матрицы A(tв (1).

Символ l P(…) i в левой части (3) обозначает вероятность [8] всех реализаций движений {x[t],z[t]}, каждое из которых удовлетворяет неравенству

ω обозначает элементарное событие [8], которое принадлежит множеству всех элементарных событий для соответствующих реализаций

Эта теорема формально означает следующее.

Если мы выбираем в каждый момент времени tkk=0,…,K управление для объекта (1), (3) как результат случайного испытания из (5), т.е.

и выбираем для модели (4) набор

из (6), тогда для каждой возможной помехи

для х-объекта (3) и набора

для z-модели (4) будут выполнены следующие условия.

Движения х-объекта (3) и z-модели (4) будут близки (взаимно отслеживать друг друга) в смысле (7), (8) с вероятностью сколь угодно близкой к единице (рис. 4)

Рис. 4. Близость движений

Идея доказательства этой теоремы опубликована в работах [10, 11, 13].

Заключение. В работе предложена эффективная конструкция блока взаимного отслеживания движений реального динамического нелинейного объекта и его виртуальной модели-лидера. Данная конструкция была опробована на широкомасштабном вычислительном эксперименте для некоторых конкретных механических объектов на плоскости и в трёхмерном пространстве [11].

Текст статьи
  1. Айзекс Р. Дифференциальные игры. – M.: Мир, 1967.
  2. Красовский А.Н. О формализации позиционной дифференциальной игры // Докл. АН СССР. 1981. Т. 257. № 4.
  3. Красовский А.Н., Куанышев В.Т. Метод экстремального сдвига для оптимального управления в позиционной дифференциальной игре // Актуальные исследования. 2019. № 1.
  4. Красовский А.Н., Куанышев В.Т., Чой Я.С. Об устойчивом взаимном отслеживании реального динамического объекта и его виртуальной модели-поводыря // Актуальные исследования. 2020. № 5.
  5. Красовский А.Н. Ладейщиков А.Н. Задача игрового управления при дефиците информации // Математическая теория игр и ее приложения. 2012. Т. 4. Вып. 2.
  6. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. – M.: Наука, 1974.
  7. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. – М.: Физматгиз, 1961.
  8. Ширяев А.Н. Вероятность – М: Наука, 1980.
  9. Krasovskii A.A., Krasovskii A.N. Nonlinear positional differential game in the class of mixed strategies //Proceedings of the Steklov Institute of Mathematics. 2012. Vol. 277.
  10.  Krasovskii A.N. Stochastic Stable Mutual Tracking Block for a Real-Dynamical Object and a Virtual Model-Leader. International Institute for Applied Systems Analysis, Interim Report IR-02-055 Laxenburg, Austria.
  11. Krasovskii A.N., Choi Y.S. Stochastic Control with the Leaders-Stabilizers. Institute of Mathematics and Mechanics Ural Branch of RAS, Ekaterinburg (in English).
  12. Krasovskii A.N., Krasovskii N.N. Control Under Lack of Information. Boston: Birkhauzer, 1994.
  13. Krasovskii A.N. Construction of mutual tracking of motions of a real nonlinear dynamical system and its virtual model-leader // Materials of III International Seminar dedicated to the 75th anniversary of Academician A.I. Subbotin. Ekaterinburg. October 2020.
Список литературы
Ведется прием статей
Прием материалов
c 12 июня по 18 июня
Осталось 7 дней до окончания
Публикация электронной версии статьи происходит сразу после оплаты
Справка о публикации
сразу после оплаты
Размещение электронной версии журнала
22 июня
Загрузка в eLibrary
22 июня
Рассылка печатных экземпляров
30 июня