Главная
АИ #1 (4)
Статьи журнала АИ #1 (4)
Моделирование одной антагонистической позиционной дифференциальной игры

Моделирование одной антагонистической позиционной дифференциальной игры

Цитирование

Красовский А. Н., Куанышев В. Т. Моделирование одной антагонистической позиционной дифференциальной игры // Актуальные исследования. 2020. №1 (4). С. 6-10. URL: https://apni.ru/article/271-modelirovanie-odnoj-antagonisticheskoj-pozitsi

Аннотация статьи

Рассматривается задача об оптимальном управлении по принципу обратной связи для конкретной конфликтно-управляемой динамической системы при неполной информации о действующих помехах. Критерий качества процесса управления выбирается в виде функционала, зависящего от движения объекта и реализаций управлений и помех. Для конструирования оптимальных алгоритмов управления используется метод экстремального сдвига. Приводятся результаты численной симуляции процесса.

Текст статьи

Введение. Рассматриваемая задача на минимакс максимин критерия качества, зависящего от движения конкретного механического объекта и реализаций управления и помехи на заданном отрезке времени трактуется как антагонистическая дифференциальная игра двух лиц в рамках концепции екатеринбургской школы по оптимальному управлению Н.Н. Красовского [6, 7, 9]. Работа продолжает исследования авторов [4, 5].

Движение объекта. Рассмотрим точку единичной массы, двигающуюся в горизонтальной плоскости {q1, q2} под действием сил u  и υ. Тогда уравнение движения в форме второго закона Ньютона имеет вид

q=u+υ, (1)

P={u: ||u||=(u12+u22)1/2≤2},  u∈P, (2)

где q – двумерный вектор, u и υ – векторные управляющие воздействия, удовлетворяющие условиям:

Q={υ: ||υ||=(υ1222)1/2≤1},  υ∈Q. (3)

Задача. Критерий качества. Рассматривается задача [1-9] об управлениях u и помехах υ, которые соответственно минимизируют-максимизируют величину критерия качества процесса управления [4, 5, 9], заданного в виде функционала

, (4)

где uυ› = u1⋅υ1+u2⋅υ2,  ||q[ϑ]|| = (q12[ϑ] + q22[ϑ])1/2, t0≤t*≤ϑ,  t0=0,  ϑ=2.

Приведем систему (1) к нормальному виду

x1=x3

x2=x4

x3=u11

x4=u22.

(5)

Тогда функционал γ (2) примет вид

 (6)

В соответствии с известными результатами [3, 4, 7, 9] рассматриваемая дифференциальная игра для системы (5) с функционалом (6) имеет седловую точку {u0(⋅), υ0(⋅)} и цену ρ0(t, x). При этом стратегии u0(⋅)=u0(t, x, ε) и υ0(⋅)=υ0(t, x, ε), составляющие седловую точку, строятся конструктивно по известной цене игры ρ0(t, x).  Дифференциальная игра для - объекта (5) с критерием качества γ (6) принимает вид для нелинейного объекта с расширенным фазовым вектором

x={x1,..,x5}

и критерием качества

γ=γ(x[t0[⋅]ϑ] = {x[t], t0≤t≤ϑ|}),

где

x1=x3

x2=x4

x3=u11

x4=u22

x5=‹u⋅υ› = u1υ1+u2υ2.

(7)

Критерий качества γ имеет вид

γ=γ(x[t0[⋅]ϑ]) = ϕ(x[ϑ])+x5[ϑ]. (8)

и критерий качества (9) является позиционным функционалом [5].

Используя метод верхних выпуклых оболочек [9], получаем, что цена ρ0(ti, x[ti]) дифференциальной игры определяется по формуле

ρ0(ti, x[ti]) = ρ0(ti, x[ti])+x5[ti]. (9)

Cогласно [9], имеем

  (10)

где

 (11)

 

По известной цене игры ρ0(ti, x[ti]) будем строить стратегии u0(⋅)=u0(t, x, ε) и υ0(⋅)=υ0(t, x, ε) в соответствии с конструкциями экстремального сдвига на сопутствующие точки из работы авторов [4, с. 9].

Пусть реализовалась позиция {ti, x[ti]. В данном примере сопутствующие точки [4, с. 10] будем искать следующим приближенным способом. А именно, вместо того, чтобы искать точки, в которых достигается минимум и максимум цены дифференциальной игры ρ0(ti, x[ti]) в моменты ti,  i=1,...,k в схеме управления по принципу обратной связи ([4], рис. 1) при достаточно малом ε>0 будем просто искать точки пересечения с границей области Κ(ε) ([4], рис. 2) вектора градиента su[ti]=[gradxρ0(ti, x)]x[ti] и вектора sυ[ti], противоположного градиенту. При этом, было доказано в [9], что оптимальные стратегии
u0(⋅) и υ0(⋅) от величины x*5 не зависят.

Имеем

 (12)

Таким образом, оптимальная стратегия u0(⋅)=u0(t, x, ε) есть правило, которое любой возможной позиции {t*, x*}  ставит в соответствие вектор u0={u10, u20} ∈ P (2), удовлетворяющий условию

 (13)

где

su[t]= r0(ϑ-ti)⋅(x1[ti]+x3[ti](ϑ-ti)) / k[ti],

sυ[ti]=r0(ϑ-ti)⋅(x2[ti]+x4(ϑ-ti)) / k[ti],  y[ti]=1, (14)

здесь r0 – максимизирующее значение для (10), и

k[ti]=((x1[ti]+x3[ti](ϑ-ti))+ (x2[ti]+x4(ϑ-ti))2)1/2. (15)

Оптимальная стратегия υ0(⋅)=υ0(t, x, ε) есть правило, которое любой возможной позиции {t[ti], x[ti]} ставит в соответствие вектор υ0={υ10, υ20} ∈ Q (3), удовлетворяющий условию

 (16)

При этом управления u0[ti[⋅]ti+1) = {u0[t] = u0[ti] ∈ P, t≤ t≤ ti+1, i=1,…, k} и υ0[ti[⋅]ti+1) = {υ0[t] = υ0[ti] ∈ Q, ti ≤ t ≤ ti+1} определяются следующими формулами:

 (17)

 (18)

В (17) и (18) t∈ Δδ{ti},  i=1,…, k+1, где Δδ{ti} разбиение отрезка времени [t0, ϑ]  точками ti, так что

ti+1-ti≤δ. (19)

Численный эксперимент. Приводятся результаты численного эксперимента при следующих исходных данных: t*=0,  x*1=4.0,  x*2=3.0,  x*3=2.0,  x*4=1.0,  ϑ=2.0, δ=0.001. При этих данных цена игры ρ0(t*, x*)=6.601. На рисунке 1 приведена траектория движения объекта при u(⋅)=u0(⋅) и υ(⋅)=υ0(⋅). Здесь получили γ≅ρ0(t*, x*)=6.602. На рисунке 2 – траектория движения при u(⋅)=u0(⋅) и υ[t]={υ1[t]=cosπt, υ2[t]=sinπt}, t≤ t ≤ ϑ, т.е. υ(⋅)≠υ0(⋅). Здесь получили γ=6.085<ρ0(t*, x*)=6.601. На рисунке 3 – траектория движения при υ(⋅)=υ0(⋅) и u[t]={u1[t]=2cosπt, u2[t]=2sinπt},  t*≤t≤ϑ, т.е. u(⋅)≠u0(⋅). Здесь получили γ=8.302>ρ0(t*, x*)=6.601.

Рис. 1. u – оптимальное, υ – оптимальное

Рис. 2. u – оптимальное, υ1=cos(π t),  υ2=sin(π t)

Рис. 3. υ – оптимальное, u1=2cos(π t),  u2=2sin(π t)

Результаты проведенного эксперимента полностью согласуются с теорией.

Список литературы

  1. Айзекс Р. Дифференциальные игры. – M.: Мир, 1967.
  2. Красовский А.А., Красовский А.Н. Нелинейная позиционная дифференциальная игра в классе смешанных стратегий // Тр. МИАН, 277, МАИК, – М., 2012.
  3. Красовский А.Н. О позиционной дифференциальной игры // Докл. АН СССР. 1981. Т. 257. № 4.
  4. Красовский А.Н., Куанышев В.Т. Метод экстремального сдвига для оптимального управления в позиционной дифференциальной игре // Актуальные исследования. 2019. № 1.
  5. Красовский А.Н., Куанышев В.Т. Обратная связь в задачах позиционного минимаксного управления // Естествознание, техника, технологии: современные парадигмы и практические разработки: сб. материалов международной научн.-практ. конференции, г. Белгород, 30 октября 2019 г. – Белгород: ООО Агентство перспективных научных исследований, 2019.
  6. Красовский Н.Н. Теория управления движением. – М.: Наука, 1968.
  7. Красовский Н.Н. Управление динамической системой. Задача на минимум гарантированного результата. – М.: Наука, 1985.
  8. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. – М.: Физматгиз, 1961.
  9. Krasovskii A.N., Krasovskii N.N. Control Under Lack of Information. Boston: Birkhauser, 1994.

Поделиться

5120
Обнаружили грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики)? Напишите письмо в редакцию журнала: info@apni.ru

Похожие статьи

Другие статьи из раздела «Математика»

Все статьи выпуска
Актуальные исследования

#14 (300)

Прием материалов

28 марта - 3 апреля

осталось 5 дней

Размещение PDF-версии журнала

8 апреля

Размещение электронной версии статьи

сразу после оплаты

Рассылка печатных экземпляров

22 апреля