Архитектурно-методические основы разработки программных средств оценки надёжности и рисков для авиационных и вертолётных технических систем

Турулин Алексей Олегович

Введение

Авиационная отрасль в настоящее время переживает этап технологической перестройки, вызванной необходимостью поддержания предельно высокого уровня безопасности на фоне стремительного усложнения технических комплексов. Смещение акцента от жёстко связанных механических систем к программно-конфигурируемым архитектурам, формирующим концепцию Software-Defined Aircraft, принципиально меняет требования к инженерии надёжности. По сведениям Международной ассоциации воздушного транспорта, глобальный коэффициент аварийности в 2019 году составил 0,92 случая на миллион рейсов, что свидетельствует об улучшении по сравнению со средним пятилетним показателем [1]. Вместе с тем данные за 2021 год демонстрируют сохранение нестабильности: в Российской Федерации зарегистрировано 3 авиационных происшествий, а число погибших достигло 32 человек [3]. Подобная динамика указывает на то, что применяемые подходы к оценке риска нередко отстают от реальных темпов изменения эксплуатационной среды.

Основная часть используемых программных решений в области анализа надёжности была сформирована в рамках прежней технологической парадигмы и потому по-прежнему опирается на статичные модели и значительный объём ручного ввода. Одновременно с этим современные авиационные электронные комплексы продуцируют колоссальные массивы данных в непрерывном режиме. Проблематика состоит в отсутствии полноценной архитектурной связки между физическим уровнем воздушного судна и аналитическими платформами верхнего уровня. На этом фоне важность приобретает разработка методологических оснований для создания программного обеспечения, способного в реальном времени интерпретировать потоки телеметрии, прогнозировать деградационные процессы в узлах и формировать доказательную основу, необходимую для сертификации по стандартам SAE ARP4754A и ARP4761 [4].

Наиболее сложной областью остаётся оценка надёжности вертолётной техники. В отличие от самолётных систем, эксплуатация вертолётов связана с воздействием интенсивных вибрационных и динамических нагрузок, вследствие чего трансмиссии и редукторные узлы оказываются особенно чувствительными к усталостному разрушению. Практика эксплуатации вертолётов семейства H225M показала, что критические отказы могут развиваться из микродефектов, не фиксируемых стандартными средствами контроля вплоть до достижения предельного состояния [5; 6, с. 215-224]. В связи с этим создание программных средств, сочетающих алгоритмы машинного обучения для анализа вибрационных паттернов с процедурами обнаружения ферромагнитных включений в масле, приобретает для вертолётостроения стратегический характер [7, с. 369-384]. Исходя из этого, цель статьи заключается в теоретическом и прикладном обосновании системного подхода к проектированию архитектуры программного обеспечения RAMS, объединяющего вычислительный потенциал облачной инфраструктуры, адаптивность микросервисной организации и строгость формально-верификационных методов. Дальнейшее изложение сосредоточено на материалах и методах проектирования подобных систем, анализе актуальных IT-тенденций в авиационной сфере и прикладных рекомендациях по созданию аналитических модулей оценки риска.

Научная новизна исследования заключается в разработке архитектурно-методического подхода к созданию программных средств RAMS нового поколения, интегрирующего Cloud-Native-архитектуру, MBSE/MBSA-моделирование, вероятностные модели надёжности и методы машинного обучения для проактивной оценки рисков и технического состояния авиационных и вертолётных систем.

Авторская гипотеза состоит в том, что объединение микросервисной облачной архитектуры, модельно-ориентированной системной инженерии и интеллектуального анализа телеметрических и HUMS-данных позволит существенно повысить точность, оперативность и прогностическую ценность оценки надёжности и рисков по сравнению с традиционными статическими RAMS-подходами

Материалы и методы

Исследование выстроено на основе комплексной методологии, в которой объединены классические положения теории надёжности и прикладные инструменты современной программной инженерии. Концептуальная рамка работы опирается как на нормативно-правовую базу Российской Федерации, прежде всего на серию ГОСТ Р 27, так и на международные стандарты аэрокосмической отрасли, разработанные в системах SAE и ISO. Важное значение при этом имеют положения ГОСТ Р 27.301–2011 и ГОСТ Р 27.003–2011, регламентирующие управление надёжностью и спецификации технического обслуживания; именно эти требования рассматриваются как подлежащие цифровому воспроизведению в структуре создаваемого программного обеспечения [8].

Количественная оценка рисков в составе программных средств основывается на вероятностном аппарате, использующем распределение Вейбулла, что позволяет учитывать вариативность интенсивности отказов на различных стадиях жизненного цикла системы от начального периода приработки до фазы изнашивания. В вычислительных модулях реализуются алгоритмы определения динамической ёмкости и вероятности выживания компонентов, а сама вероятность безотказного функционирования описывается соответствующей функцией, в которой параметр масштаба трактуется как характеристическое время жизни, тогда как параметр формы отражает природу механизма отказа [9]. Программное воплощение таких моделей требует сопряжения с инструментарием анализа деревьев отказов и анализа видов, последствий и критичности отказов. В этой связи в исследовании рассматривается переход к автоматизированному построению деревьев отказов на основе архитектурных моделей систем, сформированных в логике Model-Based Systems Engineering [9; 10, с. 281-294].

Архитектурная основа анализируемых программных решений выстраивается в парадигме Cloud-Native, что предопределяет выбор соответствующего технологического стека. Принципиальное значение приобретает микросервисная организация, при которой система декомпозируется на независимые сервисы, отвечающие за расчёт вероятностных показателей, сбор телеметрической информации, визуализацию рисков и контроль соответствия требованиям, а взаимодействие между ними осуществляется посредством облегчённых API [11, с. 1-8; 12]. Для обеспечения масштабируемости и изоляции вычислительных ресурсов, что особенно важно при параллельном мониторинге целого авиапарка, предусматривается применение контейнеризации и оркестрации на базе Docker и Kubernetes [13; 14, с. 308-317]. Потоковая обработка данных HUMS в режиме реального времени связывается с использованием событийно-ориентированных платформ, в частности Apache Kafka [15]. Одновременно интеграция принципов DevSecOps и механизмов непрерывной верификации в конвейер CI/CD позволяет переносить процедуры проверки безопасности и надёжности непосредственно в процесс разработки, обеспечивая обнаружение до 92% уязвимостей и логических дефектов ещё до ввода системы в эксплуатацию [16, 17].

При анализе надёжности вертолётных систем использовались специализированные методы обработки информации бортовых самописцев. В исследовательскую базу включены данные по редукторам вертолётов H225M и Bell UH-1H, а сама методика предполагала предварительную обработку 322 полётных атрибутов, их фильтрацию и последующее сокращение до 53 наиболее информативных статистических показателей. На этой основе применялись алгоритмы логистической регрессии и решающих деревьев, предназначенные для классификации технического состояния узла по бинарной схеме «норма/отказ» [6, с. 215-224]. Результативность прогностических моделей оценивалась по метрикам точности, полученным в рамках PHM Data Challenge 2021; при этом гибридные подходы продемонстрировали уровень 0,94 [18].

Методологическая конструкция исследования дополняется подходом HEDF, ориентированным на прогнозирование дефектов уже в самом коде RAMS-систем с опорой на когнитивные механизмы ошибок разработчиков. Материалы, полученные при изучении деятельности 55 программистов, показали, что 41,8% дефектов связаны с пост-завершающими сценариями, вследствие чего возникает необходимость включения в инструментарий разработки специализированных фильтров и процедур проверки уже на уровне требований [19, с. 77-82].

Результаты и обсуждение

Статистический анализ материалов за последние годы позволяет зафиксировать ряд устойчивых тенденций, непосредственно определяющих требования к программному обеспечению, предназначенному для оценки рисков в авиационной сфере. На мировом уровне прослеживается сокращение частоты инцидентов, однако уровень тяжести последствий в случае отдельных происшествий по-прежнему остается значительным, что указывает на необходимость смещения акцента с формального учета числа событий на более глубокую прогностическую оценку их потенциальной критичности.

Ниже в таблице 1 будет представлена статистика безопасности полетов.

Таблица 1

Сравнительная статистика безопасности полетов по данным IATA (составлено автором на основе [1, 2])

Регион/показатель	Частота происшествий (на 1 млн рейсов, 2021)	Пятилетнее среднее (2020-2021)	Риск гибели
Весь мир	1.13	1.25	0.06
Европа	1.02	1.02	0.03
Латинская Америка	1.77	2.00	0.35
Реактивные суда (мир)	0.06	0.10	<0.01
Турбовинтовые суда (мир)	0.83	1.12	0.14

Материалы таблицы 1 показывают, что программные средства, предназначенные для оценки рисков, должны проектироваться с учетом как региональной специфики эксплуатации, так и различий между типами воздушных судов. Существующее расхождение в уровне риска между турбовинтовыми и реактивными самолетами, достигающее почти четырнадцатикратного значения, указывает на необходимость более плотного, детализированного и регулярного анализа эксплуатационных данных именно для турбовинтового сегмента. Российская статистика за 2021 год фиксирует 3 аварии и 32 катастрофы [3]. При этом, несмотря на сокращение общего числа происшествий на 32%, что может интерпретироваться как косвенный эффект расширения цифрового мониторинга, увеличение смертности свидетельствует о сохраняющейся уязвимости по линии критических отказов систем управления и требует переноса исследовательского акцента с количественного учета событий на углубленный анализ их предельной тяжести [3].

Одним из выводов исследования становится необходимость включения программных средств RAMS непосредственно в контур проектирования авиационных систем. Модельно-ориентированная оценка безопасности позволяет устранить разрыв между проектной документацией и фактическими характеристиками надежности, формируя единую цифровую среду, в которой проектные решения и процедуры анализа риска развиваются синхронно. Использование инструментов типа VERDICT обеспечивает возможность выявления сценариев атак и отказов уже на ранних стадиях жизненного цикла за счет автоматической генерации деревьев атак и защитных контуров [11, с. 1-8]. Значимость данного подхода определяется тем, что модель безопасности сохраняет соответствие актуальной архитектуре системы, вероятностный анализ выполняется автоматически при каждом изменении проектного решения, а диагностика позволяет выделять минимальные наборы компонентов, нарушение функционирования которых приводит к несоответствию требованиям безопасности [11, с. 1-8]. В этом контексте дальнейшее развитие RAMS-систем связывается с переходом к цифровым двойникам, способным не только фиксировать текущее состояние объекта, но и в реальном времени проигрывать сценарии типа «что, если», используя актуальные телеметрические данные [20, с. 1-35].

Перенос авиационных систем в облачную среду требует существенно более строгой архитектурной адаптации, чем в традиционных IT-приложениях, поскольку стандартные облачные подходы не учитывают критичность временных и логических ограничений, присущих задачам безопасности полетов. В отличие от потребительского программного обеспечения, где допустима модель eventual consistency, авиационные средства оценки рисков нуждаются в строгой согласованности данных. По этой причине применяются механизмы кворумного чтения и записи, а также схемы активного резервирования, включая архитектуры типа «2 из 3», обеспечивающие достоверность результатов даже при выходе из строя одного из узлов кластера [23]. Не менее существенным оказывается и вопрос масштабирования. Типовые механизмы автоскейлинга Kubernetes способны порождать непредсказуемые задержки в обработке критически значимых тревожных сигналов вследствие неконтролируемой миграции подов, поэтому архитектура RAMS-программ должна предусматривать жестко ограниченное масштабирование, при котором число узлов детерминировано, а задачи оценки безопасности обладают безусловным приоритетом по отношению к фоновой аналитике [22, с. 442-470]. Дополнительное значение приобретает гибридная Edge-Cloud-модель, в рамках которой функции с минимально допустимым временем отклика, включая детекцию пожара и критической вибрации, реализуются на периферийном уровне, тогда как вычислительно емкая аналитика и долгосрочное прогнозирование надежности выносятся в облако. Подобное распределение вычислительных контуров позволяет обеспечить соответствие требованиям IEC 61508 в части временных характеристик реагирования [22, с. 442-470].

Особая роль в исследовании отводится разработке программных модулей для мониторинга вертолетных редукторов. Анализ катастрофы в Норвегии, а также последующие исследования эксплуатации парка H225M показали ограниченность классических методов контроля металлических частиц применительно к ряду форм усталостного износа планетарных шестерен [6, с. 215-224]. Вследствие этого программные средства нового поколения должны строиться на принципах многофакторного анализа, при котором сведения от магнитных пробок интерпретируются совместно с вибрационными спектрами и параметрами полета, включая крутящий момент, высоту и температуру масла. Отдельное место занимает использование методов машинного обучения для распознавания частиц и отделения шумовых сигналов от реальных признаков разрушения зуба шестерни. Предварительная обработка данных с учетом продолжительности полетов и консолидация информации в суточных интервалах заметно повышают точность прогноза [7, с. 369-384]. Не менее важным является переход к автоматизированному расчету динамической емкости трансмиссии, основанному не на календарной продолжительности эксплуатации, а на фактической наработке компонентов, что позволяет существенно точнее оценивать остаточный ресурс узлов [9].

Для выработки требований к программному обеспечению нового поколения в исследовании также был проведен сравнительный анализ существующих рыночных решений, что позволило определить как их функциональные ограничения, так и направления дальнейшего архитектурного развития (табл. 2).

Таблица 2

Сравнение функциональных возможностей программных комплексов RAMS (составлено автором на основе [21, с. 41-63])

Параметр	RAM Commander (ECE)	Robin RAMS	Reliability Workbench	Предлагаемая Cloud-Native платформа
Базовая архитектура	Enterprise-сервер, SQL	Легкий настольный клиент	Монолитная	Микросервисная (K8s)
Интеграция с MBSE	Прямая связь с SysML/AADL	Ограниченная	Через модули импорта	Полная (API-first)
Анализ в реальном времени	Средний уровень (периодический)	Низкий	Низкий	Высокий (потоковый)
Поддержка вертолетных HUMS	Через доп. модули	Нет	Ограниченная	Встроенная поддержка ML-моделей
Соответствие стандартам	ARP4761, MIL-217, DO-178	ARP4754, ARP4761	IEC 61508, ISO 26262	Все вышеперечисленные + IEC 62443

Сопоставительный анализ показал, что применяемые в настоящее время решения, включая RAM Commander, демонстрируют высокую эффективность при выполнении задач статической сертификации и реализации концепции fail-safe design, однако их функциональная архитектура остается недостаточно адаптированной к сопряжению с современными платформами Big Data, используемыми авиакомпаниями. Вследствие этого формируется запрос на программные продукты нового поколения, способные устранить данный разрыв за счет облачной масштабируемости, а также за счет возможности обучения прогностических моделей на актуальных эксплуатационных данных [23].

Распространение искусственного интеллекта в авиационной сфере одновременно открывает новые технологические перспективы и порождает дополнительные риски. Согласно прогнозным оценкам, к 2025 году объем рынка цифровых сервисов в авиации должен достичь 817,5 млрд долларов [15]. Одним из наиболее значимых направлений становится внедрение объяснимого искусственного интеллекта в системы предиктивного обслуживания. Практика крупных авиаперевозчиков, в том числе Lufthansa и Emirates, уже демонстрирует результативность алгоритмов в задачах динамического ценообразования и оптимизации маршрутов, однако в контуре систем безопасности требования к прозрачности алгоритмических решений оказываются существенно более жесткими [21, с. 41-63]. В связи с этим программные средства оценки рисков должны обеспечивать полную прослеживаемость данных, при которой каждое решение системы, включая рекомендации по замене двигателя, опирается на неизменяемую историю исходных массивов данных [20, с. 1-35]. Не менее важным выступает управление метаданными, основанное на применении каталогов данных для поддержания семантической согласованности между эксплуатационной, технической и метеорологической информацией [20, с. 1-35]. Существенное значение приобретает и автоматизированный комплаенс, предполагающий использование интеллектуальных движков, непрерывно анализирующих потоки данных на предмет соответствия требованиям ICAO и GDPR и формирующих предупреждения еще до проведения формальных аудиторских процедур [2; 14, с. 308-317].

Одновременно микросервисная архитектура, обеспечивая гибкость и модульность, приводит к заметному расширению поверхности атак, увеличивая число потенциальных векторов угроз в среднем в 3,5 раза по сравнению с монолитными системами [17]. Для программного обеспечения, предназначенного для оценки рисков, это означает необходимость выстраивания комплексной модели защиты, охватывающей безопасное кодирование, криптографическую защиту и встроенное обеспечение нормативного соответствия. На уровне разработки критически значимой становится валидация входных данных на каждой границе сервиса. На уровне хранения и передачи информации обязательным условием выступает применение TLS для данных в движении и AES-256 для данных в покое. На уровне организационно-технологической интеграции необходимым является включение требований PCI DSS, GDPR и специализированных авиационных норм безопасности непосредственно в конвейеры CI/CD [17]. Эмпирические данные показывают, что организации, реализовавшие подобные интегрированные стратегии в логике DevSecOps, сокращают количество инцидентов информационной безопасности на 62% в течение двухлетнего периода [17].

Заключение

Проведённое исследование архитектурных и методологических оснований разработки программных средств для оценки надёжности и рисков позволяет выделить базовые принципы формирования современных RAMS-систем в авиационной сфере. Прежде всего, определяющее значение приобретает отказ от разрозненных расчётных модулей в пользу интегрированных цифровых платформ, построенных на микросервисной архитектуре и реализующих принципы Cloud-Native. Такой подход создаёт необходимый уровень масштабируемости для обработки потоков HUMS-данных в режиме реального времени и обеспечивает сопряжение с цифровыми двойниками воздушных судов. Применение контейнеризации и оркестрации, в свою очередь, открывает возможность адаптивного развёртывания аналитических ресурсов как в наземной вычислительной инфраструктуре, так и в составе бортовых вычислительных контуров.

Не менее значимым выступает методологический фундамент, который должен формироваться на основе сопряжения MBSE и MBSA. Автоматизированное построение деревьев отказов и выполнение риск-анализа уже на стадии проектирования, в том числе с использованием инструментов класса VERDICT, позволяют инкорпорировать требования безопасности непосредственно в архитектуру системы, а не рассматривать их как внешнюю надстройку. Включение математического аппарата распределения Вейбулла наряду с прогностическими моделями машинного обучения обеспечивает переход от регламентного, по существу, реактивного, обслуживания к проактивному управлению техническим состоянием, ориентированному на фактический износ и реальные признаки деградации.

Cпецифика вертолётной техники обусловливает необходимость создания узкоспециализированных модулей, предназначенных для мониторинга трансмиссионных узлов. Практика применения алгоритмов глубокого обучения при детекции ферромагнитных частиц и обработке вибрационных сигналов показывает, что программные средства способны выявлять скрытые дефекты на тех стадиях, которые остаются недоступными как для визуального контроля, так и для традиционных сенсорных систем. Тем самым программно-аналитические инструменты начинают выполнять не вспомогательную, а системообразующую функцию в контуре обеспечения лётной безопасности.

Наряду с этим принципиально недопустимо сводить проблематику надёжности исключительно к инженерным характеристикам летательного аппарата, игнорируя качество самого программного обеспечения и влияние человеческого фактора. Надёжность RAMS-платформ должна обеспечиваться посредством современных практик DevSecOps, а также за счёт учёта когнитивных механизмов ошибок, возникающих в деятельности разработчиков. Лишь комплексная интеграция авиационной инженерной экспертизы с новейшими достижениями в области computer science создаёт предпосылки для формирования инструментов, способных поддерживать требуемый уровень безопасности полётов в условиях становления «цифрового неба».

Архитектурно-методические основы разработки программных средств оценки надёжности и рисков для авиационных и вертолётных технических систем

Цитирование

Похожие статьи

Другие статьи из раздела «Информационные технологии, телекоммуникации»