Сравнительный анализ методов компьютерного зрения для автоматического обнаружения чрезвычайных ситуаций на снимках подстилающей поверхности

Ханафиев Нафис Айратович

Аннотация статьи

В статье проведён сравнительный анализ методов компьютерного зрения для автоматического обнаружения чрезвычайных ситуаций на аэрофотоснимках подстилающей поверхности. Рассмотрены пороговые методы, классические алгоритмы машинного обучения, объектно-ориентированный анализ изображений и современные архитектуры глубокого обучения – детекторы семейства YOLO и сегментационные модели U-Net, DeepLab. Представлена сравнительная таблица по ключевым критериям применительно к мониторингу с БПЛА. Обоснован выбор YOLOv8x для разработки системы обнаружения пожаров, дыма и затоплений, описана математическая модель оценки уровня угрозы и приведён контрольный пример детектирования.

Текст статьи

1. Введение

Нарастание частоты природных и техногенных катастроф ставит перед системами мониторинга задачу оперативного обнаружения чрезвычайных ситуаций. По данным Всемирной метеорологической организации, в 1970–2021 годах зафиксировано 11778 природных катаклизмов с совокупным экономическим ущербом свыше 4,3 трлн долларов, а ООН констатирует удвоение числа стихийных бедствий за последние двадцать лет [1].

Широкое распространение беспилотных летательных аппаратов открывает новые возможности для мониторинга труднодоступных территорий. Вместе с тем традиционные методы ручного дешифрирования аэрофотоснимков не обеспечивают необходимой оперативности при обработке больших объёмов данных [2]. Методы компьютерного зрения и глубокого обучения предоставляют принципиально новые возможности для автоматизации данного процесса.

Целью настоящей статьи является сравнительный анализ методов компьютерного зрения применительно к задаче обнаружения ЧС на аэрофотоснимках с БПЛА и обоснование выбора оптимального подхода для практической реализации интеллектуальной системы мониторинга.

2. Классификация методов обнаружения аномалий

Для автоматического обнаружения ЧС на снимках подстилающей поверхности применяются методы нескольких классов.

Пороговые и спектральные методы основаны на анализе яркостных характеристик пикселей и спектральных индексов (BAI – для пожаров, NDWI – для затоплений). Они просты в реализации, однако чувствительны к условиям освещения и атмосферным помехам, что приводит к значительному числу ложных срабатываний.

Классические методы машинного обучения (SVM, Random Forest) работают с вручную сформированными признаками. Показывают приемлемую точность при работе с мультиспектральными данными, однако пространственная локализация объектов остаётся затруднённой.

Объектно-ориентированный анализ изображений (OBIA) предполагает сегментацию изображения на объекты с последующей классификацией по спектральным, геометрическим и текстурным характеристикам. Ограничением является необходимость ручной настройки параметров под конкретный тип снимка.

Методы глубокого обучения на основе свёрточных нейронных сетей обеспечивают наилучшие характеристики точности: многоуровневые CNN демонстрируют точность классификации природных катастроф на уровне 99,92% [3], а контекстно-ориентированные архитектуры эффективно обнаруживают изменения даже при ограниченном объёме размеченных данных [4].

3. Анализ алгоритмов детектирования и сегментации

В задачах обнаружения ЧС на аэрофотоснимках применяются два основных класса алгоритмов глубокого обучения: детекторы объектов и архитектуры семантической сегментации.

Двухэтапные детекторы (Faster R-CNN) обеспечивают высокую точность, однако уступают по скорости. Одноэтапные детекторы семейства YOLO выполняют детектирование за один проход сети. Архитектура YOLOv8x обеспечивает точность свыше 90% при обнаружении дыма лесных пожаров на снимках с БПЛА, что подтверждает её применимость к задаче мониторинга ЧС.

Архитектуры семантической сегментации (U-Net, DeepLab) выполняют попиксельную классификацию и позволяют точно определить границы поражённых зон. Модели U-Net достигают коэффициента Каппа до 90% при сегментации выгоревших территорий [4]. Вместе с тем сегментация требует попиксельной разметки данных и значительно уступает YOLO по скорости инференса.

Методы обнаружения изменений на основе сиамских сетей и трансформеров достигают IoU = 0,815 на датасете Sen1Floods11, однако требуют наличия разновременных снимков одной территории, что ограничивает их применение в оперативных условиях.

4. Сравнительный анализ методов

В таблице представлено сравнение рассмотренных методов по ключевым критериям применительно к задаче обнаружения ЧС на аэрофотоснимках с БПЛА.

Таблица

Сравнение методов анализа изображений подстилающей поверхности

Критерий	Пороговые методы	Классич. ML	OBIA	Детектирование (YOLO)	Сегментация (U-Net)
Точность обнаружения ЧС	Низкая	Средняя	Средняя	Высокая (>90%)	Высокая
Локализация объектов	Нет	Частичная	Да	bbox	Маска пикселей
Скорость инференса	Высокая	Высокая	Низкая	Высокая	Средняя
Ручная настройка	Да	Да	Да	Нет	Нет
Объём обучающих данных	Не нужен	Малый	Малый	Средний	Большой
Работа в реальном времени	Да	Да	Нет	Да	Нет
Применимость к БПЛА	Ограниченная	Средняя	Средняя	Высокая	Средняя

Из таблицы следует, что методы глубокого обучения превосходят классические подходы по всем ключевым критериям. Детектирование (YOLOv8x) обеспечивает высокую точность при высокой скорости инференса, тогда как сегментация (U-Net) даёт более точную локализацию зон поражения, но требует большего объёма размеченных данных и вычислительных ресурсов.

Выбор YOLOv8x для задачи оперативного мониторинга ЧС обусловлен: достаточной точностью для формирования оперативных рекомендаций; высокой скоростью инференса, в том числе на CPU; наличием открытых датасетов bbox-разметки для трёх целевых классов ЧС; простотой интеграции через API библиотеки ultralytics.

5. Заключение

Проведённый сравнительный анализ показал, что методы глубокого обучения превосходят классические подходы по совокупности критериев точности, скорости и применимости к задаче оперативного обнаружения ЧС на аэрофотоснимках с БПЛА. Среди рассмотренных алгоритмов архитектура YOLOv8x обеспечивает оптимальное соотношение точности и скорости инференса для десктопных систем мониторинга.

На её основе разработана интеллектуальная система, реализующая полный цикл анализа аэрофотоснимка – от предобработки до формирования рекомендаций по реагированию – и обеспечивающая автоматическую оценку уровня угрозы по оригинальной математической модели.

Направлениями дальнейших исследований являются расширение числа поддерживаемых классов ЧС, интеграция с бортовым компьютером БПЛА для анализа в реальном времени, а также поддержка мультиспектральных и тепловизионных данных.

Список литературы

Организация Объединённых Наций. ООН: число природных катастроф выросло в два раза за 20 лет // НАНГС. – 2020. – URL: https://nangs.org/news/ecology/oon-chislo-prirodnyh-katastrof-vyroslo-v-dva-raza-za-20-let-i-eto-ne-predel.
Seidlova A. et al. Interpretation of Remote Sensing Imagery // IOP Conference Series: Earth and Environmental Science. – 2021. – Vol. 906. – Art. 012070. – DOI: 10.1088/1755-1315/906/1/012070.
Aamir M. et al. Natural Disasters Intensity Analysis and Classification Based on Multispectral Images Using Multi-Layered Deep Convolutional Neural Network // Sensors. – 2021. – Vol. 21, No. 8. – Art. 2648. – DOI: 10.3390/s21082648.
Liu Z. et al. Context-Aware Change Detection With Semi-Supervised Learning. – arXiv:2306.08935. – 2023. – URL: https://arxiv.org/abs/2306.08935.

Сравнительный анализ методов компьютерного зрения для автоматического обнаружения чрезвычайных ситуаций на снимках подстилающей поверхности

Цитирование

Похожие статьи

Другие статьи из раздела «Информационные технологии»