1. Введение
Нарастание частоты природных и техногенных катастроф ставит перед системами мониторинга задачу оперативного обнаружения чрезвычайных ситуаций. По данным Всемирной метеорологической организации, в 1970–2021 годах зафиксировано 11778 природных катаклизмов с совокупным экономическим ущербом свыше 4,3 трлн долларов, а ООН констатирует удвоение числа стихийных бедствий за последние двадцать лет [1].
Широкое распространение беспилотных летательных аппаратов открывает новые возможности для мониторинга труднодоступных территорий. Вместе с тем традиционные методы ручного дешифрирования аэрофотоснимков не обеспечивают необходимой оперативности при обработке больших объёмов данных [2]. Методы компьютерного зрения и глубокого обучения предоставляют принципиально новые возможности для автоматизации данного процесса.
Целью настоящей статьи является сравнительный анализ методов компьютерного зрения применительно к задаче обнаружения ЧС на аэрофотоснимках с БПЛА и обоснование выбора оптимального подхода для практической реализации интеллектуальной системы мониторинга.
2. Классификация методов обнаружения аномалий
Для автоматического обнаружения ЧС на снимках подстилающей поверхности применяются методы нескольких классов.
Пороговые и спектральные методы основаны на анализе яркостных характеристик пикселей и спектральных индексов (BAI – для пожаров, NDWI – для затоплений). Они просты в реализации, однако чувствительны к условиям освещения и атмосферным помехам, что приводит к значительному числу ложных срабатываний.
Классические методы машинного обучения (SVM, Random Forest) работают с вручную сформированными признаками. Показывают приемлемую точность при работе с мультиспектральными данными, однако пространственная локализация объектов остаётся затруднённой.
Объектно-ориентированный анализ изображений (OBIA) предполагает сегментацию изображения на объекты с последующей классификацией по спектральным, геометрическим и текстурным характеристикам. Ограничением является необходимость ручной настройки параметров под конкретный тип снимка.
Методы глубокого обучения на основе свёрточных нейронных сетей обеспечивают наилучшие характеристики точности: многоуровневые CNN демонстрируют точность классификации природных катастроф на уровне 99,92% [3], а контекстно-ориентированные архитектуры эффективно обнаруживают изменения даже при ограниченном объёме размеченных данных [4].
3. Анализ алгоритмов детектирования и сегментации
В задачах обнаружения ЧС на аэрофотоснимках применяются два основных класса алгоритмов глубокого обучения: детекторы объектов и архитектуры семантической сегментации.
Двухэтапные детекторы (Faster R-CNN) обеспечивают высокую точность, однако уступают по скорости. Одноэтапные детекторы семейства YOLO выполняют детектирование за один проход сети. Архитектура YOLOv8x обеспечивает точность свыше 90% при обнаружении дыма лесных пожаров на снимках с БПЛА, что подтверждает её применимость к задаче мониторинга ЧС.
Архитектуры семантической сегментации (U-Net, DeepLab) выполняют попиксельную классификацию и позволяют точно определить границы поражённых зон. Модели U-Net достигают коэффициента Каппа до 90% при сегментации выгоревших территорий [4]. Вместе с тем сегментация требует попиксельной разметки данных и значительно уступает YOLO по скорости инференса.
Методы обнаружения изменений на основе сиамских сетей и трансформеров достигают IoU = 0,815 на датасете Sen1Floods11, однако требуют наличия разновременных снимков одной территории, что ограничивает их применение в оперативных условиях.
4. Сравнительный анализ методов
В таблице представлено сравнение рассмотренных методов по ключевым критериям применительно к задаче обнаружения ЧС на аэрофотоснимках с БПЛА.
Таблица
Сравнение методов анализа изображений подстилающей поверхности
Критерий | Пороговые методы | Классич. ML | OBIA | Детектирование (YOLO) | Сегментация (U-Net) |
Точность обнаружения ЧС | Низкая | Средняя | Средняя | Высокая (>90%) | Высокая |
Локализация объектов | Нет | Частичная | Да | bbox | Маска пикселей |
Скорость инференса | Высокая | Высокая | Низкая | Высокая | Средняя |
Ручная настройка | Да | Да | Да | Нет | Нет |
Объём обучающих данных | Не нужен | Малый | Малый | Средний | Большой |
Работа в реальном времени | Да | Да | Нет | Да | Нет |
Применимость к БПЛА | Ограниченная | Средняя | Средняя | Высокая | Средняя |
Из таблицы следует, что методы глубокого обучения превосходят классические подходы по всем ключевым критериям. Детектирование (YOLOv8x) обеспечивает высокую точность при высокой скорости инференса, тогда как сегментация (U-Net) даёт более точную локализацию зон поражения, но требует большего объёма размеченных данных и вычислительных ресурсов.
Выбор YOLOv8x для задачи оперативного мониторинга ЧС обусловлен: достаточной точностью для формирования оперативных рекомендаций; высокой скоростью инференса, в том числе на CPU; наличием открытых датасетов bbox-разметки для трёх целевых классов ЧС; простотой интеграции через API библиотеки ultralytics.
5. Заключение
Проведённый сравнительный анализ показал, что методы глубокого обучения превосходят классические подходы по совокупности критериев точности, скорости и применимости к задаче оперативного обнаружения ЧС на аэрофотоснимках с БПЛА. Среди рассмотренных алгоритмов архитектура YOLOv8x обеспечивает оптимальное соотношение точности и скорости инференса для десктопных систем мониторинга.
На её основе разработана интеллектуальная система, реализующая полный цикл анализа аэрофотоснимка – от предобработки до формирования рекомендаций по реагированию – и обеспечивающая автоматическую оценку уровня угрозы по оригинальной математической модели.
Направлениями дальнейших исследований являются расширение числа поддерживаемых классов ЧС, интеграция с бортовым компьютером БПЛА для анализа в реальном времени, а также поддержка мультиспектральных и тепловизионных данных.
.png&w=384&q=75)
