Метод обнаружения аномалий на основе машинного обучения для выявления атак с использованием искусственного интеллекта

Аннотация статьи

В статье рассматривается разработка и представление инновационного метода обнаружения аномалий, базирующегося на гибридной архитектуре машинного обучения. Этот метод объединяет подходы обучения без учителя для выявления ранее неизвестных отклонений и скрытых паттернов, а также компоненты обучения с подкреплением классификации для точной идентификации угроз, генерируемых искусственным интеллектом. Для достижения поставленной цели были сформулированы следующие задачи: провести всесторонний анализ существующих методов обнаружения аномалий и выявить их ограничения в контексте AI-атак; спроектировать оптимальную архитектуру модели машинного обучения, способную интегрировать различные подходы; провести эмпирическую оценку предложенного метода на синтетических и реальных наборах данных; и, наконец, сформулировать практические рекомендации по его внедрению и дальнейшему совершенствованию.

Текст статьи

Современный ландшафт киберугроз претерпевает кардинальные изменения, обусловленные активным внедрением технологий искусственного интеллекта (ИИ) в арсенал злоумышленников. Эти атаки демонстрируют беспрецедентную адаптивность, способность к самообучению и маскировке, что позволяет им эффективно имитировать легитимный трафик и поведение пользователей. В результате традиционные системы обнаружения вторжений, основанные на сигнатурном анализе и жёстко заданных правилах, оказываются неспособными эффективно противостоять таким динамичным угрозам, порождая значительное количество ложных срабатываний и, что более критично, пропуская реальные инциденты в жизненно важных информационных инфраструктурах.

Экспоненциальный рост использования ИИ в атакующих сценариях, начиная от автоматизированных фишинговых кампаний и заканчивая генерацией полиморфного вредоносного кода, остро ставит вопрос о необходимости разработки новых, более совершенных детектирующих механизмов. Эти механизмы должны быть способны выявлять не столько явные сигнатуры известных угроз, сколько тонкие паттерны аномалий в многомерных потоках данных, таких как сетевая телеметрия, системные журналы и поведенческие характеристики пользователей. В этом контексте методы машинного обучения (МО) становятся ключевым инструментом, предлагая гибкие и масштабируемые решения для адаптивного обнаружения угроз в условиях постоянно меняющейся среды кибербезопасности.

Эволюция киберугроз характеризуется активным внедрением методов искусственного интеллекта, что проявляется в ряде современных типов атак, включая adversarial attacks, data poisoning, automated social engineering и генеративные методы. Атакующие используют эти подходы для повышения точности и эффективности компрометации, реализуя автоматизацию процессов, адаптацию моделей под текущие условия и генерацию реалистичного вредоносного контента. Для систем обнаружения и реагирования такие изменения означают рост сложности выявления инцидентов, снижение эффективности фиксированных сигнатурных и правильных механизмов и увеличение требований к адаптивности и контекстной аналитике. Вследствие этого возникает необходимость проектирования методов обнаружения, способных учитывать динамику поведения атак и устойчивость к манипуляциям данных, что логически выводит к рассмотрению архитектур и алгоритмов на базе машинного обучения.

В современной практике обнаружения аномалий применяются методы обучения с учителем (классификаторы, ансамбли), без учителя (кластеризация, алгоритмы выявления выбросов), полунатренированные подходы и представления на основе глубоких нейросетей, которые формируют базис для детектирования нетипичного поведения. Методы с учителем обеспечивают высокую точность при наличии репрезентативных помеченных данных, а ансамбли повышают стабильность и устойчивость к шуму, однако их адаптивность к быстро меняющимся AI-ориентированным атакам и объяснимость решений ограничены. Безнадзорные и полунатренированные алгоритмы демонстрируют большую гибкость при выявлении ранее неизвестных паттернов и лучше работают при дефиците меток, но подвержены дрейфу распределений и имеют пониженную интерпретируемость; алгоритмы выявления выбросов эффективны против редких событий, но чувствительны к параметризации. Глубокие представления позволяют захватывать сложные нелинейные зависимости и повышают способность выявлять продвинутые AI-атакующие шаблоны, однако они уязвимы к атакам на данные и имеют низкую объяснимость, что в совокупности требует балансирования критериев адаптивности, объяснимости и устойчивости при выборе или комбинировании методов.

Требования к модели включают функциональные и нефункциональные характеристики: адаптивность к эволюции AI-генерируемых паттернов; чувствительность к малым статистическим отклонениям; устойчивость к adversarial‑влиянию; способность работы в режиме потоковой обработки с ограниченной задержкой; интерпретируемость решений; а также использование минимального набора телеметрических источников (сетевой трафик, системные журналы, поведенческие метрики). «Разработка архитектуры системы велась с учётом условий защищённых и критических инфраструктур, где отсутствует доступ к полным дампам трафика (PCAP) и размеченным данным [3, с. 1-12]. Это исключает применение сигнатурных методов, требующих знания шаблонов атак или аннотированных выборок [1, с. 248-252; 2, с. 313-317; 4, c. 6]». Указанное ограничение доступа к полным дампам трафика и размеченным данным обусловливает отказ от сигнатурных методов и необходимость опираться на алгоритмы, способные выявлять аномалии по неполным, агрегированным или частично размеченным данным. Введение требований к низкой задержке и интерпретируемости обосновывает выбор гибридных архитектур, сочетающих unsupervised компоненты для раннего обнаружения и supervised компоненты для последующей классификации при минимуме телеметрии.

Unsupervised‑компонент включает набор алгоритмов для выявления отклонений, среди которых рекомендуется использование глубоких автокодировщиков для восстановления и выявления аномалий, методов плотностной оценки для детекции редких событий и алгоритмов кластеризации для группировки схожих паттернов. Схема извлечения признаков предусматривает агрегирование показателей из сетевых потоков и системных логов с последующей нормализацией по масштабу и времени, что снижает влияние вариаций устройств и пиковых нагрузок. Обучение на нормальных данных производится с применением онлайн‑адаптации, включающей инкрементальные обновления и мониторинг метрик для своевременного обнаружения и учёта концепт‑дрейфта.

Supervised‑компонент предназначен для подтверждения и категоризации подозрительных событий и реализуется как модуль классификации с возможностью использования деревьев решений, градиентных ансамблей или нейронных сетей в зависимости от требований к интерпретируемости и пропускной способности. Комбинирование выводов unsupervised и supervised модулей осуществляется посредством ensembling и применения мета‑класификатора, который агрегирует оценки аномальности и повышает устойчивость к ложным сигналам. Процедуры разметки инцидентов базируются на экспертной валидации и полуавтоматических механизмах формирования меток для последующего дообучения, при этом правила пороговой фильтрации настраиваются с учётом ROC‑анализа и операционных критериев для минимизации ложных срабатываний.

Модель предобработки и слияния данных формализует извлечение признаков из сетевых flow‑данных и event‑логов, обеспечивая перевод потоковых записей и событий в согласованные векторные представления. Синхронизация временных рядов осуществляется через согласование меток времени и выравнивание окон, что минимизирует рассинхронизацию между источниками данных. Нормализация и enrichment (DNS, контекст хостов) включает приведение значений к единой шкале и добавление семантических атрибутов для повышения информативности признаков.

Предложены алгоритмические решения для поведенческого анализа, основанные на профилировании субъектов и сущностей с применением последовательных моделей, таких как RNN/LSTM и Transformer. Методы построения базовой поведенческой нормы предусматривают формализацию профиля через агрегированные паттерны активности и контекстные эмбеддинги, позволяющие учитывать временную и семантическую структуру поведения. Критерии вычисления аномалий определяются как метрики отклонения от профиля – расстояния в пространстве эмбеддингов, вероятности наблюдаемого поведения по модели и адаптивные пороговые функции, учитывающие сезонность и контекст. Для обеспечения объяснимости и robust-оценки предложены подходы, комбинирующие интерпретируемые атрибуции признаков, моделирование adversarial-вмешательств и оценку неопределённости, что повышает устойчивость детекции при намеренных искажениях наблюдений.

Состав наборов данных включает сочетание источников реального сетевого трафика и синтетически сгенерированных сценариев, полученных путем записи контролируемых захватов и реплея логов в тестовой среде. Методика имитации AI-атак предполагает программную генерацию запросов и ответов, моделирование манипуляций с последовательностями действий и варьирование параметров атак для воспроизведения разнообразных векторов угроз. При формировании сценариев важно обеспечить представительность по типам протоколов, интенсивности обмена и временным характеристикам, чтобы покрыть возможные способы маскировки и эволюции атак. Наборы данных организуются с учетом разделения по уровням сценариев и метаданным, что облегчает последующую валидацию и репликацию экспериментов.

Предобработка включает процедуры очистки, нормализации и удаления дубликатов, а также временную сегментацию трафика на сессии и окна для выделения релевантных контекстов поведения. Извлечение признаков комбинирует статические характеристики (например, размеры пакетов, заголовки и атрибуты соединений) и поведенческие показатели (последовательности действий, интервалы между событиями и агрегированные метрики) с применением скользящих окон и агрегирования по сессиям. Стратегия аннотирования реализуется через многоуровневые метки с использованием исходных меток, внедрения эталонных атак и экспертной проверки, а для коррекции дисбаланса применяются методы балансировки классов и аугментации, включая синтетическое увеличение редких классов. Финальные датасеты формируются в стандартизированных форматах и разделяются на обучающую, валидационную и тестовую выборки с сохранением временной раздельности для предотвращения утечки информации.

Выбор метрик определяется необходимостью всесторонней оценки детекторов аномалий в контексте AI-атак и должен включать точность, полноту, F1-меру, ROC-AUC, PR-AUC, время до обнаружения и показатели ложных тревог. Точность и полнота отражают баланс между обнаружением атак и пропуском инцидентов, тогда как F1-мера служит композитной метрикой при несбалансированных классах. ROC-AUC и PR-AUC дополняют друг друга: ROC-AUC даёт обобщённую оценку разделения классов, а PR-AUC более информативна при низкой доле положительных примеров, характерной для AI-генерируемых атак. Показатель времени до обнаружения и частота ложных тревог являются критическими для операционной пригодности метода и оценки его применимости в реальном времени.

Экспериментальный протокол включает схемы разбиения данных, такие как скользящее окно и временная валидация, что обеспечивает корректную оценку устойчивости детектора во временных рядах сетевого трафика. В качестве бенчмарков используется набор эталонных базовых методов для сравнения, охватывающий как классические алгоритмы обнаружения аномалий, так и современные подходы машинного обучения, чтобы обеспечить справедливое сопоставление результатов. Для оценки значимости различий между методами применяются статистические тесты, непараметрические методы ранжирования и расчёт доверительных интервалов по многократным прогонам для учёта стохастичности обучения. Протокол предусматривает использование как синтетических, так и реальных наборов данных с имитацией AI-атак, что повышает объективность и воспроизводимость экспериментальной оценки.

Базовые подходы включают статистические методы обнаружения аномалий, алгоритмы кластеризации и классические модели машинного обучения; при их настройке обычно задаются процедуры предобработки, выбор признаков, нормализация и подбор гиперпараметров, таких как число кластеров, глубина деревьев и коэффициенты регуляризации. «Результат: для рассматриваемой выборки данных был определен и реализован наиболее экономичный по времени и качеству алгоритм – метод деревьев решений. Наилучшие характеристики для решения поставленной задачи показали деревья решение точность при определении типа и подтипа атаки составляет 99.9662% и 99.9576% соответственно. Время обнаружение атаки в среднем равно 85.39 мс и 114.72 мс для типа и подтипа соответственно [7, c. 92]».

Количественный сравнительный анализ выполнялся на общих наборах тестов с использованием метрик точности, полноты, F1-score и времени обнаружения, что обеспечивало сопоставимость результатов. Предложенный метод демонстрировал преимущество в сценариях с высокодинамическим поведением и адаптивными AI-атаками за счёт гибридной архитектуры и комбинированного анализа признаков, тогда как в статичных, хорошо представленных наборах базовые модели иногда показывали сопоставимую точность. Выявленные различия объясняются устойчивостью к шуму и способностью модели обнаруживать сложные поведенческие паттерны: базовые алгоритмы при оптимальной настройке достигают высокой эффективности, но теряют точность при генеративных и изменяющихся атаках.

Экспериментальные результаты демонстрируют различную чувствительность модели к разным типам AI-атак: наилучшие показатели детекции наблюдались для атак, порождающих явные аномалии в сетевом трафике и системных журналах, тогда как сложные поведенческие имитации показали пониженные уровни обнаружения. Распределение ошибок характеризуется компромиссным соотношением между ложными срабатываниями и пропусками; при настройке порогов на максимальную полноту наблюдается рост ложных срабатываний, тогда как уменьшение порога снижает число ложных тревог за счёт увеличения пропусков. Эффективность метода явно зависит от объёма и качества обучающих данных: увеличение размера набора и повышение его репрезентативности для различных сценариев атак приводят к снижению числа пропусков и улучшению стабильности метрик по всем классам угроз. С учётом обнаруженных закономерностей практическая применимость метода обоснована при условии регулярного пополнения и валидации обучающих выборок, а также внедрения адаптивной настройки порогов для поддержания требуемого уровня баланса между чувствительностью и точностью.

Архитектура интеграции должна определять интерфейсы сбора телеметрии и форматы данных для унификации входных потоков и обеспечения инкапсуляции метаданных. Необходима совместимость с существующими SIEM/EDR-платформами и сетевыми прокси, включая стандарты обогащения событий и схемы трассировки, чтобы обеспечить корректную корреляцию инцидентов в реальном времени. Требования к задержке и пропускной способности следует специфицировать для онлайнового обнаружения аномалий с учётом пиковых нагрузок и возможностей агрегирования. «Достоинством FEGB-Net является сочетание федеративного обучения и ансамблевой классификации без обмена исходным трафиком, что обеспечивает сохранение конфиденциальности данных, при этом достигается точность до 97,1% [3, c. 10]».

В организационно-эксплуатационной части следует строить конвейеры предобработки и валидации данных, включающие фильтрацию шумов, нормализацию признаков и детектирование смещений в распределениях. Процедуры непрерывной калибровки и безопасного развертывания моделей должны быть автоматизированы и интегрированы с системами CI/CD для минимизации простоев и риска регрессий. Мониторинг производительности и качества детекции необходимо реализовать через метрики стабильности, точности и времени отклика, а также предусмотреть механизмы оповещения при деградации модели. Учет требований конфиденциальности и нормативного соответствия предполагает применение политик доступа к данным, журналирования действий и причинно-следственного анализа решений модели.

Основной предел текущей модели заключается в высокой зависимости точности от качества и репрезентативности обучающего набора, ухудшении показателей при смещениях домена и уязвимости к adversarial-манипуляциям и AI-генерируемым паттернам. «Прежде всего, для формирования качественных моделей требуется большое количество достоверных и разметанных данных, доступ к которым может быть ограничен. Недостаток обучающего материала или его несбалансированность снижает точность прогнозирования и может привести к ложноположительным или ложноотрицательным срабатываниям [1, c. 255]». Необходимо исследовать методы доменной адаптации, обучение с ограниченными метками, устойчивое к атакам обучение и алгоритмы интерпретируемости для обоснования детекций.

Разработанный подход непосредственно решает основную проблему современных систем защиты – их неэффективность при столкновении с адаптивными и маскирующимися атаками на основе ИИ – посредством объединения непараметрического обнаружения аномалий и целевой классификации. Такое сочетание повышает чувствительность к новым и изменяющимся паттернам атак, одновременно снижая риск ложных срабатываний за счёт контекстной фильтрации и обучения на размеченных образцах. В результате архитектура направлена на сокращение как количества ложноположительных сигналов, так и вероятности пропуска сложных угроз, что соответствует поставленным во введении задачам исследования.

Эмпирическая оценка на синтетических и реальных наборах данных подтвердила превосходство предложенной модели по ключевым метрикам детекции и демонстрировала повышенную устойчивость к вариативности атак по сравнению с базовыми подходами. Подготовленные данные и строгая методология тестирования позволили объективно показать улучшение показателей выявления сложных AI-генерируемых угроз, что было отражено в сравнительном анализе.

Список литературы

Аблизова Г.А. Искусственный интеллект в кибербезопасности: роль машинного обучения в обеспечении защиты данных // Innovations in science and technologies. – 2025. – № 2. – С. 248-252.
Аль-Тамими М.М., Хассан М.Б., Аббас С.А. Система обнаружения вторжений в сеть на основе SDN с использованием подходов машинного обучения // XXVII Международная конференция по мягким вычислениям и измерениям (SCM'2024). – Санкт-Петербург, 2024. – С. 313-317.
Арм А.А.С., Ляпунцова Е.В. Новая гибридная модель обнаружения аномалий с использованием ансамблевого машинного обучения и федеративных графовых нейронных сетей для обеспечения сетевой безопасности // Моделирование, оптимизация и информационные технологии. – 2025. – № 2. – С. 1-12.
Болодурина И.П., Нефедов Д.А. Обнаружение аномалий в сетевом трафике на основе обучения без учителя с применением предтекстовых задач // Правовая информатика. – 2025. – № 3. – С. 4-8.
Буским э Силва Р., Рахандини А. Совершенствование методов обнаружения аномалий в области компьютерной безопасности с помощью проектов координированных исследований // Бюллетень МАГАТЭ. – 2023. – С. 18-19.
Заозерский А.А. Использование машинного обучения для обнаружения аномалий в сетевом трафике // Международный журнал информационных технологий и энергоэффективности. – 2025. – № 6. – С. 70-73.
Лапина М.А., Мовзалевская В.В., Токмакова М.Е. и др. Применение технологий машинного обучения для обнаружения веб-атак // Вопросы кибербезопасности. – 2024. – № 4. – С. 92-103.
Мазакова Б.М., Мусайф М. Создание модуля для обнаружения аномалий в сетевом графе на основе нейронных сетей // Smart technologies journal. – 2025. – № 1. – С. 32-36.
Павлычев А.В., Кузьминец К.В., Бреус Д.Е. и др. Формирование размеченного набора данных на основе смоделированных компьютерных атак // Безопасность информационных технологий. – 2025. – № 4. – С. 1-17.
Шелухин О.И., Рябинин В.С., Фармаковский М.А. Обнаружение аномальных состояний компьютерных систем средствами интеллектуального анализа данных системных журналов // Вопросы кибербезопасности. – 2018. – № 2. – С. 33-43.

Метод обнаружения аномалий на основе машинного обучения для выявления атак с использованием искусственного интеллекта

Цитирование

Похожие статьи

Другие статьи из раздела «Технические науки»