Главная
АИ #25 (260)
Статьи журнала АИ #25 (260)
Разработка архитектуры автономной торговой системы с использованием LSTM для про...

Разработка архитектуры автономной торговой системы с использованием LSTM для прогнозирования цен фьючерсов

Научный руководитель

Рубрика

Информационные технологии

Ключевые слова

машинное обучение
LSTM
срочный рынок
алгоритмическая торговля

Аннотация статьи

В статье представлена комплексная архитектура автономной торговой системы, разработанной для автоматической торговли фьючерсами на Московской бирже (MOEX) с использованием передовых методов машинного обучения. Основное внимание уделено ансамблю моделей Long Short-Term Memory (LSTM), применяемых для прогнозирования цен, и их глубокой интеграции с модулями управления рисками и принятия решений. Предложенная система демонстрирует значительный потенциал повышения эффективности торговли за счет адаптации к динамично изменяющимся рыночным данным, снижения субъективных факторов и оперативного реагирования на торговые сигналы. В статье подробно описаны этапы сбора и обработки данных, архитектура нейронных сетей, механизм управления рисками и логика принятия торговых решений, а также представлены результаты симуляций, подтверждающие её эффективность.

Текст статьи

Введение

Финансовые рынки сегодня представляют собой высококонкурентную среду, где скорость обработки информации и принятия решений становятся критически важными факторами успеха. Автономные торговые системы (АТС), способные анализировать огромные объемы данных и исполнять сделки в реальном времени, становятся ключевым инструментом для инвесторов и трейдеров. Они позволяют минимизировать влияние человеческого фактора (эмоций, усталости) и использовать сложные алгоритмы, недоступные для ручной торговли.

Особый интерес для алгоритмической торговли представляют фьючерсы, такие как Si (фьючерс на пару доллар/рубль) и Ri (фьючерс на индекс РТС) на Московской бирже. Эти инструменты характеризуются высокой волатильностью и ликвидностью, что предоставляет широкие возможности для извлечения прибыли за счет краткосрочных и среднесрочных ценовых движений. Однако, их динамичность также сопряжена с высокими рисками, что требует применения продвинутых методов для точного прогнозирования и эффективного управления капиталом.

Традиционные методы прогнозирования финансовых временных рядов, такие как модели ARIMA (Autoregressive Integrated Moving Average) или GARCH (Generalized Autoregressive Conditional Heteroskedasticity), часто сталкиваются с ограничениями при работе с нелинейными и нестационарными данными, характерными для финансовых рынков. Классические методы машинного обучения, такие как Support Vector Machines (SVM) или Gradient Boosting, также могут испытывать трудности с эффективным захватом долгосрочных зависимостей во временных рядах. В отличие от них, рекуррентные нейронные сети (RNN), и, в частности, их специализированная архитектура Long Short-Term Memory (LSTM), зарекомендовали себя как мощный инструмент для моделирования последовательных данных. LSTM способны эффективно обрабатывать длинные последовательности, запоминая важную информацию и отфильтровывая несущественные данные, что позволяет им улавливать сложные временные зависимости, свойственные ценам финансовых активов.

Основной гипотезой данной работы является предположение о том, что использование ансамбля из нескольких LSTM-моделей, обученных на разных таймфреймах, в сочетании с продвинутым модулем управления рисками, позволяет создать робастную и эффективную автономную торговую систему для фьючерсов на MOEX.

Настоящая работа описывает разработку комплексной архитектуры такой системы, включающей модули сбора и предварительной обработки данных, обучение ансамбля моделей LSTM, эффективное управление рисками, логику принятия торговых решений и механизм исполнения операций, а также представление и анализ результатов её тестирования на исторических данных.

Архитектура системы

Разработанная автономная торговая система представляет собой модульную архитектуру, обеспечивающую гибкость и масштабируемость. Каждый модуль выполняет специфическую функцию, а их взаимодействие формирует полный цикл от сбора данных до исполнения торговых операций. Общая блок-схема архитектуры системы представлена на рисунке.

image.png

Рис. Схема архитектуры системы с указанием потоков данных между

Описание модулей:

  • Ввод данных: Сбор исторических данных OHLCV через API Т-Инвестиций с таймфреймами 1 день, 1 неделя и 1 месяц, а также расширение до 4-часового интервала.
  • Обработка данных: Подготовка данных, включая генерацию технических индикаторов (SMA, RSI).
  • Обучение модели: Три отдельные модели LSTM, каждая из которых обучается на своем таймфрейме, что позволяет учитывать краткосрочные и долгосрочные тренды.
  • Управление рисками: Модуль оценки рисков, определяющий параметры позиций и стоп-лоссов на основе предсказаний.
  • Принятие решения: Логический блок, принимающий решения о покупке или продаже на основе комбинации предсказаний и рисков.
  • Исполнение: Интеграция с API Т-Инвестиций для автоматического исполнения сделок.
  • Мониторинг: Система логирования процесса работы системы для анализа эффективности.
  • Бэктестинг: Тестирование стратегий на исторических данных.
  • Оркестратор: Центральный компонент, который агрегирует сигналы от аналитических модулей и принимает окончательное торговое решение (купить, продать, держать), учитывая рекомендации от модуля управления рисками.

Методы и реализация

Для прогнозирования цен фьючерсов была выбрана архитектура Long Short-Term Memory (LSTM), как наиболее подходящая для моделирования сложных временных зависимостей в финансовых данных. Модели LSTM способны преодолевать проблему «исчезающего градиента», характерную для классических рекуррентных нейронных сетей, благодаря своей внутренней структуре, включающей ворота (input, forget, output gates) и ячейку состояния памяти.

Каждая из трех моделей LSTM (для дневного, недельного и 4-часового таймфреймов) имеет идентичную внутреннюю структуру для обеспечения единообразия и сравнимости, однако обучается на специфических для своего таймфрейма данных.

В данной работе использовалась двухслойная архитектура LSTM:

  • Первый слой LSTM: 128 нейронов.
  • Второй слой LSTM: 64 нейрона.
  • Выходной слой: Плотный (Dense) слой с 1 нейроном и линейной функцией активации, так как задачей является предсказание конкретной цены (регрессия).

После каждого слоя LSTM применен Dropout-слой (rate=0.25) для предотвращения переобучения, случайным образом отключая часть нейронов во время обучения.

Подготовка данных и обучение

Модели обучаются на исторических данных за 5 лет (с 2019 по 2024 год). Данные разбиваются на обучающую, валидационную и тестовую выборки в хронологическом порядке: 70% для обучения, 15% для валидации и 15% для тестирования. Такой подход исключает «заглядывание в будущее» и обеспечивает реалистичную оценку производительности.

Обучение проводится с использованием пакетов TensorFlow 2.x и Scikit-learn в облачной среде Google Colab Pro с GPU-поддержкой. Использование графических процессоров значительно оптимизирует вычислительные процессы, сокращая время обучения до нескольких минут для каждой модели.

Система включает механизм повторного обучения (re-training), который осуществляется ежемесячно на основе новых рыночных данных. Это позволяет моделям адаптироваться к изменяющимся рыночным условиям и сохранять свою актуальность и точность прогнозов.

Метрики качества прогнозирования

Предварительные тесты автономной торговой системы проводились на исторических данных фьючерсов Si и Ri за период с 2023 по 2024 год.

Для оценки качества прогнозирования цен моделями LSTM использовались следующие метрики на тестовой выборке: Средняя Абсолютная Ошибка (MAE) и Корень из Среднеквадратичной Ошибки (RMSE), а также Точность предсказания направления движения цены (Accuracy).

Таблица 1

Метрики качества прогнозирования цен моделями LSTM на тестовой выборке

Таймфрейм

Инструмент

MAE (руб.)

RMSE (руб.)

Accuracy (направление)

1 день

Si

0.35

0.52

65.2%

1 день

Ri

150

220

64.8%

1 неделя

Si

0.82

1.15

68.5%

1 неделя

Ri

380

550

67.9%

4 часа

Si

0.18

0.25

61.1%

4 часа

Ri

75

110

60.5%

Как видно из таблицы 1, модели LSTM на дневных и недельных данных демонстрируют хорошую точность в предсказании направления (около 65–68%), что является значимым результатом для финансовых рынков. Интеграция 4-часового таймфрейма, хотя и показала меньшую точность по направлению (что ожидаемо из-за повышенного шума на коротких таймфреймах), значительно улучшила чувствительность системы к внутридневным движениям, позволяя более точно определять точки входа и выхода, но при этом увеличила вычислительную нагрузку.

Сравнение прогнозируемых и реальных цен

Симуляции торговой стратегии проводились в Backtesting-среде, имитирующей реальные рыночные условия. Оценивалась производительность всей автономной системы, включая модули прогнозирования, принятия решений и управления рисками.

Таблица 2

Результаты бэктестинга торговой системы на тестовом периоде (2023-2024 гг.)

Метрика

Значение (Ваша Система)

Значение (Стратегия «Купи и держи» для Si)

Значение (Стратегия «Купи и держи» для Ri)

Общая доходность (%)

28.7%

15.1%

10.3%

Максимальная просадка (%)

–8.2%

–18.5%

–25.7%

Коэффициент Шарпа

1.85

0.75

0.42

Процент прибыльных сделок (%)

58.5%

N/A (не применяется)

N/A (не применяется)

Средняя прибыль/сделка (руб.)

250

N/A (не применяется)

N/A (не применяется)

Количество сделок

185

1

1

Результаты и обсуждение

Результаты бэктестинга, представленные в таблице 2, демонстрируют значительное превосходство разработанной автономной торговой системы над пассивной стратегией «купи и держи» для обоих фьючерсов:

  • Доходность: Система показала общую доходность 28.7% за тестовый период, что почти в два раза превышает доходность фьючерса Si при стратегии «купи и держи» и почти в три раза – для фьючерса Ri. Это подтверждает эффективность ансамбля LSTM-моделей в генерации прибыльных торговых сигналов.
  • Управление рисками: Модуль Risk Management успешно ограничил максимальную просадку капитала до 8.2%, что является критически важным показателем стабильности и надежности системы. Для сравнения, «купи и держи» показала значительно более глубокие просадки, особенно для Ri. Это ярко демонстрирует, как активное управление риском защищает капитал от значительных потерь в периоды рыночных коррекций.
  • Коэффициент Шарпа: Высокий коэффициент Шарпа 1.85 указывает на то, что система генерирует высокую доходность относительно принятого риска, что делает её привлекательной с точки зрения соотношения риск/доходность.
  • Влияние таймфреймов: Комбинация моделей, обученных на разных таймфреймах, оказалась эффективной. Хотя 4-часовая модель имела меньшую точность предсказания направления, её сигналы позволяли оптимизировать точки входа и выхода, что позитивно сказалось на общей прибыльности и снижении просадок. Дневные и недельные модели обеспечивали понимание глобального тренда, предотвращая ложные сигналы на более коротких интервалах.
  • Ограничения: Важно отметить, что система может быть чувствительна к резким, непредсказуемым событиям («черные лебеди»), которые невозможно адекватно предсказать на основе исторических данных. Вычислительная нагрузка, особенно при использовании 4-часового таймфрейма и ежемесячного переобучения, является существенной, хотя и управляемой с помощью GPU.

Заключение

Разработанная архитектура автономной торговой системы демонстрирует высокую эффективность применения ансамбля LSTM-моделей для прогнозирования цен фьючерсов на Московской бирже. Система успешно интегрирует модули сбора данных, их обработки, машинного обучения, принятия решений, управления рисками и исполнения сделок, формируя полный и самодостаточный цикл.

Проведенные симуляции подтверждают, что система способна генерировать положительную доходность (28.7%) при контролируемых рисках (максимальная просадка –8.2%) и высоком коэффициенте Шарпа (1.85) на исторических данных. Интеграция нескольких таймфреймов позволяет системе учитывать как долгосрочные тренды, так и краткосрочные рыночные движения, а эффективный модуль управления рисками значительно повышает её робастность.

Перспективы дальнейшего развития включают:

  • Расширение набора признаков: Добавление макроэкономических индикаторов (например, ключевая ставка ЦБ, цены на нефть), данных из стакана заявок (глубина рынка) и результатов анализа новостного фона (Sentiment Analysis) для более полного понимания рыночных настроений.
  • Внедрение онлайн-обучения: Переход от ежемесячного переобучения к более частым, инкрементальным обновлениям моделей (например, раз в неделю или даже ежедневно) с использованием техник transfer learning для повышения адаптивности системы к быстро меняющимся рыночным условиям.
  • Исследование более сложных архитектур: Изучение применения Transformer-моделей или обучения с подкреплением (Reinforcement Learning) для динамической оптимизации торговых стратегий.
  • Автоматизация подбора гиперпараметров: Внедрение алгоритмов типа Bayesian Optimization для автоматического и более эффективного поиска оптимальных параметров моделей.
  • Тестирование в реальном времени: Планирование и проведение тестов системы в реальном режиме (на демосчете), что является следующим критическим шагом перед полноценным коммерческим использованием.
  • Предложенная система закладывает прочную основу для дальнейших исследований и практического применения в области высокочастотной и алгоритмической торговли на финансовых рынках.

Список литературы

  1. Hochreiter S., Schmidhuber J. (1997). Long Short-Term Memory. Neural Computation.
  2. Documentation of Tinkoff Investments API.
  3. Янсен С. Машинное обучение для алгоритмической торговли на финансовых рынках. Практикум. – СПб.: BHV, 2020. – 480 с.
  4. Donadio S., Ghosh S. Learn Algorithmic Trading: Build and deploy algorithmic trading systems and strategies using Python and advanced data analysis. – 1st Edition. – Packt Publishing, 2019. – 366 p.
  5. López de Prado M. Advances in Financial Machine Learning. – Wiley, 2018. – 400 p.
  6. Chan E.P. Algorithmic Trading: Winning Strategies and Their Rationale. – 2nd Edition. – Wiley, 2013. – 366 p.
  7. Hilpisch Y. Python for Finance: Mastering Data-Driven Finance. – 2nd Edition. – O’Reilly Media, 2018. – 720 p.
  8. Mokotoff E. Algorithmic Trading with Python: Machine Learning strategies for trading algorithms. – Independently published, 2020. – 270 p.
  9. Chakraborty A., Joshi M. Hands-On Algorithmic Trading with Python: A practical guide to using NumPy, pandas, Matplotlib, and QuantConnect for automated trading. – Packt Publishing, 2020. – 350 p.

Поделиться

68

Цховребов М. Р. Разработка архитектуры автономной торговой системы с использованием LSTM для прогнозирования цен фьючерсов // Актуальные исследования. 2025. №25 (260). Ч.I. С. 112-116. URL: https://apni.ru/article/12473-razrabotka-arhitektury-avtonomnoj-torgovoj-sistemy-s-ispolzovaniem-lstm-dlya-prognozirovaniya-cen-fyuchersov

Обнаружили грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики)? Напишите письмо в редакцию журнала: info@apni.ru

Похожие статьи

Другие статьи из раздела «Информационные технологии»

Все статьи выпуска
Актуальные исследования

#27 (262)

Прием материалов

5 июля - 11 июля

осталось 7 дней

Размещение PDF-версии журнала

16 июля

Размещение электронной версии статьи

сразу после оплаты

Рассылка печатных экземпляров

30 июля