Введение
В условиях цифровой трансформации государственного управления и необходимости ускорения процессов градостроительного проектирования, остро встает задача внедрения технологий искусственного интеллекта, в частности методов машинного обучения, в градостроительное проектирование. Особенно актуальна автоматизация задач, традиционно выполняемых вручную, включая определение видов разрешенного использования (ВРИ) и функционального зонирования территорий, что требует значительных трудозатрат и экспертизы со стороны специалистов [1, 2].
Классические подходы к зонированию основаны на анализе существующего землепользования и экспертом толковании текстовых описаний участков. Эти описания, содержащиеся, например, в кадастровых планах территории (КПТ), отличаются высокой степенью разнородности, вариативности формулировок и отсутствием стандартизированных классификаторов. Следствием становится высокая нагрузка на специалистов ГИС и риск ошибок [3, с. 77-81; 4].
В данной статье представлен кейс внедрения ML-модели для автоматического определения ВРИ и соответствующей функциональной зоны на основании анализа текстового поля из КПТ. Рассматривается построение собственного ML-сервиса, основанного на архитектуре трансформеров, и его интеграция в процесс проектирования. Демонстрируется, как предложенное решение позволяет существенно сократить временные и трудозатраты, повысить согласованность данных и качество проектной документации.
Объект и предмет исследования
Объектом исследования является процесс функционального зонирования территорий в рамках разработки градостроительной документации.
Предмет исследования – применение методов машинного обучения для классификации видов разрешенного использования земельных участков и автоматического предсказания функциональных зон.
Цель и задачи исследования
Цель статьи – продемонстрировать возможности и эффективность применения ML-моделей для автоматизации зонирования территорий на основе анализа текстовых описаний участков из кадастровых данных.
Задачи:
- Описать проблематику ручной классификации ВРИ и зонирования.
- Представить архитектуру и принцип работы ML-модели.
- Проанализировать качество предсказаний модели на реальных данных.
- Оценить перспективы масштабирования технологии и ее значимость для практики.
Методология и техническая реализация
Исходные данные
В качестве обучающей выборки использовались сведения о 30000 земельных участках, собранные в процессе пилотного проекта (город Вологда). Главным источником информации выступало текстовое поле из КПТ, содержащее описания фактического использования участка. Характер данных – нерегламентированный, с высокой степенью разнообразия формулировок.
Обработка данных
Текстовые описания нормализованы и приведены к унифицированному формату.
Выполнено ручное присвоение целевых меток – кода ВРИ и функциональной зоны (например, «Жилая застройка», «Образование», «Производственная зона»).
Датасет разделен на обучающую (80%) и тестовую (20%) выборки.
Архитектура модели
Была использована русскоязычная реализация трансформерной модели класса BERT (Bidirectional Encoder Representations from Transformers), дообученная на задаче многоклассовой классификации. Выбор BERT объясняется:
- высокой способностью к интерпретации контекста;
- устойчивостью к неточным или разнородным формулировкам;
- высокой точностью при ограниченных объемах данных.
Обработка реализована в виде ML-сервиса, принимающего на вход ID участка и описание, и возвращающего ID класса ВРИ и соответствующую функциональную зону [5].
Результаты: точность модели и практика применения
На тестовой выборке (≈6000 объектов) модель показала общую точность предсказаний 98,6%. Классы с наиболее частотным представлением (например, жилая застройка) классифицируются с точностью 99%+. Менее распространенные классы имеют незначительное снижение метрик (до 95%).
Таблица 1
Точность предсказаний (пример)
Код ВРИ | Название зоны | Кол-во объектов | Точность (%) |
01 | Жилая застройка | 1709 | 100.0 |
12 | Образование | 92 | 98.9 |
Результаты модели интегрированы в работу геоинформационной платформы QGIS. После запуска сервиса специалисты получают автоматически раскрашенную карту зонирования – участки визуализируются в соответствии с классификацией (по приказу № 10), что упрощает анализ и принятие решений.
Технические аспекты реализации: принципы, технологии и архитектура моделей.
Принципы классификации в машинном обучении
Классификация – одна из базовых задач машинного обучения, цель которой – отнести входной объект к одному из заранее заданных классов. В нашем случае входом является текстовое описание вида использования земельного участка (поле из КПТ), а выходом – предсказанный код функциональной зоны и категория ВРИ [6].
Процесс классификации включает следующие этапы:
1. Предобработка данных:
- нормализация текста (приведение к нижнему регистру, удаление пунктуации, лемматизация);
- токенизация – разбиение текста на элементы (токены), понятные модели.
2. Обучение модели:
- модель «читает» тысячи пар «текст – правильная категория»;
- формируются численные представления (эмбеддинги), которые отражают семантику слов;
- оптимизируются веса нейросети для минимизации ошибки классификации.
3. Инференс (предсказание):
- на новых данных модель сопоставляет текст с наиболее вероятным классом.
Для обучения используется супервизорный подход: датасет содержит примеры с заданными метками, по которым модель учится распознавать закономерности.
Использование BERT в задаче классификации
Особенности BERT
Модель BERT (Bidirectional Encoder Representations from Transformers) – это трансформер, обученный на больших корпусах текстов, с целью понимания контекста. Главное отличие BERT от традиционных моделей:
- она двунаправленная: при обработке текста учитывается как левый, так и правый контекст каждого слова;
- она работает с текстом на уровне подслов (субслов), что особенно полезно для русского языка с его морфологией.
Для задачи был выбран вариант BERT, дообученный на русском языке.
Преимущества BERT:
- высокая точность при ограниченном количестве размеченных данных;
- способность учитывать контекст, в том числе редкие или некорректно сформулированные фразы;
- возможность дообучения под конкретную задачу (fine-tuning).
Таблица 2
Отличие BERT от GPT
Параметр | BERT | GPT |
Архитектура | Encoder (двунаправленный) | Decoder (однонаправленный) |
Назначение | Понимание текста, классификация | Генерация текста |
Область применения | Анализ, классификация, извлечение | Чат-боты, автокомплит, генерация |
Пример использования | Определение ВРИ по описанию | Генерация пояснительных записок |
BERT – это «читающая» модель. GPT – «пишущая». Поэтому в задачах классификации BERT демонстрирует значительно более высокую эффективность.
Процесс обучения модели
- Разметка: вручную метятся пары «текст – класс» (например, «используется под торговый центр» → «Общественно-деловая зона»).
- Fine-tuning BERT: модель дообучается на размеченных данных с использованием кросс-энтропийной функции потерь и оптимизатора AdamW.
- Валидация: проводится проверка качества на независимой части данных.
- Метрики оценки: Accuracy (общая точность); Precision/Recall/F1-score по классам; Confusion Matrix – для визуального анализа ошибок.
Обучение производилось на GPU, при этом полный цикл fine-tuning занимал не более 3 часов (на датасете из 30 тыс. строк).
Инструменты и технологии
Язык и библиотеки:
- Python (основной язык);
- transformers от HuggingFace – для загрузки и fine-tuning моделей BERT;
- scikit-learn – для оценки качества модели;
- pandas и numpy – для обработки табличных данных;
- Flask / FastAPI – развертывание модели как веб-сервиса.
Инфраструктура:
- Облако или локальный сервер с GPU (NVIDIA RTX 3060/3090);
- Хранилище модели – .pt файл (PyTorch);
- REST API – взаимодействие между ML-моделью и QGIS-интерфейсом.
Преимущества и ограничения подхода
Преимущества:
- Высокая точность даже на небольших датасетах;
- Универсальность: BERT можно применять к другим текстовым задачам в градостроительстве (анализ обращений граждан, генерация текстов);
- Легкость масштабирования – можно дообучить под другой регион.
Ограничения:
- Требуется предварительно размеченный датасет;
- Обучение требует вычислительных ресурсов (GPU);
- Вариативность формулировок – ключевой источник ошибок;
- Необходим контроль за качеством данных (ошибки в исходных текстах ухудшают результат).
Возможности дальнейшего развития:
- Мультиклассовая классификация с вероятностным выводом (softmax);
- Обратная связь от пользователей (active learning) – модель переобучается по исправленным ошибкам;
- Интеграция с QGIS через плагины – полная автоматизация от ввода КПТ до генерации цветной карты;
- Добавление многомодальных признаков – совместное использование текстов, геометрии участка, кадастровой стоимости.
Сравнение с альтернативными моделями и методами
Для оценки эффективности предложенного подхода были проведены сравнения модели BERT с несколькими альтернативами, включая:
- TF-IDF + логистическая регрессия – классический статистический подход, не учитывающий контекст;
- LSTM (долгая краткосрочная память) – рекуррентная нейросеть;
- FastText – облегчённая векторная модель от Facebook [7].
Таблица 3
Сводная таблица сравнения
Метод | Accuracy (%) | Плюсы | Минусы |
TF-IDF + лог. регрессия | 84.7 | Простота реализации | Низкая точность, не учитывает контекст |
FastText | 89.5 | Быстрота, простота | Ограниченное понимание структуры текста |
LSTM | 93.2 | Учет последовательности слов | Требует много времени на обучение, не стабилен |
BERT (использованный) | 98.6 | Контекстуальность, устойчивость | Требует GPU, требует более сложной интеграции |
Анализ ошибок модели и проблемные классы
Несмотря на высокую общую точность, анализ матрицы ошибок показал, что модель склонна путать между собой некоторые схожие классы. Это особенно выражено в следующих случаях:
1. Общественно-деловая застройка (ОДЗ) ↔ Многофункциональная зона (МФЗ):
- Причина: оба класса часто имеют в описаниях слова «торговля», «услуги», «офисы».
- Решение: требуется введение дополнительных признаков (например, по площади участка или источнику сведений).
2. Сельскохозяйственные зоны ↔ Зоны индивидуальной жилой застройки (ИЖС):
- Причина: в ряде описаний встречаются формулировки вроде «дом с участком», что может относиться и к ЛПХ, и к ИЖС.
- Решение: использование метаинформации (категория земель) повышает точность.
3. Зоны отдыха ↔ Зоны временного размещения объектов торговли:
- Причина: формулировки с ключевыми словами «временные сооружения», «палатки», «торговля» встречаются в обоих классах.
Таблица 4
Примеры ошибок
Входное описание | Правильная зона | Предсказано моделью |
«Для размещения торговых павильонов» | ОДЗ | МФЗ |
«Дом, сад, огород, баня» | ИЖС | Сельскохозяйственная |
«Палатки, прокат оборудования» | Зона отдыха | Торговая зона |
Обсуждение и перспективы
Применение модели позволило автоматизировать один из самых рутинных и трудоемких этапов проектирования, сравнимый по сложности с ручной отрисовкой функциональных зон. Вместо анализа десятков тысяч записей вручную, специалисты могут полагаться на ML-инструмент, который формирует первичный вариант, подлежащий уточнению.
Ключевые преимущества подхода:
- Сокращение времени выполнения задач по зонированию в 5–10 раз;
- Повышение согласованности данных между текстовыми и графическими разделами;
- Масштабируемость на другие территории и проекты;
- Возможность повторного обучения и адаптации модели под новые категории/региональные особенности.
Ограничения и условия применения
Ограничения:
- Модель зависит от качества входных данных и наличия корректно размеченного датасета;
- Снижение точности возможно для редких/специфических формулировок;
- Не заменяет экспертной проверки – служит инструментом поддержки решений.
Условия успешного применения:
- Подготовка обучающего датасета с реальными метками;
- Наличие команды, владеющей ML-инструментами, и ГИС-средой;
- Интеграция ML-сервиса в рабочие процессы.
Значение для органов власти и проектных организаций
Внедрение таких ML-моделей в работу муниципалитетов, проектных институтов и градостроительных бюро может существенно повысить эффективность проектирования. Это особенно важно в условиях:
- Дефицита кадров (архитекторов, аналитиков, специалистов по ПЗЗ);
- Росте объемов проектной документации;
- Необходимости стандартизации и унификации процедур зонирования.
Модель может быть полезна в задачах:
- Первичного зонирования для разработки ПЗЗ и ГП;
- Проверки на соответствие существующего использования;
- Мониторинга изменений землепользования.
Заключение
Применение технологий машинного обучения в градостроительном проектировании – это не будущее, а уже настоящее. Представленный кейс внедрения ML-модели на базе BERT показал, что задачи классификации видов разрешенного использования и предсказания функциональных зон могут быть решены автоматически с высокой точностью и эффективностью. Созданный ML-сервис интегрируется в ГИС-среду и радикально ускоряет процесс проектирования, снижая нагрузку на специалистов и повышая качество градостроительной документации.
Методология может быть масштабирована и адаптирована под различные задачи территориального планирования, что открывает широкие перспективы для цифровой трансформации отрасли.