Практика использования технологий машинного обучения в градостроительном проектировании: классификация видов разрешенного использования и предсказание функционального зонирования

Крашенинников Константин Иванович; Кузнецов Владислав Андреевич; Кулеш Николай Петрович

Аннотация статьи

Статья рассматривает опыт разработки и внедрения технологии машинного обучения (ML) в практику градостроительного проектирования на примере задачи классификации видов разрешенного использования (ВРИ) и прогнозирования функционального зонирования на основе анализа данных существующего землепользования. Описан процесс построения модели на выборке данных в 30 тыс. объектов, включая этапы предобработки, обучения и оценки качества. Демонстрируется, как использование предобученных трансформеров (BERT-моделей) позволило добиться высокой точности классификации и существенно автоматизировать трудоемкие этапы подготовки градостроительной документации. Представленные результаты имеют высокую практическую ценность как для органов исполнительной власти субъектов РФ, так и для компаний, осуществляющих свою деятельность в области территориального планирования, градостроительного зонирования и архитектуры.

Текст статьи

Введение

В условиях цифровой трансформации государственного управления и необходимости ускорения процессов градостроительного проектирования, остро встает задача внедрения технологий искусственного интеллекта, в частности методов машинного обучения, в градостроительное проектирование. Особенно актуальна автоматизация задач, традиционно выполняемых вручную, включая определение видов разрешенного использования (ВРИ) и функционального зонирования территорий, что требует значительных трудозатрат и экспертизы со стороны специалистов [1, 2].

Классические подходы к зонированию основаны на анализе существующего землепользования и экспертом толковании текстовых описаний участков. Эти описания, содержащиеся, например, в кадастровых планах территории (КПТ), отличаются высокой степенью разнородности, вариативности формулировок и отсутствием стандартизированных классификаторов. Следствием становится высокая нагрузка на специалистов ГИС и риск ошибок [3, с. 77-81; 4].

В данной статье представлен кейс внедрения ML-модели для автоматического определения ВРИ и соответствующей функциональной зоны на основании анализа текстового поля из КПТ. Рассматривается построение собственного ML-сервиса, основанного на архитектуре трансформеров, и его интеграция в процесс проектирования. Демонстрируется, как предложенное решение позволяет существенно сократить временные и трудозатраты, повысить согласованность данных и качество проектной документации.

Объект и предмет исследования

Объектом исследования является процесс функционального зонирования территорий в рамках разработки градостроительной документации.

Предмет исследования – применение методов машинного обучения для классификации видов разрешенного использования земельных участков и автоматического предсказания функциональных зон.

Цель и задачи исследования

Цель статьи – продемонстрировать возможности и эффективность применения ML-моделей для автоматизации зонирования территорий на основе анализа текстовых описаний участков из кадастровых данных.

Задачи:

Описать проблематику ручной классификации ВРИ и зонирования.
Представить архитектуру и принцип работы ML-модели.
Проанализировать качество предсказаний модели на реальных данных.
Оценить перспективы масштабирования технологии и ее значимость для практики.

Методология и техническая реализация

Исходные данные

В качестве обучающей выборки использовались сведения о 30000 земельных участках, собранные в процессе пилотного проекта (город Вологда). Главным источником информации выступало текстовое поле из КПТ, содержащее описания фактического использования участка. Характер данных – нерегламентированный, с высокой степенью разнообразия формулировок.

Обработка данных

Текстовые описания нормализованы и приведены к унифицированному формату.

Выполнено ручное присвоение целевых меток – кода ВРИ и функциональной зоны (например, «Жилая застройка», «Образование», «Производственная зона»).

Датасет разделен на обучающую (80%) и тестовую (20%) выборки.

Архитектура модели

Была использована русскоязычная реализация трансформерной модели класса BERT (Bidirectional Encoder Representations from Transformers), дообученная на задаче многоклассовой классификации. Выбор BERT объясняется:

высокой способностью к интерпретации контекста;
устойчивостью к неточным или разнородным формулировкам;
высокой точностью при ограниченных объемах данных.

Обработка реализована в виде ML-сервиса, принимающего на вход ID участка и описание, и возвращающего ID класса ВРИ и соответствующую функциональную зону [5].

Результаты: точность модели и практика применения

На тестовой выборке (≈6000 объектов) модель показала общую точность предсказаний 98,6%. Классы с наиболее частотным представлением (например, жилая застройка) классифицируются с точностью 99%+. Менее распространенные классы имеют незначительное снижение метрик (до 95%).

Таблица 1

Точность предсказаний (пример)

Код ВРИ	Название зоны	Кол-во объектов	Точность (%)
01	Жилая застройка	1709	100.0
12	Образование	92	98.9

Результаты модели интегрированы в работу геоинформационной платформы QGIS. После запуска сервиса специалисты получают автоматически раскрашенную карту зонирования – участки визуализируются в соответствии с классификацией (по приказу № 10), что упрощает анализ и принятие решений.

Технические аспекты реализации: принципы, технологии и архитектура моделей.

Принципы классификации в машинном обучении

Классификация – одна из базовых задач машинного обучения, цель которой – отнести входной объект к одному из заранее заданных классов. В нашем случае входом является текстовое описание вида использования земельного участка (поле из КПТ), а выходом – предсказанный код функциональной зоны и категория ВРИ [6].

Процесс классификации включает следующие этапы:

1. Предобработка данных:

нормализация текста (приведение к нижнему регистру, удаление пунктуации, лемматизация);
токенизация – разбиение текста на элементы (токены), понятные модели.

2. Обучение модели:

модель «читает» тысячи пар «текст – правильная категория»;
формируются численные представления (эмбеддинги), которые отражают семантику слов;
оптимизируются веса нейросети для минимизации ошибки классификации.

3. Инференс (предсказание):

на новых данных модель сопоставляет текст с наиболее вероятным классом.

Для обучения используется супервизорный подход: датасет содержит примеры с заданными метками, по которым модель учится распознавать закономерности.

Использование BERT в задаче классификации

Особенности BERT

Модель BERT (Bidirectional Encoder Representations from Transformers) – это трансформер, обученный на больших корпусах текстов, с целью понимания контекста. Главное отличие BERT от традиционных моделей:

она двунаправленная: при обработке текста учитывается как левый, так и правый контекст каждого слова;
она работает с текстом на уровне подслов (субслов), что особенно полезно для русского языка с его морфологией.

Для задачи был выбран вариант BERT, дообученный на русском языке.

Преимущества BERT:

высокая точность при ограниченном количестве размеченных данных;
способность учитывать контекст, в том числе редкие или некорректно сформулированные фразы;
возможность дообучения под конкретную задачу (fine-tuning).

Таблица 2

Отличие BERT от GPT

Параметр	BERT	GPT
Архитектура	Encoder (двунаправленный)	Decoder (однонаправленный)
Назначение	Понимание текста, классификация	Генерация текста
Область применения	Анализ, классификация, извлечение	Чат-боты, автокомплит, генерация
Пример использования	Определение ВРИ по описанию	Генерация пояснительных записок

BERT – это «читающая» модель. GPT – «пишущая». Поэтому в задачах классификации BERT демонстрирует значительно более высокую эффективность.

Процесс обучения модели

Разметка: вручную метятся пары «текст – класс» (например, «используется под торговый центр» → «Общественно-деловая зона»).
Fine-tuning BERT: модель дообучается на размеченных данных с использованием кросс-энтропийной функции потерь и оптимизатора AdamW.
Валидация: проводится проверка качества на независимой части данных.
Метрики оценки: Accuracy (общая точность); Precision/Recall/F1-score по классам; Confusion Matrix – для визуального анализа ошибок.

Обучение производилось на GPU, при этом полный цикл fine-tuning занимал не более 3 часов (на датасете из 30 тыс. строк).

Инструменты и технологии

Язык и библиотеки:

Python (основной язык);
transformers от HuggingFace – для загрузки и fine-tuning моделей BERT;
scikit-learn – для оценки качества модели;
pandas и numpy – для обработки табличных данных;
Flask / FastAPI – развертывание модели как веб-сервиса.

Инфраструктура:

Облако или локальный сервер с GPU (NVIDIA RTX 3060/3090);
Хранилище модели – .pt файл (PyTorch);
REST API – взаимодействие между ML-моделью и QGIS-интерфейсом.

Преимущества и ограничения подхода

Преимущества:

Высокая точность даже на небольших датасетах;
Универсальность: BERT можно применять к другим текстовым задачам в градостроительстве (анализ обращений граждан, генерация текстов);
Легкость масштабирования – можно дообучить под другой регион.

Ограничения:

Требуется предварительно размеченный датасет;
Обучение требует вычислительных ресурсов (GPU);
Вариативность формулировок – ключевой источник ошибок;
Необходим контроль за качеством данных (ошибки в исходных текстах ухудшают результат).

Возможности дальнейшего развития:

Мультиклассовая классификация с вероятностным выводом (softmax);
Обратная связь от пользователей (active learning) – модель переобучается по исправленным ошибкам;
Интеграция с QGIS через плагины – полная автоматизация от ввода КПТ до генерации цветной карты;
Добавление многомодальных признаков – совместное использование текстов, геометрии участка, кадастровой стоимости.

Сравнение с альтернативными моделями и методами

Для оценки эффективности предложенного подхода были проведены сравнения модели BERT с несколькими альтернативами, включая:

TF-IDF + логистическая регрессия – классический статистический подход, не учитывающий контекст;
LSTM (долгая краткосрочная память) – рекуррентная нейросеть;
FastText – облегчённая векторная модель от Facebook [7].

Таблица 3

Сводная таблица сравнения

Метод	Accuracy (%)	Плюсы	Минусы
TF-IDF + лог. регрессия	84.7	Простота реализации	Низкая точность, не учитывает контекст
FastText	89.5	Быстрота, простота	Ограниченное понимание структуры текста
LSTM	93.2	Учет последовательности слов	Требует много времени на обучение, не стабилен
BERT (использованный)	98.6	Контекстуальность, устойчивость	Требует GPU, требует более сложной интеграции

Анализ ошибок модели и проблемные классы

Несмотря на высокую общую точность, анализ матрицы ошибок показал, что модель склонна путать между собой некоторые схожие классы. Это особенно выражено в следующих случаях:

1. Общественно-деловая застройка (ОДЗ) ↔ Многофункциональная зона (МФЗ):

Причина: оба класса часто имеют в описаниях слова «торговля», «услуги», «офисы».
Решение: требуется введение дополнительных признаков (например, по площади участка или источнику сведений).

2. Сельскохозяйственные зоны ↔ Зоны индивидуальной жилой застройки (ИЖС):

Причина: в ряде описаний встречаются формулировки вроде «дом с участком», что может относиться и к ЛПХ, и к ИЖС.
Решение: использование метаинформации (категория земель) повышает точность.

3. Зоны отдыха ↔ Зоны временного размещения объектов торговли:

Причина: формулировки с ключевыми словами «временные сооружения», «палатки», «торговля» встречаются в обоих классах.

Таблица 4

Примеры ошибок

Входное описание	Правильная зона	Предсказано моделью
«Для размещения торговых павильонов»	ОДЗ	МФЗ
«Дом, сад, огород, баня»	ИЖС	Сельскохозяйственная
«Палатки, прокат оборудования»	Зона отдыха	Торговая зона

Обсуждение и перспективы

Применение модели позволило автоматизировать один из самых рутинных и трудоемких этапов проектирования, сравнимый по сложности с ручной отрисовкой функциональных зон. Вместо анализа десятков тысяч записей вручную, специалисты могут полагаться на ML-инструмент, который формирует первичный вариант, подлежащий уточнению.

Ключевые преимущества подхода:

Сокращение времени выполнения задач по зонированию в 5–10 раз;
Повышение согласованности данных между текстовыми и графическими разделами;
Масштабируемость на другие территории и проекты;
Возможность повторного обучения и адаптации модели под новые категории/региональные особенности.

Ограничения и условия применения

Ограничения:

Модель зависит от качества входных данных и наличия корректно размеченного датасета;
Снижение точности возможно для редких/специфических формулировок;
Не заменяет экспертной проверки – служит инструментом поддержки решений.

Условия успешного применения:

Подготовка обучающего датасета с реальными метками;
Наличие команды, владеющей ML-инструментами, и ГИС-средой;
Интеграция ML-сервиса в рабочие процессы.

Значение для органов власти и проектных организаций

Внедрение таких ML-моделей в работу муниципалитетов, проектных институтов и градостроительных бюро может существенно повысить эффективность проектирования. Это особенно важно в условиях:

Дефицита кадров (архитекторов, аналитиков, специалистов по ПЗЗ);
Росте объемов проектной документации;
Необходимости стандартизации и унификации процедур зонирования.

Модель может быть полезна в задачах:

Первичного зонирования для разработки ПЗЗ и ГП;
Проверки на соответствие существующего использования;
Мониторинга изменений землепользования.

Заключение

Применение технологий машинного обучения в градостроительном проектировании – это не будущее, а уже настоящее. Представленный кейс внедрения ML-модели на базе BERT показал, что задачи классификации видов разрешенного использования и предсказания функциональных зон могут быть решены автоматически с высокой точностью и эффективностью. Созданный ML-сервис интегрируется в ГИС-среду и радикально ускоряет процесс проектирования, снижая нагрузку на специалистов и повышая качество градостроительной документации.

Методология может быть масштабирована и адаптирована под различные задачи территориального планирования, что открывает широкие перспективы для цифровой трансформации отрасли.

Список литературы

Градостроительный кодекс Российской Федерации (с последними изменениями).
Борщов А. Корус Консалтинг. Эффективное использование нейросетей. Презентация, 2025.
Кузнецов В.А., Крашенинников К.И., Кулеш Н.П. Анализ эффективности разработки генерального плана в условиях ресурсного дефицита // Актуальные исследования. 2025. № 30 (265). Ч. I. С. 77-81. URL: https://apni.ru/article/12753-analiz-effektivnosti-razrabotki-generalnogo-plana-v-usloviyah-resursnogo-deficita.
Кузнецов В.А. Трансформация градостроительного проектирования в РФ за последние 10 лет // Электронное периодическое издание «Аллея науки» 2025. № 7 (106). Т. 1.
Кузнецов В.А., Крашенинников К.И., Кулеш Н.П. QGIS как инструмент производственной оптимизации: прагматичный взгляд // Актуальные исследования. 2025. № 31 (266). URL: https://apni.ru/article/12795-qgis-kak-instrument-proizvodstvennoj-optimizacii-pragmatichnyj-vzglyad.
Методические рекомендации по разработке генеральных планов поселений и городских округов (Минстрой России).
Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.

Похожие статьи

Другие статьи из раздела «Информационные технологии»