Введение
Традиционные системы видеонаблюдения, десятилетиями служившие исключительно для реактивной безопасности и расследования инцидентов, к началу 2019 года достигли своего функционального предела. Их основное назначение сводилось к пассивной записи видеопотока, который требовал постоянного и утомительного мониторинга со стороны человека или просматривался уже после совершения происшествия. Это создавало фундаментальную проблему – огромные объемы видеоданных оставались неиспользованными, а их ценность ограничивалась исключительно функцией фиксации.
С появлением и повсеместным развитием технологий искусственного интеллекта, в частности методов компьютерного зрения, глубокого обучения, возникла принципиально новая возможность. Видеопоток перестал быть инертной записью, он превратился в активный источник структурированных данных, которые способны предоставить беспрецедентный уровень деловой аналитики и значительно повысить операционную эффективность. Целесообразно обратиться к анализу этого сдвига, к изучению конкретных прикладных решений, уже доступных на рынке в 2019 году, к рассмотрению вызовов, с которыми сталкиваются компании при их внедрении.
К концу 2018 года технологии глубокого обучения достигли зрелости, достаточной для широкомасштабного коммерческого применения. Ведущие производители (в качестве примеров уместно привести Hikvision [10], Axis Communications [8], Agent Vi [7]) активно предлагают комплексные программно-аппаратные решения, которые кардинально отличаются от предшественников. Эти системы уходят от простого детектирования движения, переходя к распознаванию, классификации, поведенческому анализу объектов. Данная эволюция знаменует собой переход от реактивного видеонаблюдения к проактивной бизнес-разведке.
В рамках статьи предлагается сфокусироваться на трех ключевых вопросах – как именно ИИ преобразует видеонаблюдение, какие конкретные коммерческие выгоды он приносит в розничной торговле и, наконец, какие технические, правовые, этические проблемы возникают при его массовом внедрении.
Материалы и методы
Проведенный при подготовке статьи анализ публикаций, которые посвящены интеллектуальным системам видеонаблюдения, отражает неоднородность подходов. Часть работ сфокусирована на теоретических и концептуальных аспектах, где объясняются общие принципы, а также роль технологий в обеспечении безопасности, как это сделано в статьях В. Э. Баумтрога, В. Г. Пирогова [1, с. 212-215], Д. Г. Подвербного, Н. А. Войтовой [4, с. 401-407], М. Е. Эрнста, М. С. Щербакова, Е. В. Шарлаева [6, с. 225-228]. Эти авторы рассматривают видеонаблюдение с позиции технической защиты, а также общих возможностей. Другой блок трудов сконцентрирован на прикладных аспектах и конкретных продуктовых решениях. Например, публикации компаний Amicom [2], Agent Vi [7], Axis Communications [8], Dahua Technology [9], Hikvision [10] содержат характеристики коммерческих продуктов (интеллектуальные камеры и видеорегистраторы, оснащенные алгоритмами глубокого обучения). Материал Г. Копиева [3] представляет узкоспециализированное прикладное изыскание по сортировке людей по росту, полу, что иллюстрирует возможности нейросетей в видеоаналитике. С. Шумский в своей аналитике [5] рассматривает искусственный интеллект с точки зрения вызовов и угроз. И. Бахарев оценивает кейс Х5 Retail Group, проецируя проблематику на сферу ритейла [11].
Несмотря на наличие множества работ, где раскрываются технические и именно прикладные стороны, мало исследований, которые посвящены правовым и этическим аспектам внедрения систем видеонаблюдения с ИИ, в том числе, вопросам конфиденциальности, защиты данных. Недостаточно полно проработана проблематика, сопряженная с предвзятостью алгоритмов и их потенциальным влиянием на дискриминацию. Это создает пробелы в понимании социальных последствий массового внедрения соответствующих разработок.
При написании статьи были использованы следующие методы: анализ и синтез (для обобщения разрозненной информации и формирования единой картины), систематизация (в целях упорядочивания материалов по функциональным и прикладным областям), контент-оценка публикаций (для изучения их содержания, выделения ключевых идей), сравнение (сопоставление подходов и продукции, предлагаемой ведущими компаниями на рынке).
Результаты и обсуждение
Современность характеризуется эпохой нарастающего «навеса» компьютерных мощностей, все более превосходящих совокупную «вычислительную мощность» человечества (количество людей, умноженное на максимальный объем их индивидуальных знаний и на скорость доступа к этим знаниям) (рис.). Они сосредоточены не в процессорах общего назначения (CPU, нижняя ветка), а в графических ускорителях (GPU, верхняя ветка), которые, в основном, и используются для обучения искусственных нейросетей [5].

Рис. Рост совокупных компьютерных мощностей [5]
В основе современных интеллектуальных систем видеонаблюдения лежит компьютерное зрение – область искусственного интеллекта, которая позволяет машинам автоматически идентифицировать, классифицировать, отслеживать объекты в видеопотоке. Ключевая роль в рассматриваемом процессе отводится методам глубокого обучения [1, с. 212-215; 2; ; 6, с. 225-228].
Характеризуемый подход требует колоссальных вычислительных мощностей. Исторически видеоаналитика обрабатывалась на центральных серверах, куда со всех камер поступал «сырой» видеопоток. Однако для крупных инсталляций, насчитывающих сотни или тысячи камер, это приводило бы к огромным задержкам, перегрузке сетевой инфраструктуры, непомерным затратам на серверное оборудование. Решением стал переход на архитектуру периферийных вычислений. В этой концепции часть алгоритмов глубокого обучения переносится непосредственно на интеллектуальные камеры, которые оснащены специализированными процессорами. Ярким примером служат камеры серии DeepinView от Hikvision [10]. Такой подход помогает обрабатывать данные на месте, отправляя на центральный сервер только метаданные или сжатые результаты анализа, что весомо повышает скорость реакции, снижает стоимость развертывания системы. Помимо интеллектуальных камер, архитектура включает программное обеспечение для видеоаналитики. Централизованные системы управления, в частности, HikCentral, способны управлять видеопотоком и аналитикой из множества торговых точек. Специализированные платформы, например, innoVi Enterprise от Agent Vi [7], задействуют алгоритмы глубокого обучения с целью предоставления пользователю структурированных отчетов, мгновенных оповещений, избавляя от необходимости постоянного человеческого мониторинга.
Таким образом, современная система – это не банальный набор камер, а комплексный программно-аппаратный продукт, благодаря которому видеоданные трансформируются в практическую бизнес-информацию.
Интеллектуальное видеонаблюдение находит все более широкое применение в коммерческой сфере, преобразуя операционные процессы, предоставляя ценные сведения для принятия решений. Особо заметны эти изменения в индустрии розничной торговли.
Одной из наиболее востребованных функций является построение тепловых карт. На них визуально отображаются маршруты движения покупателей, зоны их наибольшей концентрации в торговом зале. С их помощью ритейлеры имеют возможность глубоко анализировать эффективность выкладки товаров, оценивать привлекательность рекламных экспозиций, оптимизировать зонирование всего торгового пространства. Другая важная функция – подсчет людей. Она помогает собирать обезличенную статистику о количестве входящих и выходящих посетителей, что позволяет рассчитывать конверсию, оценивать результативность маркетинговых кампаний. Эти данные, агрегированные по времени, также задействуются в целях оптимизации графика работы персонала.
ИИ-системы также берут на себя рутинные задачи, повышая действенность операций. К примеру, они могут в режиме реального времени отслеживать состояние торговых полок. При обнаружении пустых мест или исчерпания запаса система автоматически отправляет уведомление персоналу магазина, что сокращает время простоя, предотвращает потерю продаж. Подобный подход применяется и для управления потоками клиентов. Анализ длины очереди у касс помогает оптимизировать рабочий процесс – если количество ожидающих превышает заданный порог, система автоматически уведомляет менеджера о необходимости открыть дополнительную кассу. За счет рассматриваемого механизма обеспечивается высокий уровень обслуживания, сокращается время ожидания, существенно повышается удовлетворенность клиентов.
Системы распознавания лиц применяются для создания концепции «черных» и «белых» списков на основе обезличенного ID-идентификатора, без привязки к персональным данным человека. Описываемый подход позволяет идентифицировать лиц, ранее замеченных в кражах (для немедленного оповещения службы безопасности), или, напротив, постоянных клиентов (чтобы обеспечить им премиальное обслуживание при входе).
Использование искусственного интеллекта в ритейле стирает границы между отделами. Если раньше видеонаблюдение было прерогативой службы безопасности, то теперь данные с тех же камер, проанализированные ИИ, используются для принятия решений в маркетинге, управлении персоналом, логистике (табл. 1). Таким образом, инвестиции в анализируемую область приносят множественные выгоды, которые напрямую влияют на выручку, а сама система преобразует свою роль – от реактивной фиксации к проактивной бизнес-разведке.
Таблица 1
Систематизация прикладных решений видеоаналитики в розничной торговле (составлено на основе 1, с. 212-215; 4, с. 401-407; 6, с. 225-228])
Функция видеоаналитики | Основное назначение в ритейле | Деловая выгода |
| 1. Тепловые карты | Оптимизация расположения товаров и зонирования торгового зала | Увеличение времени пребывания клиентов, повышение продаж, анализ эффективности рекламных экспозиций. |
| 2. Подсчет людей | Определение трафика входа/выхода, анализ конверсии посетителей в покупателей | Оптимизация рабочего графика персонала, оценка результативности маркетинговых кампаний. |
| 3. Распознавание очередей | Управление потоками клиентов у касс | Сокращение времени ожидания, повышение удовлетворенности клиентов, предотвращение потери продаж. |
| 4. Контроль состояния полок | Мониторинг наличия продукции в режиме реального времени | Автоматизация пополнения запасов, снижение ситуаций отсутствия товара на складе, увеличение продаж. |
| 5. Распознавание лиц (ID-идентификация) | Управление доступом, персонализация обслуживания, предотвращение краж | Повышение безопасности, улучшение сервиса для лояльных клиентов. |
Среди кейсов целесообразно привести следующие примеры. Индийские исследователи из Ахмадабадского университета во главе с Мехулом Равалом разработали нейросеть, которая ищет на видеозаписях людей по росту, полу, цвету одежды. Это позволяет значительно сократить объем данных, которые приходится просматривать оператору. Алгоритм основан на Mask R-CNN (сначала сеть выделяет людей на кадрах, затем оценивает их рост с учетом перспективы, определяет основной и дополнительный цвета одежды, а при необходимости использует и пол как дополнительный критерий). Для обучения применялись датасеты COCO и SoftBioSearch с вариациями угла и освещения. Система показала успешное распознавание 28 из 41 человека, а для 19 из них доля корректных кадров превысила 60%. Отмечается, что подобный подход поможет ускорить поиск нужного человека на видеозаписях и повысить точность фильтрации. Параллельно другая команда из Индии и Великобритании создала систему на базе дрона, способную выявлять акты насилия по характерным позам людей [3].
28 июня 2018 года Dahua Technology представила свой первый сетевой видеорегистратор IVSS с интегрированными алгоритмами глубокого обучения. Устройство объединяет GPU и ИИ-алгоритмы для точного распознавания лиц (поддерживается до 4 каналов в реальном времени и до 20 библиотек по 100 000 изображений каждая). Система умеет обнаруживать незнакомые лица, задавать «порог сходства» для сигналов тревоги; она ориентирована на критически важные объекты – бизнес-парки, банки, тюрьмы, школы. Новый интерфейс IVSS упростил работу операторов, сократил время обучения вкупе с обеспечением удобного удаленного доступа. Решение позиционируется как доступный, эффективный инструмент для мониторинга в реальном времени, демонстрирующий потенциал Dahua в области ИИ-технологий и их применения в системах безопасности [9].
В июне 2018 года X5 Retail Group представила результаты пилотного проекта по внедрению систем видеоаналитики и компьютерного зрения в сетях «Перекресток» и «Пятерочка». Проект был направлен на контроль наличия товаров, управление очередями, предотвращение потерь. Были достигнуты следующие измеримые результаты:снижение потерь (общие сократились на 20%.), количество краж в магазинах, участвовавших в проекте, снизилось вдвое, число покупателей, уходящих без покупки, уменьшилось на 10%. В ходе проекта система научилась распознавать около 1500 наименований товаров с точностью 93,7% [11].
Массовое внедрение интеллектуальных систем видеонаблюдения сопряжено с рядом серьезных вызовов, в первую очередь, в правовой и этической плоскостях (табл. 2). Использование технологий распознавания лиц вызывает значительные опасения у общественности, поскольку может привести к повсеместному, неконтролируемому мониторингу. Отсутствие четкого законодательного регулирования во многих странах создает серьезные правовые пробелы, позволяя задействовать технологию без должного контроля.
Таблица 2
Характеристика правовых и этических вызовов при массовом внедрении интеллектуальных систем видеонаблюдения (составлено на основе [1, с. 212-215; 4, с. 401-407; 6, с. 225-228])
Аспект | Краткое описание | Последствия | Оперативные меры смягчения |
| 1. Конфиденциальность и обработка персональных данных | Сбор видео/биометрии потенциально содержит персональные данные. | Юридические санкции, утрата доверия, репутационные риски. | Псевдонимизация, минимизация хранения, ретеншн-политики, DPIA. |
| 2. Смещение и дискриминация моделей | Модели хуже работают для отдельных демографических групп. | Несправедливое обращение, правовые претензии. | Аудит по подгруппам, баланс данных, корректирующие алгоритмы, регулярное тестирование. |
| 3. Безопасность данных и риск утечек | Централизованные хранилища и потоки уязвимы к взлому. | Утечка видео, финансовые и репутационные потери. | Шифрование, сегментация сетей, регулярные обновления. |
| 4. Прозрачность решений, ложные срабатывания | «Черные ящики» и высокий FP/FN разрушают доверие и снижают эффективность. | Игнорирование системы, ошибочные действия операторов, жалобы. | Логирование решений, пороговая калибровка. |
| 5. Правовое соответствие | Разные юрисдикции и неясные зоны ответственности между поставщиками/операторами. | Непреднамеренные правонарушения, споры при инцидентах. | Юридический анализ по территориям, контрактные SLA, регламенты доступа, аудит. |
Невзирая на все достижения, искусственный интеллект в системах видеонаблюдения не способен полностью заменить человека. Хотя ИИ превосходен в детектировании, анализе данных, ему недостает человеческого суждения, эмпатии, способности к ситуационной адаптации. Система может ошибочно распознать потерявшегося ребенка как нарушителя либо заблокировать доступ подрядчику, чей пропуск был деактивирован по ошибке. В этих случаях лишь человек в состоянии оценить контекст и принять верное решение.
Выводы
К 2019 году искусственный интеллект прочно вошел в сферу видеонаблюдения, преобразуя ее из средства безопасности в мощный инструмент бизнес-анализа. Уже существующие коммерческие решения (в частности, тепловые карты, системы подсчета людей, интеллектуальный контроль операционных процессов и т. д.), доказали свою действенность в повышении операционной эффективности, глубоком понимании клиентского поведения. А пилотный проект X5 Retail Group в 2018 году наглядно продемонстрировал, что внедрение систем видеоаналитики и компьютерного зрения является эффективным инструментом для решения ключевых задач розничной торговли.
С авторской точки зрения, в ближайшей перспективе уместно ожидать дальнейшего развития периферийных вычислений. Соответствующая вычислительная мощность камер будет продолжать расти, позволяя выполнять все более сложные алгоритмы непосредственно на устройстве. В дополнение к отмеченному, видеонаблюдение будет все глубже интегрироваться с другими коммерческими системами – управления торговлей (POS), контроля доступа, с устройствами Интернета вещей – создавая единую, интеллектуальную экосистему.
Как представляется, весьма значимым останется поиск равновесия между внедрением инноваций и соблюдением права на частную жизнь. По мере того как технологические разработки усовершенствуются с высокой скоростью, юридическая и этическая база будут вынуждены их догонять.
В конечном счете, вне зависимости от уровня автоматизации, человеческий фактор останется незаменимым. Искусственный интеллект является не заменой, а инструментом, который освободит людей от рутинных задач, давая им возможность сосредоточиться на принятии сложных решений, требующих критического мышления, контекстуального понимания, чего машины пока не способны достигнуть.

.png&w=640&q=75)