Проблема качества подготовки данных для обучения нейронных сетей в контексте задачи распознавания объектов

Аннотация статьи

В статье рассматривается проблема качества подготовки данных для обучения нейронных сетей. В наши дни технологии искусственного интеллекта внедряются в различные сферы деятельности. Для решения задачи распознавания объектов, необходимы наборы качественно подготовленных данных для обучения. На данный момент существует ряд проблем, которые не позволяют получать обучающие наборы данных высокого качества по приемлемой стоимости. Комплексный подход к решению данных проблем позволит повысить качество размеченных данных. В данной статье предлагается решение по созданию платформы, позволяющей пользователем осуществлять процесс подготовки данных с использованием специальных геймифицированных механик, временных ограничений и системы мотивации.

Текст статьи

Для разработки и обучения нейронных сетей компании остро нуждаются в больших массивах размеченных наборов данных. Во всех крупных отраслях использование технологий искусственного интеллекта принято на вооружение. Крупные компании увеличивают свои ежегодные расходы на разработку и внедрение приложений с элементами искусственного интеллекта, это позволяет улучшить бизнес-процессы компаний и повысить их конкурентное преимущество перед компаниями, которые не используют новейшие технологии в своих процессах. В наше время востребованность программного обеспечения на основе искусственного интеллекта возрастает с каждым днем, так как объемы обрабатываемых данных увеличиваются, повышается вычислительная мощность компьютеров и производительность алгоритмов. Технологии искусственного интеллекта проникли практически в каждую отрасль, позволив машинам говорить, слушать, двигаться и принимать решения, а множество вариантов их использования раскрывают потенциальные возможности для развития бизнеса, привлекают новые инвестиции и способствуют изменениям в существующих бизнес-процессах.

Согласно отчету Tractica [2], технологии, использующие искусственный интеллект на конец 2018 года, используются в 258 областях. Главным технологическим трендом отрасли является распознавание объектов на изображении компьютерным зрением.

При работе с изображениями одной из наиболее актуальных архитектур нейронных сетей являются конволюционные нейронные сети. Они позволяют осуществлять усреднение комбинаций пикселей, без потери информации об их относительном расположении. Модель «запоминает» силуэт объекта и может распознать подобный объект на другом изображении. За последние два года в среднем время обучения моделей классификаторов для решения базовой задачи компьютерного зрения уменьшилось в 15 раз. Это показывает стремительное развитие алгоритмов и вычислительных мощностей [1].

Common Objects in Context Challenge (COCO, распространённые объекты в контексте) – это новый, усложненный алгоритм, предполагающий определение границ у объекта, а также позволяет разделить сцены на изображении с точностью до пикселя [4]. За последние три года точность решения данных задач увеличилась на 70%.

В настоящее время существует проблема качества подготовки данных для обучения нейронных сетей. Чем точнее данные, подаваемые на вход для обучения, тем выше качество распознавания объектов на выходе. Таким образом, задача подготовки обучающих данных является одной из ключевых в вопросе создания различных решений, использующих искусственный интеллект.

Прежде всего были выявлены и подтверждены следующие гипотезы:

У текущих сервисов по разметке данных чересчур низкая вовлеченность сотрудников в рабочий процесс, что сказывается на качестве результатов.
Текущая рыночная стоимость выполненной работы по разметке данных для обучения не соответствует качеству.
Пользователям, выполняющим разметку данных не интересно и скучно осуществлять эту задачу. Процесс однообразен, долгий и монотонный труд плохо сказывается на концентрации внимания разметчика, из-за чего возникает большое число ошибок.

Таким образом можно сделать вывод, что качество является основной проблемой в области разметки данных. На текущий момент компании-игроки рынка разметки данных используют труд фрилансеров или наемных работников, которые обладают крайне низкой мотивацией к качественному выполнению своей работы [3], а также имеют ненормированный рабочий день. В результате размеченные наборы данных имеют большое количество ошибок, которые вынужденно отдаются на коррекцию, возможно, не один раз.

Заявленную проблему предлагается разрешить путем разработки платформы для разметки данных. Процесс разметки на данной платформе полностью геймифицирован, что добавляет интереса и азарта, а монотонная работа лишается тягостного ощущения труда. Продуманный сеттинг, развитие персонажа, соревновательные элементы, достижения и поощрения – отличная мотивация для продуктивной разметки.

Еще одним мотиватором для качественного выполнения работы является образовательная составляющая платформы. Размечая данные, пользователи платформы получают внутриигровую валюту, на которую можно приобрести образовательные программы, курсы, лекции с интересными спикерами. Ограничение времени в работе каждого пользователя на платформе является еще одной механикой повышения качества данных на выходе. При непрерывной деятельности концентрация снижается через три часа. Хорошим примером служит работа авиадиспетчеров, график которых строго разбит на короткие интервалы времени, что не позволяет работникам снижать концентрацию и внимание. Таким образом предлагается разбить работу каждого пользователя платформы на 2 интервала по 2 часа в день с перерывом минимум один час.

Технологию проекта условно можно разбить на две части:

1. Техническая часть. Для разметки изображений используется технология Canvas. По сравнению с популярным решением CVAT, она обладает такими преимуществами, как высокая скорость отклика, отсутствие перегруженности интерфейса, возможность гибкой настройки и масштабирования. Используемый стек технологий: React, redux, Python, Flask, SQL. Сервисы: Amazon AWS.

2. Поведенческо-психологическая часть. Весь процесс геймификации на платформе выстраивается экспертом по поведенческой психологии. Вовлеченность пользователя в процессы, желание возвращаться на платформу каждый день и рассказывать о ней своим друзьям опирается на научные исследования в области анализа работы человеческого мозга, поведенческой психологии, принципов принятия решений.

Резюмируя все вышесказанное, можно составить список особенностей, которые отличают данное решение от существующих методов подготовки данных и решающих проблему качества подготовки:

процесс разметки данных полностью геймифицирован, что позволяет получить наибольшее вовлечение в процесс;
предполагается, что на платформе будут работать в основном студенты IT-специальностей, которые заинтересованы не только в оплате работы, но и получении новых знаний и опыта;
достижение высокого качества данных на выходе за счет геймифицированных механик, временных ограничений работы, а также высокой мотивации пользователей в процессе разметки.

Список литературы

Ильин И.А. Обзор развития технологий искусственного интеллекта в 2018 году // Будущее. 2019. URL: https://vc.ru/future/55610-obzor-razvitiya-tehnologiy-iskusstvennogo-intellekta-v-2018-godu (дата обращения: 20.12.2019).
Искусственный интеллект (мировой рынок) // Искусственный интеллект. 2019. URL: www.tadviser.ru/index.php/Статья:Искусственный_интеллект_(мировой_рынок) (дата обращения: 20.12.2019).
Levitt, Steven D., John A. List, Susanne Neckermann and Sally Sadoff. “The Behavioralist Goes to School: Leveraging Behavioral Economics to Improve Educational Performance. NBER Working Paper No. 18165.” (2012).
Sara Sabour, Nicholas Frosst, Geoffrey E Hinton. «Dynamic Routing Between Capsules». arXiv:1710.09829. (2017).

Проблема качества подготовки данных для обучения нейронных сетей в контексте задачи распознавания объектов

Цитирование

Похожие статьи

Другие статьи из раздела «Технические науки»