Актуальность. Последние достижения в области компьютерного зрения, появление возможностей быстрой оцифровки гистологических препаратов повысили интерес к приложениям искусственного интеллекта (ИИ) для патологии. Современные алгоритмы способны, к примеру, обнаруживать рак, опухоли, помогать в постановке диагноза пациенту [3]. Многие алгоритмы полагаются только на полнослайдовое изображение (WSI) и метаданные, некоторые также требуют аннотаций клеток, тканей и других объектов на WSI. Эта дополнительная информация помогает связать гистологические изображения с лежащей в их основе биологией патологических изменений и может улучшить интерпретируемость и обобщаемость полученных алгоритмов [2]. Легкие как орган дыхательной системы играют важную роль в поддержании гомеостаза организма, обеспечивая газообмен, поддерживая кислотно-щелочной баланс крови. Нарушение этих ключевых функций вследствие патологических состояний может приводить к необратимым для организма последствиям. Так, наиболее частой причиной смерти пациентов с инфекцией COVID-19 был респираторный дистресс-синдром взрослого типа (РДСВ), морфологически проявляющийся диффузным альвеолярным повреждением (ДАП). Создание алгоритма оценки морфологических изменений легких при инфекции COVID-19 с помощью подходов компьютерного анализа позволяет внедрить элементы цифровой патологии в научно-исследовательскую работу, а также образовательный процесс.
Цель: разработать цифровую образовательно-исследовательскую платформу для анализа гистологических данных, создать на ее базе модель нейронной сети, способную графически определять патоморфологические изменения, выявлять количественные и пространственные закономерности иммунного ответа в лёгких при коронавирусной инфекции COVID-19 для дальнейшей интеграции программы в научно-образовательный и практический процессы.
Задачи:
- Сформировать целевую выборку (датасеты) для обучения модели на множественных примерах патологий.
- Выбрать оптимальную архитектуру для выполнения задачи и обучить модель-классификатор.
- Исследовать точность полученной модели.
- Разработать программный комплекс, интегрирующий ИИ и систему графической аннотации.
Материалы и методы. Набор данных состоял из полнослайдовых изображений (WSI) гистологических препаратов легких от 10 пациентов, умерших от COVID-19. Препараты окрашены гематоксилином и эозином. Данные были предоставлены открытой международной научной базой Национального института здоровья США (NIH) и Objective Whole Slide Image Server.
Из данного датасета случайным образом были выделены 200 фрагментов размером 1024 × 882 пикселей. Все изображения были нормализованы в цвете и увеличении. С помощью инструмента аннотирования LabelImg была произведена графическая разметка объектов. Далее, обработанные данные были использованы в качестве датасета для обучения многоуровневой архитектуры свёрточных нейронных сетей (линейный выпрямитель с «утечкой») [1].
Результаты и их обсуждение. Чтобы решить эту проблему, была разработана система интегрированная платформа поддержки принятия врачебных решений (ИПППВР), позволяющая создавать эффективные и высококачественные аннотации в любом масштабе, производить обмен данными, использовать всю информацию для обучения как моделей глубокого обучения, так и пользователей системы (студентов, исследователей). ИПППВР состоит из трех программных компонентов – модели сегментации, модели классификатора и модели активного ученика, – которые совместно поддерживают пользователя-аннотатора платформы. Модель сегментации определяет расположение всех клеток в небольшой области. Аннотатор, обычно квалифицированный патологоанатом, начинает маркировать клетки. Эти метки используются для обучения модели классификатора, которая идентифицирует и помечает области, которые может впоследствии скорректировать аннотатор. По мере того, как классификатор учится на этих исправлениях, его прогнозы постепенно улучшаются и требуют меньшего количества исправлений. Когда интересующие патологии достаточно размечены (20–30 аннотаций на класс), модель активного ученика определяет следующую наиболее информативную область для аннотации, и процесс повторяется. Так, очевидны преимущества данного подхода. Во-первых, модель классификатора ИПППВР снижает рабочую нагрузку, заменяя трудоемкую задачу первичных аннотаций более простой задачей исправления аннотаций. Во-вторых, модель активного ученика ИПППВР повышает эффективность работы с данными, указывая аннотатору на более информативные области на WSI. Чтобы продемонстрировать эти преимущества, были произведены измерения рабочей нагрузку (доля предложений ИИ, требующих исправления) и эффективность обработки данных (точность проверки по сравнению с размером выборки) для семи патологов, использующих ИПППВР для маркировки морфологических изменений легких при коронавирусной инфекции COVID-19. Использование ИПППВР привело к значительному снижению рабочей нагрузки для всех задач, от 96% для разметки патологических клеток (самая простая задача) до 83% для эозинофилов. Получается, что патологоанатом, вооруженный ИПППВР, создаст примерно в 10 раз больше аннотаций за тот же промежуток времени. В дополнение к этим объективным улучшениям расширение ИИ также позволяет патологоанатомам отслеживать улучшения классификатора и выявлять ошибки на протяжении всего процесса разметки. Это может способствовать более тесному сотрудничеству с инженерами-программистами и способствовать пониманию недостатков модели и распределению ресурсов для маркировки. Подобные системы широко представлены как коммерческие решения и используются в таких областях, как распознавание объектов. В итоге нашей работы была создана нейронная сеть с возможностью определения следующих патоморфологических изменений: тромбы в просветах сосудов различных видов (смешанный, организующийся, фибриновый), серозный и фибринозно-гнойный экссудат, утолщение стенок альвеол, геморрагии. В области иммунного ответа нейронная сеть способна различать клетки иммунной и "неиммунной" природы. Общая точность классификации составила 83,1% и 79,7% по данным обучения и независимого тестирования датасетов соответственно. Идентифицируя клетки и классифицируя типы клеток, нейросеть может преобразовать изображение патологии в «пространственную карту» клеток. Из этой пространственной карты мы можем извлечь признаки, характеризующие микроокружение исследуемых объектов. На основе этих особенностей разработана прогностическая модель классификатора.
Выводы:
- Созданная нейросетевая модель позволяет классифицировать клетки иммунного ответа и определять ограниченный спектр морфологических изменений в легких.
- Разработанная образовательно-исследовательская программная платформа позволила значительно оптимизировать рабочие процессы в практике патологоанатомов, в частности аннотацию и разметку, платформа представляет новые возможности обучения как студентов, так и нейросетевых моделей в направлении патологической анатомии.