Актуальность исследования
Развитие распределенных технологий и систем остается актуальной темой в наше время и будет сохранять свою значимость в ближайшем будущем. Технология блокчейн продолжает привлекать внимание как инструмент для обеспечения безопасности и прозрачности транзакций, а также для создания новых финансовых и экономических моделей. С увеличением числа подключенных устройств в мире требуется более распределенная инфраструктура для обработки и анализа данных, а также обеспечения безопасности в сфере IoT. Обучение и развертывание моделей машинного обучения, требующих большого объема данных и вычислительных ресурсов, часто выполняется с использованием распределенных систем.
Цель исследования
Целью исследования является анализ текущего состояния, тенденций и перспектив развития распределенных технологий и систем с целью выявления их воздействия на различные сферы жизни, бизнеса и технологический прогресс.
Материал и методы исследования
Изучением вопросов, посвященных развитию распределенных технологий и систем, занимались такие ученые как А.Н. Алпатов, И.Б. Бурдонов, А.С. Косачев, В.Н. Пономаренко, В.З. Шнитман, В.Я. Цветков и др.
Методами исследования являются: метод кейс-исследования, метод теоретического и практического анализа, метод сравнительного анализа.
Результаты исследования
Распределенные информационные системы (РИС) стали широко используемыми в корпоративных информационных системах. Подходы к созданию таких систем включают в себя множество технологий. Один из вариантов создания РИС заключается в использовании протокола ANSI/NISO Z39.50. Этот протокол предназначен для установления связи между компьютерными системами, определяет модель поиска информации и формат ее представления, но не задает, в каком формате информация хранится в базах данных. Это позволяет клиентам выполнять поиск информации в базах данных разных поставщиков, независимо от их структуры и методов организации. С использованием данного протокола можно создавать распределенные информационные системы, в которых объединены базы данных разных организаций.
Прогресс в области распределенных технологий и систем продолжает активно развиваться. Можно выделить следующие направления развития:
- Интернет вещей (IoT). Распределенные системы стали неотъемлемой частью Интернета вещей. Устройства, подключенные к Интернету, собирают и обмениваются данными, создавая распределенные экосистемы для мониторинга и управления различными аспектами жизни.
- Блокчейн и криптовалюты. Технология блокчейн предоставляет децентрализованный реестр для записи транзакций и учета данных. Криптовалюты, такие как биткоин и эфириум, основаны на этой технологии и изменяют способы финансовых операций.
- Облачные вычисления. Облачные вычисления обеспечивают доступ к распределенным вычислительным ресурсам через сеть. Это позволяет компаниям масштабировать свои IT-инфраструктуры и улучшать доступность приложений.
- Распределенные базы данных. Базы данных с распределенным доступом позволяют эффективно хранить и обрабатывать данные на глобальном уровне. Это важно для приложений, требующих высокой доступности и масштабируемости.
- Машинное обучение и искусственный интеллект. Распределенные вычисления играют ключевую роль в обучении и применении моделей машинного обучения. Распределенные системы позволяют обрабатывать большие объемы данных и ускорять обучение моделей.
- Сети нового поколения. Развитие технологий связи, таких как 5G, способствует более быстрой и надежной связи между распределенными устройствами и системами.
- Кибербезопасность. Распределенные системы сталкиваются с новыми вызовами в области кибербезопасности. Защита данных и обеспечение безопасности сетей становятся приоритетом.
- Распределенные приложения. С развитием микросервисной архитектуры и контейнеризации создание и масштабирование распределенных приложений становится более эффективным.
- Распределенные системы в медицине и науке. В медицине и научных исследованиях распределенные системы используются для анализа и обработки медицинских данных, симуляций и исследования.
- Распределенные системы в финансовой сфере. В финансовой индустрии распределенные технологии играют важную роль в улучшении процессов сделок, бухгалтерии и управления рисками [1, c. 24].
В России существует национальный проект по разработке распределенных информационных систем, реализованных через использование протокола Z39.50, и этот проект называется «АРБИКОН». Ассоциация Региональных Библиотечных Консорциумов (АРБИКОН) была создана с целью объединения библиотечных ресурсов и улучшения управления библиотечными операциями. Участие в проекте осуществляется на добровольной и некоммерческой основе. Анонсирование проекта состоялось в мае 2002 года, и на данный момент в проекте АРБИКОН участвуют ведущие библиотеки из 57 регионов России.
С технической точки зрения, портал проекта АРБИКОН выполняет роль Z39.50-WWW шлюза, который позволяет осуществлять поиск информации в базах данных, включая монографии, научные статьи и другие материалы, с использованием протокола Z39.50.
Распределенные системы широко используются в различных областях. При разработке и внедрении распределенных географических информационных систем (ГИС) необходимо учитывать особенности этой сферы. Для обеспечения успешной работы таких систем необходимо выполнить определенные требования:
- обеспечение распределенного доступа к системе;
- распределенное хранение данных;
- распределенная обработка данных;
- с учетом перечисленных требований был разработан профиль GEO для протокола Z39.50 [2, c. 60].
Особо важными являются исследования отечественных ученых в области разработки распределенных вычислительных систем с программируемой структурой, с активной поддержкой Сибирским отделением РАН. Под программируемой структурой таких вычислительных систем подразумевается объединение элементарных машин (ЭМ), которые функционируют на основе модели коллективных вычислений. Главной целью таких систем является обработка информации в распределенном режиме. Первые попытки создания вычислительных систем с программируемой архитектурой начались в 1960-х годах. Среди ранних проектов в этой области можно выделить системы, такие как МИНИМАКС, СУММА, МИКРОС-1, МИКРОС-2, и МИКРОС-T.
Идея объединения географически распределенных кластеров стала активно развиваться в начале 1990-х годов. Основной проблемой, стоявшей перед развитием этого подхода, было интегрирование разнородных компонентов вычислительных узлов. В части это проблема была решена с помощью нового подхода к построению программного обеспечения, который включал в себя два уровня:
- уровень распределенного приложения.
- уровень связующего программного обеспечения (или «middleware»).
Самыми перспективными считаются технологии GRID и CLOUD. GRID-технологии позволяют создавать географически распределенные вычислительные системы, объединяя разнообразные ресурсы и предоставляя к ним совместный доступ из разных уголков планеты. Это сильно влияет на дальнейшее развитие распределенных информационных систем, так как Grid-технологии представляют собой специфическую форму распределенных вычислений, где виртуальный «суперкомпьютер» создается из кластеров, соединенных через Интернет, и компьютеров, которые совместно выполняют задачи в области производства. Как правило, распределенные технологии применяются для построения систем, имеющих повышенные требования к обеспечению отказоустойчивости и производительности [3, c. 27].
Выделяют следующие виды: добровольная GRID; научная GRID; GRID на основе выделения вычислительных ресурсов по требованию.
Примеры проектов добровольных вычислений, построенных на базе GRID-систем на платформе BOINC можно привести в таблице.
Таблица
Примеры проектов добровольных вычислений, построенных на базе GRID-систем на платформе BOINC
Проект |
Назначение |
---|---|
SETI@home |
Анализ радиосигналов, полученных радиотелескопами, с целью поиска внеземных цивилизаций |
Rosetta@home |
Вычисление 3-мерной структуры белков из их аминокислотных последовательностей. |
LHC@home |
Обработка данных, полученных с большого адронного коллайдера, и расчеты для его усовершенствования. |
Также следует учесть технологию Cloud, которая используется для организации облачных вычислений. Важно отметить, что описанные ранее технологии имеют схожую природу, но все же существуют отличия между ними, особенно в способах использования и развертывания. Grid, по сути, представляет собой оборудование, которое устанавливается на определенный временной период и требует регулярного технического обслуживания, а также ремонта. В случае добровольных вычислений Grid может включать в себя персональные компьютеры, установленные в домашних условиях.
С другой стороны, облачные вычисления, реализованные в форме IaaS (Infrastructure as a Service), предоставляют пользователю интерфейс, исключая необходимость заниматься вопросами технического обслуживания и поддержки. Пользователь имеет доступ к вычислительным ресурсам, которые могут масштабироваться в зависимости от его текущих потребностей [7, c. 51].
Современное развитие распределенных информационных систем тесно связано с использованием реляционных и объектно-ориентированных систем управления базами данных (СУБД). В настоящее время эти СУБД утвердились как ключевые инструменты для обработки данных в различных информационных системах. Существует большое количество программных средств и систем управления базами данных (СУБД), которые выполняют аналогичные функции.
Oracle, в частности, представляет собой один из лучших и наиболее мощных инструментов разработки профессионального уровня. СУБД Oracle обеспечивает возможность установления связи как между клиентами и сервером, так и между различными серверами. Построение распределенных баз данных позволяет решать ряд сложных задач, таких как:
- Собирать данные, распределенные в разных местах, в единую систему;
- Увеличивать вычислительную мощность системы (горизонтальное масштабирование);
- Консолидировать данные в близкой доступности для их потребителей, сохраняя при этом целостность системы и многое другое.
Можно выделить следующие положительные аспекты распределенных систем на рис. 1.
Рис. 1. Положительные аспекты распределенных систем
Облачный сервис Amazon Relational Database Service предоставляет пользователям доступ к реляционным базам данных, которые могут быть использованы в их приложениях. Amazon RDS обеспечивает быстрое развертывание, удобное обслуживание и простое масштабирование. Сложные задачи, такие как обновление программного обеспечения базы данных, создание резервных копий и восстановление до предыдущих состояний, выполняются автоматически. Масштабирование дискового пространства и процессорных ресурсов можно легко осуществить с помощью API этой системы [4, c. 34].
Развитие распределенных технологий и систем сопровождается различными проблемами. Можно выделить следующие типичные проблемы и способы их преодоления:
- Сложность управления и координации. Распределенные системы могут включать множество компонентов и устройств, что делает управление их работой сложным. Для решения этой проблемы необходимо использовать системы управления и мониторинга для наблюдения и контроля за всеми элементами системы.
- Безопасность. Распределенные системы подвержены рискам безопасности, таким как утечка данных, атаки и взломы. Решение: внедрение современных методов шифрования, аутентификации и авторизации, а также регулярное обновление системы безопасности.
- Сетевая задержка и надежность сети. При передаче данных через сеть возникают задержки и возможны сбои соединения. В целях решения сложившейся ситуации следует использовать технологии и архитектуры, которые позволяют обнаруживать и восстанавливаться от сбоев, а также улучшение инфраструктуры сети [6, c. 110].
- Масштабируемость. Поддержание производительности и эффективности при росте числа пользователей и данных может быть сложной задачей. Решение: применение горизонтального масштабирования, использование облачных вычислений и оптимизация алгоритмов.
- Совместимость и интеграция. Различные компоненты распределенной системы могут использовать разные технологии и протоколы, что может вызвать проблемы совместимости и интеграции. Решение: разработка универсальных интерфейсов и использование стандартных протоколов для обеспечения совместимости.
- Сложности разработки и тестирования. Создание и тестирование распределенных систем может быть более сложным и затратным процессом по сравнению с локальными системами. Решение: использование инструментов разработки, средств автоматического тестирования и симуляции для упрощения разработки и отладки [5, c. 20].
Технологии искусственного интеллекта играют важную роль в развитии распределенных технологий и систем. В связи с чем, можно представить следующую статистику использования данной технологии на предприятиях на рис. 2.
Рис. 2. Технологии искусственного интеллекта в отечественных компаниях, %
Выводы
Распределенные технологии и системы, такие как блокчейн, облачные вычисления и интернет вещей, позволяют увеличить эффективность операций и управления данными. Это особенно важно для бизнеса и государственных организаций. Распределенные системы предлагают улучшенную безопасность данных и транзакций благодаря криптографии и децентрализованной природе. Они могут снижать риски хакерских атак и злоупотреблений. Распределенные технологии позволяют сокращать зависимость от централизованных организаций и властей. Это может изменить способы управления, экономические модели и даже политическую систему.