Главная
АИ #26 (156)
Статьи журнала АИ #26 (156)
Развитие распределенных технологий и систем

Развитие распределенных технологий и систем

Автор(-ы):

Созонтов Антон Валерьевич

26 июня 2023

Секция

Информационные технологии

Ключевые слова

распределенные технологии
системы
развитие
информационные системы
данные

Аннотация статьи

Исследование посвящено анализу и характеристике условий развития распределенных технологий и систем. Автором отмечено, что самыми перспективными считаются технологии GRID и CLOUD. Кроме того, автором приведены примеры проектов добровольных вычислений, построенных на базе GRID-систем на платформе BOINC. Также автором выделены положительные аспекты распределенных систем. В статье представлены проблемы и пути решения, связанные с развитием распределенных технологий и систем.

Текст статьи

Актуальность исследования

Развитие распределенных технологий и систем остается актуальной темой в наше время и будет сохранять свою значимость в ближайшем будущем. Технология блокчейн продолжает привлекать внимание как инструмент для обеспечения безопасности и прозрачности транзакций, а также для создания новых финансовых и экономических моделей. С увеличением числа подключенных устройств в мире требуется более распределенная инфраструктура для обработки и анализа данных, а также обеспечения безопасности в сфере IoT. Обучение и развертывание моделей машинного обучения, требующих большого объема данных и вычислительных ресурсов, часто выполняется с использованием распределенных систем.

Цель исследования

Целью исследования является анализ текущего состояния, тенденций и перспектив развития распределенных технологий и систем с целью выявления их воздействия на различные сферы жизни, бизнеса и технологический прогресс.

Материал и методы исследования

Изучением вопросов, посвященных развитию распределенных технологий и систем, занимались такие ученые как А.Н. Алпатов, И.Б. Бурдонов, А.С. Косачев, В.Н. Пономаренко, В.З. Шнитман, В.Я. Цветков и др.

Методами исследования являются: метод кейс-исследования, метод теоретического и практического анализа, метод сравнительного анализа.

Результаты исследования

Распределенные информационные системы (РИС) стали широко используемыми в корпоративных информационных системах. Подходы к созданию таких систем включают в себя множество технологий. Один из вариантов создания РИС заключается в использовании протокола ANSI/NISO Z39.50. Этот протокол предназначен для установления связи между компьютерными системами, определяет модель поиска информации и формат ее представления, но не задает, в каком формате информация хранится в базах данных. Это позволяет клиентам выполнять поиск информации в базах данных разных поставщиков, независимо от их структуры и методов организации. С использованием данного протокола можно создавать распределенные информационные системы, в которых объединены базы данных разных организаций.

Прогресс в области распределенных технологий и систем продолжает активно развиваться. Можно выделить следующие направления развития:

  1. Интернет вещей (IoT). Распределенные системы стали неотъемлемой частью Интернета вещей. Устройства, подключенные к Интернету, собирают и обмениваются данными, создавая распределенные экосистемы для мониторинга и управления различными аспектами жизни.
  2. Блокчейн и криптовалюты. Технология блокчейн предоставляет децентрализованный реестр для записи транзакций и учета данных. Криптовалюты, такие как биткоин и эфириум, основаны на этой технологии и изменяют способы финансовых операций.
  3. Облачные вычисления. Облачные вычисления обеспечивают доступ к распределенным вычислительным ресурсам через сеть. Это позволяет компаниям масштабировать свои IT-инфраструктуры и улучшать доступность приложений.
  4. Распределенные базы данных. Базы данных с распределенным доступом позволяют эффективно хранить и обрабатывать данные на глобальном уровне. Это важно для приложений, требующих высокой доступности и масштабируемости.
  5. Машинное обучение и искусственный интеллект. Распределенные вычисления играют ключевую роль в обучении и применении моделей машинного обучения. Распределенные системы позволяют обрабатывать большие объемы данных и ускорять обучение моделей.
  6. Сети нового поколения. Развитие технологий связи, таких как 5G, способствует более быстрой и надежной связи между распределенными устройствами и системами.
  7. Кибербезопасность. Распределенные системы сталкиваются с новыми вызовами в области кибербезопасности. Защита данных и обеспечение безопасности сетей становятся приоритетом.
  8. Распределенные приложения. С развитием микросервисной архитектуры и контейнеризации создание и масштабирование распределенных приложений становится более эффективным.
  9. Распределенные системы в медицине и науке. В медицине и научных исследованиях распределенные системы используются для анализа и обработки медицинских данных, симуляций и исследования.
  10. Распределенные системы в финансовой сфере. В финансовой индустрии распределенные технологии играют важную роль в улучшении процессов сделок, бухгалтерии и управления рисками [1, c. 24].

В России существует национальный проект по разработке распределенных информационных систем, реализованных через использование протокола Z39.50, и этот проект называется «АРБИКОН». Ассоциация Региональных Библиотечных Консорциумов (АРБИКОН) была создана с целью объединения библиотечных ресурсов и улучшения управления библиотечными операциями. Участие в проекте осуществляется на добровольной и некоммерческой основе. Анонсирование проекта состоялось в мае 2002 года, и на данный момент в проекте АРБИКОН участвуют ведущие библиотеки из 57 регионов России.

С технической точки зрения, портал проекта АРБИКОН выполняет роль Z39.50-WWW шлюза, который позволяет осуществлять поиск информации в базах данных, включая монографии, научные статьи и другие материалы, с использованием протокола Z39.50.

Распределенные системы широко используются в различных областях. При разработке и внедрении распределенных географических информационных систем (ГИС) необходимо учитывать особенности этой сферы. Для обеспечения успешной работы таких систем необходимо выполнить определенные требования:

  • обеспечение распределенного доступа к системе;
  • распределенное хранение данных;
  • распределенная обработка данных;
  • с учетом перечисленных требований был разработан профиль GEO для протокола Z39.50 [2, c. 60].

Особо важными являются исследования отечественных ученых в области разработки распределенных вычислительных систем с программируемой структурой, с активной поддержкой Сибирским отделением РАН. Под программируемой структурой таких вычислительных систем подразумевается объединение элементарных машин (ЭМ), которые функционируют на основе модели коллективных вычислений. Главной целью таких систем является обработка информации в распределенном режиме. Первые попытки создания вычислительных систем с программируемой архитектурой начались в 1960-х годах. Среди ранних проектов в этой области можно выделить системы, такие как МИНИМАКС, СУММА, МИКРОС-1, МИКРОС-2, и МИКРОС-T.

Идея объединения географически распределенных кластеров стала активно развиваться в начале 1990-х годов. Основной проблемой, стоявшей перед развитием этого подхода, было интегрирование разнородных компонентов вычислительных узлов. В части это проблема была решена с помощью нового подхода к построению программного обеспечения, который включал в себя два уровня:

  • уровень распределенного приложения.
  • уровень связующего программного обеспечения (или «middleware»).

Самыми перспективными считаются технологии GRID и CLOUD. GRID-технологии позволяют создавать географически распределенные вычислительные системы, объединяя разнообразные ресурсы и предоставляя к ним совместный доступ из разных уголков планеты. Это сильно влияет на дальнейшее развитие распределенных информационных систем, так как Grid-технологии представляют собой специфическую форму распределенных вычислений, где виртуальный «суперкомпьютер» создается из кластеров, соединенных через Интернет, и компьютеров, которые совместно выполняют задачи в области производства. Как правило, распределенные технологии применяются для построения систем, имеющих повышенные требования к обеспечению отказоустойчивости и производительности [3, c. 27].

Выделяют следующие виды: добровольная GRID; научная GRID; GRID на основе выделения вычислительных ресурсов по требованию.

Примеры проектов добровольных вычислений, построенных на базе GRID-систем на платформе BOINC можно привести в таблице.

Таблица

Примеры проектов добровольных вычислений, построенных на базе GRID-систем на платформе BOINC

Проект

Назначение

SETI@home

Анализ радиосигналов, полученных радиотелескопами, с целью поиска внеземных цивилизаций

Rosetta@home

Вычисление 3-мерной структуры белков из их аминокислотных последовательностей.

LHC@home

Обработка данных, полученных с большого адронного коллайдера, и расчеты для его усовершенствования.

Также следует учесть технологию Cloud, которая используется для организации облачных вычислений. Важно отметить, что описанные ранее технологии имеют схожую природу, но все же существуют отличия между ними, особенно в способах использования и развертывания. Grid, по сути, представляет собой оборудование, которое устанавливается на определенный временной период и требует регулярного технического обслуживания, а также ремонта. В случае добровольных вычислений Grid может включать в себя персональные компьютеры, установленные в домашних условиях.

С другой стороны, облачные вычисления, реализованные в форме IaaS (Infrastructure as a Service), предоставляют пользователю интерфейс, исключая необходимость заниматься вопросами технического обслуживания и поддержки. Пользователь имеет доступ к вычислительным ресурсам, которые могут масштабироваться в зависимости от его текущих потребностей [7, c. 51].

Современное развитие распределенных информационных систем тесно связано с использованием реляционных и объектно-ориентированных систем управления базами данных (СУБД). В настоящее время эти СУБД утвердились как ключевые инструменты для обработки данных в различных информационных системах. Существует большое количество программных средств и систем управления базами данных (СУБД), которые выполняют аналогичные функции.

Oracle, в частности, представляет собой один из лучших и наиболее мощных инструментов разработки профессионального уровня. СУБД Oracle обеспечивает возможность установления связи как между клиентами и сервером, так и между различными серверами. Построение распределенных баз данных позволяет решать ряд сложных задач, таких как:

  • Собирать данные, распределенные в разных местах, в единую систему;
  • Увеличивать вычислительную мощность системы (горизонтальное масштабирование);
  • Консолидировать данные в близкой доступности для их потребителей, сохраняя при этом целостность системы и многое другое.

Можно выделить следующие положительные аспекты распределенных систем на рис. 1.

Рис. 1. Положительные аспекты распределенных систем

Облачный сервис Amazon Relational Database Service предоставляет пользователям доступ к реляционным базам данных, которые могут быть использованы в их приложениях. Amazon RDS обеспечивает быстрое развертывание, удобное обслуживание и простое масштабирование. Сложные задачи, такие как обновление программного обеспечения базы данных, создание резервных копий и восстановление до предыдущих состояний, выполняются автоматически. Масштабирование дискового пространства и процессорных ресурсов можно легко осуществить с помощью API этой системы [4, c. 34].

Развитие распределенных технологий и систем сопровождается различными проблемами. Можно выделить следующие типичные проблемы и способы их преодоления:

  1. Сложность управления и координации. Распределенные системы могут включать множество компонентов и устройств, что делает управление их работой сложным. Для решения этой проблемы необходимо использовать системы управления и мониторинга для наблюдения и контроля за всеми элементами системы.
  2. Безопасность. Распределенные системы подвержены рискам безопасности, таким как утечка данных, атаки и взломы. Решение: внедрение современных методов шифрования, аутентификации и авторизации, а также регулярное обновление системы безопасности.
  3. Сетевая задержка и надежность сети. При передаче данных через сеть возникают задержки и возможны сбои соединения. В целях решения сложившейся ситуации следует использовать технологии и архитектуры, которые позволяют обнаруживать и восстанавливаться от сбоев, а также улучшение инфраструктуры сети [6, c. 110].
  4. Масштабируемость. Поддержание производительности и эффективности при росте числа пользователей и данных может быть сложной задачей. Решение: применение горизонтального масштабирования, использование облачных вычислений и оптимизация алгоритмов.
  5. Совместимость и интеграция. Различные компоненты распределенной системы могут использовать разные технологии и протоколы, что может вызвать проблемы совместимости и интеграции. Решение: разработка универсальных интерфейсов и использование стандартных протоколов для обеспечения совместимости.
  6. Сложности разработки и тестирования. Создание и тестирование распределенных систем может быть более сложным и затратным процессом по сравнению с локальными системами. Решение: использование инструментов разработки, средств автоматического тестирования и симуляции для упрощения разработки и отладки [5, c. 20].

Технологии искусственного интеллекта играют важную роль в развитии распределенных технологий и систем. В связи с чем, можно представить следующую статистику использования данной технологии на предприятиях на рис. 2.

Рис. 2. Технологии искусственного интеллекта в отечественных компаниях, %

Выводы

Распределенные технологии и системы, такие как блокчейн, облачные вычисления и интернет вещей, позволяют увеличить эффективность операций и управления данными. Это особенно важно для бизнеса и государственных организаций. Распределенные системы предлагают улучшенную безопасность данных и транзакций благодаря криптографии и децентрализованной природе. Они могут снижать риски хакерских атак и злоупотреблений. Распределенные технологии позволяют сокращать зависимость от централизованных организаций и властей. Это может изменить способы управления, экономические модели и даже политическую систему.

Список литературы

  1. Бурдонов И.Б., Косачев А.С., Пономаренко В.Н., Шнитман В.З. Обзор подходов к верификации распределенных систем. – М.: Российская Академия Наук. Институт системного программирования (ИСП РАН), 2003. – 51 с.
  2. Масленников Е.В. Распределенные информационные системы: особенности применения и построения / Е.В. Масленников // Молодой ученый. – 2019. – № 22 (260). – С. 59-61.
  3. Радченко, Г.И. Распределенные вычислительные системы / Г.И. Радченко. – Челябинск: Фотохудожник, 2012. – 184 с.
  4. Цветков В.Я., Алпатов А.Н. Проблемы распределенных систем // Перспективы науки и образования. – 2014. – № 6. – С. 31-36.
  5. Хорошевский В.Г. Распределенные вычислительные системы с программируемой архитектурой // Вестник СибГУТИ. – 2010. – № 2. – С. 3-41.
  6. Шокин Ю.И. Распределенная информационно-аналитическая система для поиска, обработки и анализа пространственных данных // Вычислительные технологии. – 2017. – Т. 12. – №. 3. – С. 108-115.
  7. Цветков В.Я. Базы данных. Эксплуатация информационных систем с распределенными базами данных. – М.: МИИГАиК, 2019. – 88 с.

Поделиться

Созонтов А. В. Развитие распределенных технологий и систем // Актуальные исследования. 2023. №26 (156). URL: https://apni.ru/article/6993-razvitie-raspredelennikh-tekhnologij-i-sistem

Похожие статьи

Другие статьи из раздела «Информационные технологии»

Все статьи выпуска
Актуальные исследования

#27 (209)

Прием материалов

29 июня - 5 июля

осталось 6 дней

Размещение PDF-версии журнала

10 июля

Размещение электронной версии статьи

сразу после оплаты

Рассылка печатных экземпляров

22 июля