Интеграция интеллектуального анализа данных с облачными вычислениями

Интеграция интеллектуального анализа данных с облачными вычислениями

Интеллектуальный анализ данных – это процесс извлечения потенциально полезной информации из данных, чтобы улучшить качество информационного обслуживания. Интеграция методов интеллектуального анализа данных с облачными вычислениями обеспечивает гибкую и масштабируемую архитектуру, которая может быть использована для эффективной добычи огромного количества данных из практически интегрированных источников данных с целью получения полезной информации, которая помогает в принятии решений. Эта статья сначала представляет основную концепцию облачных вычислений и интеллектуального анализа данных, а также описывает, как интеллектуальный анализ данных используется в облачных вычислениях.

Аннотация статьи
облачные вычисления (cloud computing)
интеллектуальный анализ данных (data mining)
интеллектуальный анализ данных в облачных вычислениях
Ключевые слова

Введение

В последние годы, особенно в последние месяцы распространения пандемии коронавируса, Интернет стал важным инструментом в нашей повседневной жизни и деятельности, поскольку объем данных, создаваемых пользователями с помощью онлайн-сервисов, очень велик. В этих данных скрыта информация, которую можно использовать для принятия эффективных решений. Облачная инфраструктура используется в интеграции с методами интеллектуального анализа данных для значительного раскрытия полезных знаний.

В связи с крупномасштабными остановками в промышленности, закрытием общественных мест по всему миру для предотвращения распространения вируса, работа на дому приобрела большую важность, чем раньше. Поскольку люди оказываются перед дилеммой о том, что делать в помещении, кроме общения с семьей, они забывают, насколько они счастливы, чем десять лет назад. Облачные вычисления и хранилище позволяют проводить видеоконференции, делать покупки в электронной коммерции, работать с удаленными проектами, играть в игры, онлайн-классы, редактировать и т. д. Таким образом они направлены на преобразование традиционного подхода к вычислениям путем предоставления услуг как аппаратным ресурсам, так и программным приложениям. Эти услуги предоставляются через Интернет. Облачные вычисления набирают популярность благодаря своей низкой стоимости, мобильности и огромной доступности. Он обеспечивает неограниченное хранилище и вычислительную мощность, что приводит к большому объему данных.

Интегрированный подход к интеллектуальному анализу данных и облачным вычислениям используется для получения быстрого доступа к технологиям и обеспечивает своего рода систему обнаружения знаний, которая построена из большого количества децентрализованных сервисов анализа данных.

Концепция Интеллектуального Анализа Данных

Интеллектуальный анализ данных определяется как нетривиальное извлечение неявной, ранее неизвестной, потенциально полезной информации из данных. Он использует методы статистики, визуализации и машинного обучения для обнаружения и представления знаний в форме, которая легко понятна людям. Интеллектуальный анализ данных – это процесс исследования и анализа больших объемов данных с целью выявления значимых закономерностей и правил с помощью автоматических или полуавтоматических средств. В больших базах данных интеллектуальный анализ данных решает проблему обнаружения скрытых, но полезных знаний из данных, которые могут помочь правительству и предприятиям принимать решения, чтобы получить от этого больше пользы. Интеллектуальный анализ данных также известен как «обнаружение знаний в базах данных» (knowledge discovery databases, KDD).

Различные этапы процесса обнаружение знаний в базах данных [1] описаны ниже (рисунок).

Рис. Шаги обнаружение знаний в базах данных или процесс интеллектуального анализа данных

  • Интеграция данных – данные, интегрированные из сочетания нескольких источников данных.
  • Выбор данных и очистка – данные, имеющие отношение к анализу, извлекается из базы данных и шум и несовместимы данные удаляются.
  • Преобразование данных - этот этап включает в себя консолидацию и преобразование данных в формы, подходящие для майнинга например, путем агрегирования сводных данных.
  • Интеллектуальный анализ данных – это самый важный шаг, и оно совершается с помощью интеллектуальных шаблонов из данных.
  • Оценка модели - оценка включает в себя идентификацию шаблонов, которые интересны. Презентация знаний – представить извлеченные или добытые знания для конечного пользователя, используются различные визуализации и методы представления знаний.

Концепция Облачных Вычислений

Облачные вычисления – это общий термин, используемый для описания нового класса сетевых вычислений, которые происходят через Интернет [2]. Облачные вычисления – это смена парадигмы вычислений, когда вычисления переносятся с персональных компьютеров или отдельного сервера приложений на «облако» компьютеров. Пользователям облака нужно заботиться только о запрашиваемой вычислительной службе, поскольку основные детали ее достижения скрыты. Этот метод распределенных вычислений осуществляется путем объединения всех компьютерных ресурсов и управления им с помощью программного обеспечения, а не человека. Вычислительная парадигмы за последние полвека сдвинулась через шесть отдельных этапов [3]:

Этап 1: люди использовали терминалы для подключения к мощным мэйнфреймам, пользуемыми многими пользователи.

Этап 2: автономные персональные компьютеры стали достаточно мощными, чтобы удовлетворить повседневную работу пользователей.

Этап 3: компьютерные сети позволяли нескольким компьютерам соединяться друг с другом.

Этап 4: локальные сети могут подключаться к другим локальным сетям для создания более глобальной сети.

Этап 5: электронная сеть облегчает совместное использование вычислительной мощности и ресурсов хранения.

Этап 6: облачные вычисления позволяют использовать все доступные ресурсы в Интернете масштабируемым и простым способом.

Интеллектуальный анализ данных в облачных вычислениях

Интеллектуальный анализ данных предпочтительно используется для большого количества данных, и для создания качественных моделей часто требуются большие наборы данных. Облака предоставляют использование интеллектуального анализа данных, чтобы предоставлять клиентам лучший сервис. Использование методов интеллектуального анализа данных в облачных вычислениях позволяет пользователям извлекать полезную информацию из практически интегрированных источников данных, что снижает затраты на инфраструктуру и хранение.

Ниже приведены преимущества [4] интегрированной среды интеллектуального анализа данных и облачных вычислений.

  • Клиент платит только за те инструменты для интеллектуального анализа данных, которые ему нужны.
  • Заказчику не нужно поддерживать аппаратную инфраструктуру, поскольку он может применять интеллектуальный анализ данных через браузер.
  • Резервное надежное хранилище.
  • Виртуальные компьютеры, которые могут быть запущены в короткие сроки.
  • Нет запроса структурированных данных.
  • Очередь сообщений для связи

Заключение

Интеллектуальный анализ данных, интегрированный с облачными вычислениями, является очень важной характеристикой в бизнесе для принятия эффективных решений для прогнозирования будущих тенденций и поведения. Вычислительная система является обслуживающей стороной, а интеллектуальный анализ данных – обслуживаемой стороной. Интеллектуальный анализ данных – это процесс извлечения структурированной информации из неструктурированных или полуструктурированных веб-источников данных. Интеллектуальный анализ данных в облачных вычислениях позволяет компаниям централизовать управление программным обеспечением и хранилищем данных с гарантией экономически эффективных, надежных, безопасных и эффективных услуг для своих пользователей [5].

Текст статьи
  1. Усама Ф., Пятецкий-Шапиро Г., Смит П. От интеллектуального анализа данных до открытия знаний в базы данных // AI журнал 17,3 (1996): 37.
  2. Специальные публикации 800-145 «Национальный институт стандартизации и технологии (NIST)».
  3. Петре, Р.С. «Интеллектуальный анализ данных в облачных вычислениях». Database Systems Journal 3.3 (2012): 67-71.
  4. Камала, Б. Исследование по интегрированному подходу к интеллектуальному и облачному анализу данных // Международный журнал достижений в области компьютерных наук и облачных вычислений (IJACSCC), том 1, выпуск 2, 2013 г. С. 35-38.
  5. Никам В.Б., Патил В. Изучение алгоритма интеллектуального анализа данных в облачных вычислениях с использованием MapReduce Framework // Журнал инженерных компьютеров и прикладных наук 2.7 (2013): 65-70.
Список литературы
Ведется прием статей
Прием материалов
c 01 декабря по 15 декабря
Осталось 14 дней до окончания
Препринт статьи — после оплаты
Справка о публикации
сразу после оплаты
Размещение электронной версии
19 декабря
Загрузка в elibrary
19 декабря
Рассылка печатных экземпляров
23 декабря