Введение
В последние годы, особенно в последние месяцы распространения пандемии коронавируса, Интернет стал важным инструментом в нашей повседневной жизни и деятельности, поскольку объем данных, создаваемых пользователями с помощью онлайн-сервисов, очень велик. В этих данных скрыта информация, которую можно использовать для принятия эффективных решений. Облачная инфраструктура используется в интеграции с методами интеллектуального анализа данных для значительного раскрытия полезных знаний.
В связи с крупномасштабными остановками в промышленности, закрытием общественных мест по всему миру для предотвращения распространения вируса, работа на дому приобрела большую важность, чем раньше. Поскольку люди оказываются перед дилеммой о том, что делать в помещении, кроме общения с семьей, они забывают, насколько они счастливы, чем десять лет назад. Облачные вычисления и хранилище позволяют проводить видеоконференции, делать покупки в электронной коммерции, работать с удаленными проектами, играть в игры, онлайн-классы, редактировать и т. д. Таким образом они направлены на преобразование традиционного подхода к вычислениям путем предоставления услуг как аппаратным ресурсам, так и программным приложениям. Эти услуги предоставляются через Интернет. Облачные вычисления набирают популярность благодаря своей низкой стоимости, мобильности и огромной доступности. Он обеспечивает неограниченное хранилище и вычислительную мощность, что приводит к большому объему данных.
Интегрированный подход к интеллектуальному анализу данных и облачным вычислениям используется для получения быстрого доступа к технологиям и обеспечивает своего рода систему обнаружения знаний, которая построена из большого количества децентрализованных сервисов анализа данных.
Концепция Интеллектуального Анализа Данных
Интеллектуальный анализ данных определяется как нетривиальное извлечение неявной, ранее неизвестной, потенциально полезной информации из данных. Он использует методы статистики, визуализации и машинного обучения для обнаружения и представления знаний в форме, которая легко понятна людям. Интеллектуальный анализ данных – это процесс исследования и анализа больших объемов данных с целью выявления значимых закономерностей и правил с помощью автоматических или полуавтоматических средств. В больших базах данных интеллектуальный анализ данных решает проблему обнаружения скрытых, но полезных знаний из данных, которые могут помочь правительству и предприятиям принимать решения, чтобы получить от этого больше пользы. Интеллектуальный анализ данных также известен как «обнаружение знаний в базах данных» (knowledge discovery databases, KDD).
Различные этапы процесса обнаружение знаний в базах данных [1] описаны ниже (рисунок).
Рис. Шаги обнаружение знаний в базах данных или процесс интеллектуального анализа данных
- Интеграция данных – данные, интегрированные из сочетания нескольких источников данных.
- Выбор данных и очистка – данные, имеющие отношение к анализу, извлекается из базы данных и шум и несовместимы данные удаляются.
- Преобразование данных - этот этап включает в себя консолидацию и преобразование данных в формы, подходящие для майнинга например, путем агрегирования сводных данных.
- Интеллектуальный анализ данных – это самый важный шаг, и оно совершается с помощью интеллектуальных шаблонов из данных.
- Оценка модели - оценка включает в себя идентификацию шаблонов, которые интересны. Презентация знаний – представить извлеченные или добытые знания для конечного пользователя, используются различные визуализации и методы представления знаний.
Концепция Облачных Вычислений
Облачные вычисления – это общий термин, используемый для описания нового класса сетевых вычислений, которые происходят через Интернет [2]. Облачные вычисления – это смена парадигмы вычислений, когда вычисления переносятся с персональных компьютеров или отдельного сервера приложений на «облако» компьютеров. Пользователям облака нужно заботиться только о запрашиваемой вычислительной службе, поскольку основные детали ее достижения скрыты. Этот метод распределенных вычислений осуществляется путем объединения всех компьютерных ресурсов и управления им с помощью программного обеспечения, а не человека. Вычислительная парадигмы за последние полвека сдвинулась через шесть отдельных этапов [3]:
Этап 1: люди использовали терминалы для подключения к мощным мэйнфреймам, пользуемыми многими пользователи.
Этап 2: автономные персональные компьютеры стали достаточно мощными, чтобы удовлетворить повседневную работу пользователей.
Этап 3: компьютерные сети позволяли нескольким компьютерам соединяться друг с другом.
Этап 4: локальные сети могут подключаться к другим локальным сетям для создания более глобальной сети.
Этап 5: электронная сеть облегчает совместное использование вычислительной мощности и ресурсов хранения.
Этап 6: облачные вычисления позволяют использовать все доступные ресурсы в Интернете масштабируемым и простым способом.
Интеллектуальный анализ данных в облачных вычислениях
Интеллектуальный анализ данных предпочтительно используется для большого количества данных, и для создания качественных моделей часто требуются большие наборы данных. Облака предоставляют использование интеллектуального анализа данных, чтобы предоставлять клиентам лучший сервис. Использование методов интеллектуального анализа данных в облачных вычислениях позволяет пользователям извлекать полезную информацию из практически интегрированных источников данных, что снижает затраты на инфраструктуру и хранение.
Ниже приведены преимущества [4] интегрированной среды интеллектуального анализа данных и облачных вычислений.
- Клиент платит только за те инструменты для интеллектуального анализа данных, которые ему нужны.
- Заказчику не нужно поддерживать аппаратную инфраструктуру, поскольку он может применять интеллектуальный анализ данных через браузер.
- Резервное надежное хранилище.
- Виртуальные компьютеры, которые могут быть запущены в короткие сроки.
- Нет запроса структурированных данных.
- Очередь сообщений для связи
Заключение
Интеллектуальный анализ данных, интегрированный с облачными вычислениями, является очень важной характеристикой в бизнесе для принятия эффективных решений для прогнозирования будущих тенденций и поведения. Вычислительная система является обслуживающей стороной, а интеллектуальный анализ данных – обслуживаемой стороной. Интеллектуальный анализ данных – это процесс извлечения структурированной информации из неструктурированных или полуструктурированных веб-источников данных. Интеллектуальный анализ данных в облачных вычислениях позволяет компаниям централизовать управление программным обеспечением и хранилищем данных с гарантией экономически эффективных, надежных, безопасных и эффективных услуг для своих пользователей [5].