Введение
В современную цифровую эпоху центры обработки данных (ЦОД) стали основой глобальной информационной инфраструктуры, лежащей в основе подавляющего большинства интернет-услуг, от облачных вычислений до веб-хостинга и не только. Эти объекты имеют решающее значение для хранения, обработки и распространения данных, обслуживая не только крупные предприятия и государственные учреждения, но также малый и средний бизнес, который использует цифровые платформы в своей деятельности. Поскольку объем данных, генерируемых обществом, продолжает расти в геометрической прогрессии, чему способствуют Интернет вещей (IoT), искусственный интеллект (ИИ) и анализ больших данных, важность эффективных и надежных центров обработки данных никогда не была более очевидной.
Эффективность и надежность центра обработки данных во многом зависят от сложности и возможностей его программной инфраструктуры. Современное программное обеспечение для центров обработки данных (ЦОД) включает в себя широкий спектр решений, предназначенных для оптимизации производительности, безопасности и эффективности этих критически важных объектов. Сюда входят, помимо прочего, системы управления инфраструктурой центра обработки данных (ЦОИМ), платформы виртуализации, инструменты автоматизации, а также программное обеспечение для обеспечения безопасности и мониторинга. Вместе эти технологии облегчают эффективное управление ресурсами центра обработки данных, обеспечивая безопасное, эффективное и масштабируемое хранение, обработку и доступ к данным [1].
Однако по мере развития технологического ландшафта ЦОД сталкивается с множеством проблем и возможностей. Интеграция разнородных систем, необходимость кибербезопасности, оптимизация распределения ресурсов и стремление к устойчивому развитию – это лишь некоторые из проблем, стоящих сегодня на переднем плане управления центрами обработки данных. Более того, появление новых технологий, таких как искусственный интеллект и машинное обучение, открывает потенциал для революции в работе центров обработки данных, обещая беспрецедентный уровень эффективности и автоматизации.
Целью данной статьи является изучение текущего состояния программного обеспечения для центров обработки данных, определение основных проблем, с которыми оно сталкивается, и изучение перспектив будущего развития. Благодаря всестороннему анализу существующей литературы, тематических исследований и отраслевых тенденций в статье углубимся в сложности управления современными центрами обработки данных, выделим инновационные решения текущих проблем и порассуждаем об эволюции технологий центров обработки данных в ближайшие годы.
Обзор современного программного обеспечения для центров обработки данных
Современный центр обработки данных (ЦОД) представляет собой сложную экосистему, в которой аппаратные и программные компоненты взаимодействуют между собой для обработки, хранения и распространения огромных объемов данных. В основе этой экосистемы лежит программное обеспечение центров обработки данных (ЦОД), которое включает в себя ряд технологий, предназначенных для оптимизации работы центров обработки данных, повышения эффективности и безопасности.
Инструменты ЦОИМ представляют собой ключевую категорию программного обеспечения для центров обработки данных, предлагающую комплексные решения для мониторинга, управления и оптимизации ресурсов и операций центра обработки данных. Эти системы предоставляют в режиме реального времени информацию о широком спектре показателей центра обработки данных, включая энергопотребление, эффективность системы охлаждения, загрузку серверов и условия окружающей среды. Объединив эти показатели на единой платформе, программное обеспечение ЦОИМ позволяет администраторам принимать обоснованные решения для повышения энергоэффективности, улучшения использования серверов и упреждающего управления физической инфраструктурой центра обработки данных [2].
Таблица
Сравнение инструментов ЦОИМ
Фирма/Продукт | Год основания/приобретения | Основные компоненты и функции | Уникальные возможности и интеграция | Визуализация и управление |
Sunbird Software | 2015 | DC Track (управление инфраструктурой), PowerIQ (мониторинг) | Мощные инструменты мониторинга, интеграция с Raritan/Legrand | - |
Eaton | 2016 | VPM и VCOM для управления и оптимизации | 3D-визуализация, "тепловая карта", широкая интеграция | Полный набор возможностей ЦОИМ, управление энергопотреблением |
Nlyte | 2021 | Assets Optimizer, Energy Optimizer, Data Center Monitoring | Упрощенная интеграция, охват всех аспектов ЦОИМ | Полный набор возможностей ЦОИМ |
Schneider | 2018 | Datacenter Expert, IT Expert, IT Advisor | Оптимизация энергопотребления, интеграция с EMS и BMS от Schneider | Управление инфраструктурой, связанной с электропитанием |
Panduit SmartZone | 2022 | SmartZone Cloud для мониторинга температуры, влажности, потоков воздуха | Продвинутый мониторинг, интеграция с новым оборудованием | Управление IT-активами и связями |
Device42 | 2010 | Фокус на логическом уровне, управление IP-адресами | Внимание к IT-ресурсам, базам данных управления конфигурацией | Оценка состояния физической инфраструктуры |
Patch Manager | 2002 | Управление кабелями и активами | 2D- и 3D-визуализация активов, управление жизненным циклом оборудования | Комплексный инструмент для кабель-менеджмента |
NetTerrain DCiM | 2009 | Управление IT-активами и подключениями | Хорошая визуализация, фокус на управлении активами | Эффективное управление активами |
FNT | 1994 | Управление IT-активами, сетями, электропитанием | Простые, эффективные средства визуализации | Предоставление классических компонентов ЦОИМ |
XpedITe | 2016 | Расширенное управление активами, подключениями, электропитанием | Реалистичная 2D- и 3D-визуализация, машинное обучение | Интерактивная визуализация, настраиваемые отчеты и информационные панели |
В свою очередь технология виртуализации является основополагающим элементом современной ЦОД, позволяя разделить физические серверы на несколько виртуальных машин (ВМ).
Виртуальные машины (ВМ) – это абстрактные вычислительные объекты, созданные программным обеспечением, работающим на отдельной физической машине, которые не имеют физического присутствия, но работают так, как если бы они были реальными компьютерами. Виртуальная машина питается программным обеспечением, а не аппаратным обеспечением, что фактически создает «воображаемый» компьютер, который ведет себя как физический. По сути, он позволяет пользователям создавать компьютер внутри другого компьютера. Несколько виртуальных машин могут одновременно работать на одном хост-устройстве независимо друг от друга.
Машина, на которой размещена виртуальная машина, называется хост-машиной, а сама виртуальная машина называется «гостевой». Один хост-компьютер может поддерживать множество гостевых виртуальных машин, и аналогичным образом несколько виртуальных серверов могут работать на одной физической машине.
Хотя виртуальная машина создается программно, она использует физические ресурсы хост-машины, такие как центральный процессор (ЦП), оперативная память (ОЗУ) и место для хранения на жестком диске. Пользователи могут настроить на своем хост-компьютере столько виртуальных машин, сколько необходимо, но им придется совместно использовать физические аппаратные ресурсы. Количество виртуальных машин, которые могут быть запущены одновременно, ограничено только ресурсами главного компьютера; однако большинство виртуальных машин будут работать медленнее, чем физический компьютер, из-за дополнительных уровней абстракции, через которые им приходится перемещаться для выполнения функций [3].
Рис. 1. Типы архитектуры [3]
Возможности, предоставляемые виртуальными машинами, отражают возможности физических машин, но виртуальные машины не работают непосредственно с аппаратным обеспечением компьютера. Вместо этого существует «гипервизор», который действует как посредник между оборудованием и виртуальной машиной. Этот средний уровень служит для защиты главного компьютера, а также для создания виртуальной машины и управления ею.
Инструменты автоматизации также имеют решающее значение для оптимизации операций центра обработки данных, сокращения ручных задач и минимизации человеческих ошибок. Автоматизация в РСУ предполагает использование программного обеспечения для выполнения рутинных задач, таких как предоставление серверов, управление конфигурацией и мониторинг производительности, без вмешательства человека. Аранжирование идет еще дальше, координируя автоматизированные задачи между несколькими программными и аппаратными компонентами для выполнения более сложных операций, таких как развертывание приложений в различных средах.
Анализ проблем в жизненном цикле центра обработки данных
Выбор местоположения знаменует собой первоначальное решение перед строительством центра обработки данных. Зачастую старые заброшенные склады или супермаркеты превращаются в дата-центры из-за существующих инженерных коммуникаций. Когда подходящие площадки недоступны, строительство вблизи электростанций является предпочтительным из-за высоких потребностей в электроэнергии. Об этом свидетельствует строительство нового дата-центра Facebook в округе Крук, США, в 2012 году, который потребляет 28 мегаватт, что отражает потребление всего округа.
Строители и владельцы современных дата-центров подходят к этому вопросу ответственно. Например, Apple стремится сократить расходы на электроэнергию: в отчетах указывается, что с 2013 года 100% ее центров обработки данных и 94% ее офисов питаются от возобновляемых источников энергии. Дата-центр Maiden окружен солнечными панелями, занимающими площадь около 400 000 квадратных метров, которые ежегодно производят 42 миллиона киловатт-часов электроэнергии. В дата-центре Digital Beijing используются исключительно светодиодные лампы, что снижает потребление электроэнергии на 60%, а специальная стеклянная стена предотвращает проникновение тепла, снижая затраты на охлаждение.
Охлаждение является также серьезной проблемой, поскольку центры обработки данных выделяют огромное количество тепла, что требует рассеивания тепла для предотвращения перегрева важнейших систем. Считается, что значительная часть потребляемой мощности уходит на охлаждение оборудования с использованием воды и сложных систем кондиционирования. Однако возникают случаи, когда два «независимых» источника питания происходят от одного источника.
Собранная тепловая энергия часто рассеивается в воздухе, однако это можно принципиально изменить. «Подключение дата-центра к централизованной системе отопления», – настаивает Яри Иннанен, председатель Координационного центра работников финского дата-центра. По словам Иннанена, вода, используемая для охлаждения финских дата-центров, могла бы отапливать 300 000 частных домов в стране. Такой подход уже используется в Финляндии, где дата-центр российской компании «Яндекс» отапливает город Мянтсяля.
После ввода в эксплуатацию количество персонала, необходимого для обслуживания центра обработки данных, становится вопросом. По данным Facebook, в их центре обработки данных, построенном в Прайнвилле в 2010 году, работают 35 человек, что соответствует одному работнику на 790 квадратных метров, которые отвечают за ремонт или замену оборудования, обслуживание дизель-генераторов и общую оценку объекта.
Этих «местных» технических специалистов поддерживают сотни или даже тысячи системных администраторов, инженеров и программистов, работающих удаленно. Они не требуют прямого доступа к оборудованию (за исключением редких критических ситуаций) и могут управлять практически всеми процессами удаленно с помощью программного обеспечения.
Обеспечение безопасности имеет первостепенное значение, поскольку на серверах хранятся не только фотографии из Instagram. Стандартной практикой являются различные системы управления информационной безопасностью, системы резервного копирования и восстановления данных, а также системы защиты передачи информации. Что также важно, защита от внешних воздействий и вторжений существенно различается. По словам инженера дата-центра Брэндона Беррихилла, некоторые дата-центры выдерживают порывы ветра до 321 км/ч и землетрясения до 9 баллов [4; 5, с. 1845-1875].
Анализ проблем в работе центров обработки данных
Внедрение и управление программным обеспечением для управления центром обработки данных (DCMS) сталкивается с множеством технических и технологических проблем, которые существенно влияют на эффективность и надежность работы центра обработки данных.
Одной из главных задач является обеспечение плавной интеграции и совместимости различных систем и приложений в центрах обработки данных. Неоднородность аппаратного и программного обеспечения, обусловленная разными производителями и поколениями, усложняет процесс интеграции. Например, интеграция устаревших систем с современными инструментами ЦОИМ часто требует обширной настройки, что приводит к увеличению сложности и затрат.
По мере роста размеров и сложности центров обработки данных масштабирование решений DCMS без ущерба для производительности становится все более трудным. В отчете Cisco прогнозируется, что в 2022 году глобальный интернет-трафик достиг 4,8 зеттабайт в год, что указывает на масштабы распространения данных. Управление этим взрывным ростом требует решений DCMS, которые не только масштабируются, но и способны поддерживать высокую производительность при различных нагрузках.
Развертывание и постоянное управление DCMS также влечет за собой серьезные экономические и управленческие проблемы. Первоначальная стоимость внедрения комплексных решений DCMS может быть непомерно высокой для многих организаций, особенно малых и средних предприятий (МСП). Кроме того, эксплуатационные расходы, включая техническое обслуживание, обновления и обучение, увеличивают общую стоимость владения (TCO). По данным Gartner, совокупная стоимость владения среднемасштабного центра обработки данных может превысить 20 миллионов долларов в течение его жизненного цикла.
Сложность управления и обслуживания DCMS, усугубляемая необходимостью специальных навыков для эксплуатации и обслуживания, создает серьезные управленческие проблемы. Менеджеры центров обработки данных должны постоянно обновлять свои знания и навыки, чтобы адаптироваться к новым технологиям, что делает процесс управления более сложным и ресурсоемким.
Также безопасность остается одной из наиболее важных проблем в управлении центром обработки данных, при этом решения DCMS играют ключевую роль в защите данных и инфраструктуры.
Растущая сложность киберугроз, таких, как программы-вымогатели и фишинговые атаки, требует надежных механизмов безопасности в рамках DCMS. Например, исследование IBM показало, что средняя стоимость утечки данных в 2020 году составила 3,86 миллиона долларов, что подчеркивает финансовые последствия упущений в безопасности.
Поэтому управление контролем доступа имеет первостепенное значение для предотвращения несанкционированного доступа к ресурсам центра обработки данных. Решения DCMS должны обеспечивать комплексные механизмы контроля доступа, включая многофакторную аутентификацию и доступ на основе ролей, чтобы гарантировать, что только авторизованный персонал сможет получить доступ к конфиденциальным системам и данным. Кроме того, возможности аудита имеют решающее значение для отслеживания и анализа журналов доступа, чтобы быстро обнаруживать потенциальные инциденты безопасности и реагировать на них.
Однако не все дата-центры в России и за рубежом работают в идеальных условиях. Не каждый коммерческий центр обработки данных сертифицирован по надежности, чтобы подвергаться независимому внешнему аудиту, подтверждающему такую сертификацию. Иногда компании, владеющие центрами обработки данных, ограничивают свои гарантии проведением «внутреннего аудита», основывая свои оценки надежности на самооценке.
Такая ситуация в первую очередь возникает из-за существенных затрат, связанных с сертификацией центров обработки данных. Даже чертежи перспективного центра обработки данных требуют сертификации, а после строительства специалисты Uptime Institute – независимого аудитора соответствия центра обработки данных требованиям устойчивости – оценивают результат. Они оценивают системы центра обработки данных на соответствие заявленным стандартам и перечисляют центр обработки данных и присвоенную ему сертификацию уровня в каталоге Uptime Institute (рис. 2).
Рис. 2. Уровни надежности TIER
Часто такие строгие оценки игнорируются. Помимо организации процесса сертификации, владелец дата-центра должен обеспечить проезд и проживание аудиторов, а также выдержать длительные и тщательные проверки. Следовательно, компании иногда выбирают оценку надежности, основанную на их понимании. Эта оценка может проводиться для каждой подсистемы индивидуально, причем наибольшее значение среди них часто представляет собой окончательный рейтинг.
Уровни надежности с «плюсами», такие, как Tier 3+, вызывают скептицизм. По сути, это свидетельствует о том, что один компонент системы более надежен, чем другие, что не повышает общую надежность системы, но говорит о том, что ЦОД соответствует более высоким требованиям надежности по сравнению со стандартом [4; 5, с. 1845-1875].
Перспективы развития
Эволюция программного обеспечения для управления центрами обработки данных (DCMS) неразрывно связана с развитием технологий и изменением условий эксплуатации центров обработки данных. В эпоху цифровых технологий несколько ключевых тенденций и инноваций будут определять будущее DCMS.
Интеграция искусственного интеллекта (ИИ) и машинного обучения (МО) в DCMS производит революцию в работе центров обработки данных. Алгоритмы искусственного интеллекта и машинного обучения могут прогнозировать сбои системы, оптимизировать энергопотребление и автоматизировать рутинные задачи. Согласно отчету Deloitte, применение машинного обучения в центрах обработки данных может снизить эксплуатационные расходы до 25%. Кроме того, аналитика на основе искусственного интеллекта помогает проводить упреждающее обслуживание, тем самым сокращая время простоя и повышая надежность услуг.
Внедрение облачных вычислений продолжает расти: Gartner прогнозирует, что к 2025 году 85% предприятий будут использовать облачные технологии. Этот сдвиг требует решений DCMS, которые могут эффективно управлять гибридными и мультиоблачными средами. Облачная DCMS обеспечивает масштабируемость, гибкость и снижение затрат на инфраструктуру, облегчая беспрепятственное управление в локальных и облачных средах.
С ростом осведомленности об экологических проблемах все большее внимание уделяется устойчивой и энергоэффективной работе центров обработки данных. Решения DCMS развиваются и включают в себя функции, которые позволяют отслеживать и контролировать потребление энергии, выбросы углекислого газа и использование воды. Использование возобновляемых источников энергии и передовых технологий охлаждения также становится неотъемлемой частью стратегии «зеленых» центров обработки данных. Опрос Uptime Institute, проведенный в 2020 году, показал, что 88% операторов центров обработки данных считают устойчивость важным фактором в своей деятельности и планировании.
Цифровая трансформация и Интернет вещей (IoT). Распространение устройств IoT и стремление к цифровой трансформации во всех отраслях стимулируют спрос на более динамичные и быстро реагирующие центры обработки данных. Решения DCMS должны удовлетворять растущие объемы данных и потребности в обработке в реальном времени, интегрируя управление устройствами Интернета вещей для обеспечения бесперебойной работы. По данным IDC, к 2025 году объем генерируемых данных IoT достигнет 73,1 зеттабайт, что подчеркивает масштаб данных, которыми должны управлять центры обработки данных.
Также внедрение технологии 5G обещает повысить скорость передачи данных, уменьшить задержку и обеспечить возможность подключения большего количества устройств. Это достижение приведет к увеличению объема данных, обрабатываемых центрами обработки данных, и потребует решений DCMS, которые смогут поддерживать вычисления с высокой плотностью и анализ данных в реальном времени [6, с. 127-131].
В заключение отметим, что будущее программного обеспечения для управления центрами обработки данных ждет значительная трансформация, обусловленная достижениями в области искусственного интеллекта и машинного обучения, облачных вычислений, усилиями по устойчивому развитию и глобальными технологическими тенденциями, такими как цифровая трансформация, 5G и кибербезопасность. Удовлетворение этих меняющихся требований потребует инновационных решений.
Заключение
Исследование современного программного обеспечения для центров обработки данных с учетом его проблем, текущих тенденций, будущих перспектив и практических примеров дает всесторонний обзор динамичной среды, которая определяет современное управление центром обработки данных. Этот анализ подчеркнул решающую роль, которую программное обеспечение играет в оптимизации операций, повышении безопасности и обеспечении устойчивости центров обработки данных, которые являются основой цифровой экономики. Как можно заметить, путь вперед характеризуется быстрым технологическим прогрессом и сменой операционных парадигм, каждая из которых представляет уникальные проблемы и возможности для инноваций.
В заключение отметим, что будущее программного обеспечения для центров обработки данных – это одновременно и вызов, и возможности. Поскольку центры обработки данных продолжают развиваться в ответ на технологические достижения и меняющиеся потребности бизнеса, роль программного обеспечения становится все более центральной. Принимая инновации, уделяя приоритетное внимание безопасности и устойчивости, а также принимая гибкие и масштабируемые решения, операторы центров обработки данных могут преодолевать сложности цифровой эпохи. Путь вперед потребует сотрудничества между различными отраслями, постоянных исследований и разработок, а также активного подхода к управлению потребностями мира, который все больше опирается на данные.