Главная
АИ #44 (226)
Статьи журнала АИ #44 (226)
Эффективное сжатие изображений с помощью кластеризации методом K-средних

Эффективное сжатие изображений с помощью кластеризации методом K-средних

Рубрика

Информационные технологии

Ключевые слова

кластеризация методом K-средних
сжатие изображений
уменьшение цветовой палитры
RGB-кодирование
эффективность хранения данных
машинное обучение
обучение без учителя
визуальная точность
адаптивная кластеризация
гибридные методы сжатия

Аннотация статьи

В данной работе исследуется применение кластеризации методом K-средних для сжатия изображений путем уменьшения цветовой палитры в цифровых изображениях. Традиционные 24-битные цветные изображения требуют значительного объема хранения, так как каждый пиксель представлен комбинацией значений красного, зеленого и синего (RGB). Используя метод K-средних, мы уменьшаем количество уникальных цветов до ограниченного набора представительных цветов, что позволяет значительно сократить объем данных изображения. Алгоритм K-средних группирует похожие значения цвета, что позволяет использовать меньшую цветовую палитру без значительного изменения визуальных характеристик изображения. На примере изображения мы демонстрируем шестикратное уменьшение объема хранения, достигая коэффициента сжатия примерно 6:1. Несмотря на сокращение цветового разнообразия, сжатое изображение сохраняет высокий уровень визуальной точности, с незначительными артефактами, заметными только в областях с плавными цветовыми переходами. Это исследование подчеркивает эффективность метода K-средних как простого и действенного подхода для цветового сжатия изображений, подходящего для приложений с ограниченными возможностями хранения и пропускной способностью. Кроме того, обсуждаются потенциальные улучшения данного метода, включая адаптивную кластеризацию и гибридные подходы, для дальнейшего повышения качества и эффективности сжатия.

Текст статьи

Введение

С быстрым ростом создания цифрового контента изображения стали неотъемлемой частью нашего взаимодействия в интернете, значительно влияя на потребление данных и требования к хранению. Изображения с высоким разрешением, часто закодированные в 24-битном цвете (8 бит на канал для красного, зеленого и синего), обеспечивают яркое и реалистичное отображение. Однако это приводит к высокой стоимости хранения и использования полосы пропускания, особенно для больших изображений или когда требуется передача изображений по сетям с ограниченной пропускной способностью. Традиционные методы сжатия, такие как JPEG и PNG, помогают уменьшить размер файлов, используя избыточность и сжатие цветовой информации, но иногда приводят к заметным артефактам, особенно при высоких коэффициентах сжатия. В результате появляется всё больший интерес к поиску альтернативных методов сжатия изображений, которые сохраняют качество при снижении требований к хранению.

Одним из перспективных подходов в области сжатия изображений является использование методов машинного обучения без учителя, в частности кластеризация методом K-средних. K-средних – это широко используемый алгоритм в анализе данных, который группирует данные на основе их схожести, определяя заданное количество «центроидов», которые лучше всего представляют различные кластеры данных. Применение этой техники к изображениям предполагает кластеризацию пикселей на основе их значений RGB, сокращая широкий спектр цветов до меньшего, представительного набора. Определяя ограниченное количество представительных цветов, или «кластеров», метод K-средних позволяет значительно сжать исходное изображение без необходимости в таком объеме памяти, как для несжатых форматов. Этот процесс сохраняет общую эстетику и структурные элементы изображения при значительном сокращении объема цветовой информации, подлежащей хранению.

В изображении в цветовой модели RGB цвет каждого пикселя можно представить как уникальную точку в трехмерном пространстве, где оси x, y и z соответствуют интенсивностям красного, зеленого и синего цветов. Изображение с разрешением 128 x 128 пикселей, например, содержит 16 384 таких точек, каждая из которых представляет собой конкретную цветовую комбинацию. При применении кластеризации методом K-средних мы рассматриваем каждый пиксель как точку данных и группируем эти пиксели в кластеры на основе цветовой схожести. При достаточно малом числе кластеров, например 16, изображение можно перекодировать, сохраняя только значения цветов центроидов и индекс ближайшего центроида для каждого пикселя. Это снижает объем данных, необходимых для описания каждого пикселя, с 24 бит до всего 4 бит, обеспечивая значительное уменьшение размера файла при сохранении визуально схожего вида.

Цель данной работы – рассмотреть технический процесс и последствия использования метода кластеризации K-средних для сжатия изображений. Изучая влияние кластеризации на точность изображения и оценивая эффективность сокращения цвета, данное исследование подчеркивает потенциал подходов машинного обучения для создания высокоэффективных методов сжатия изображений, сохраняющих визуальное качество. Помимо анализа эффективности хранения и сохранения качества, достигнутого с помощью этого подхода, исследование освещает его более широкое применение в обработке изображений, где важны экономия места и сохранение качества. В рамках детального анализа сжатия на основе метода K-средних мы продемонстрируем сильные и слабые стороны этой техники и обсудим направления для дальнейших исследований по оптимизации её производительности в реальных приложениях.

Методология и Эксперименты

Для сжатия изображения путем уменьшения цветовой палитры был применен алгоритм кластеризации методом K-средних к изображению размером 640 x 960 пикселей. В исходной форме изображение состояло примерно из 614 400 уникальных пикселей, каждый из которых имел значения интенсивности красного, зеленого и синего (RGB), представленные как трехмерная точка в цветовом пространстве RGB. Этот набор данных был затем преобразован в двумерный массив, где каждая строка соответствовала значениям RGB для одного пикселя, что привело к матрице данных размером (614400, 3).

Каждый пиксель изображения представлен тремя цветовыми каналами (красный, зеленый и синий), по 8 бит на канал, что дает в сумме 24 бита на пиксель. Общее количество пикселей в изображении и соответствующее требование к объему хранения можно рассчитать следующим образом:

Общее количество пикселей = Ширина × Высота = 640 × 960 = 614,400.

Исходный объем в битах = Общее количество пикселей × Биты на пиксель.

Исходный объем в битах = 614,400 × 24 = 14,745,600 бит.

image.png

Рис. 1. Исходное изображение демонстрирует полную глубину цвета и детали исходного изображения размером 640 x 960 пикселей, которое будет использовано для демонстрации подхода кластеризации методом K-средних для сжатия изображений

Процесс кластеризации использовал 16 кластеров (K = 16) для группировки похожих цветов, представляя разнообразие цветов в исходном изображении с помощью всего 16 уникальных цветов. Алгоритм K-средних итеративно корректировал центроиды для нахождения оптимальных представителей для каждой группы цветов, эффективно сокращая разнообразие цветов на изображении. В результате сжатая версия сохранила основные визуальные характеристики изображения при значительном уменьшении объема данных, необходимых для его представления.

image.png

Рис. 2. 3D-точечный график визуализирует распределение цветов RGB пикселей в исходном изображении, с отмеченными финальными центроидами (представляющими 16 кластеров)

Для кластеризации методом K-средних данные изображения были преобразованы в двумерную матрицу, где каждая строка соответствует пикселю, а каждый столбец представляет один из цветовых каналов (красный, зеленый или синий). Эта преобразованная матрица имеет форму m×3, где m – это общее количество пикселей.

image.png

Где m = 614,400.

Затем алгоритм K-средних был применен для кластеризации цветов пикселей. Метод K-средних направлен на минимизацию общей квадратной дистанции между каждым пикселем и его ближайшим центроидом, эффективно группируя схожие цвета вместе. Целевая функция метода K-средних определяется как:

image.png

Где:

  • image.png – общее количество пикселей,
  • image.png – количество кластеров (в данном случае 16),
  • image.png представляет значения RGB для i-го пикселя,
  • image.png – RGB центроид кластера jjj,
  • image.png – бинарный индикатор (1, если пиксель i принадлежит кластеру j, в противном случае 0).

Для оценки эффективности данного подхода мы рассчитали требования к объему хранения как для исходного, так и для сжатого изображений. В исходном изображении каждый пиксель требовал 24 бита (по 8 бит на канал RGB), что приводило к общему объему хранения около 14 745 600 бит. В то же время сжатое изображение потребовало всего 2 457 984 бита. Это было достигнуто за счет хранения значений RGB для 16 представительных цветов, что требовало 24 бита на цвет, а также кодирования цвета каждого пикселя в виде индекса, для чего требовалось всего 4 бита. В результате был достигнут коэффициент сжатия примерно 6:1, что подчеркивает эффективность метода в уменьшении размера изображения при сохранении качества.

image.png

Рис. 3. Сравнение оригинального и сжатого изображений (используются только 16 цветов) демонстрирует эффект подхода кластеризации методом K-средних. Сжатое изображение сохраняет ключевые визуальные элементы, но имеет незначительные артефакты сжатия из-за ограниченной цветовой палитры

Полученное сжатое изображение, при сравнении с исходным, сохранило основные визуальные элементы оригинального изображения орла, хотя с видимыми артефактами сжатия из-за ограниченной цветовой палитры. Центроиды цветовых кластеров были представлены в виде палитры, отображая финальные 16 цветов, использованных в сжатом изображении.

image.png

Рис. 4. Цветовая палитра отображает 16 представительных цветов, использованных в сжатом изображении. Каждый цвет соответствует одному из центроидов метода K-средних, что демонстрирует сокращенный диапазон цветов, примененных к изображению

Анализ Результатов

Результаты сжатия изображений на основе кластеризации методом K-средних показывают компромисс между эффективностью хранения и визуальным качеством. Уменьшив цветовое разнообразие изображения до 16 цветов, мы сохранили основные черты исходного изображения, значительно сократив при этом объем данных. В этом разделе представлен анализ качества сжатого изображения, обсуждаются визуальные артефакты, возникающие из-за уменьшения цветовой палитры, и оценивается эффективность этого подхода.

Метод сжатия позволил достичь шестикратного сокращения объема хранения, как было рассчитано в предыдущем разделе. Это особенно важно для приложений, где ограничены пространство хранения или пропускная способность, таких как мобильные приложения, изображения в вебе и низкоскоростные сетевые среды. Сжатое изображение требует только хранения 16 RGB-значений для цветовой палитры и 4-битных индексов для каждого пикселя, что значительно уменьшает объем данных по сравнению с исходным 24-битным цветовым представлением.

Несмотря на то, что кластеризация методом K-средних обеспечивает эффективное сокращение цвета, подход имеет свои ограничения. Ограниченная цветовая палитра может привести к появлению видимых артефактов, особенно в изображениях со сложной текстурой или градиентами. Кроме того, фиксированное количество кластеров (в данном случае 16) может быть не оптимальным для всех изображений; некоторые изображения могут выигрывать от большего или меньшего количества кластеров в зависимости от их цветового разнообразия и требований к детализации. Динамическая настройка K на основе содержимого изображения может потенциально улучшить качество сжатия без значительного увеличения объема хранения.

Сравнение оригинального и сжатого изображений показывает, что сжатая версия сохраняет общую структуру и ключевые визуальные элементы оригинала. Однако видны небольшие артефакты, особенно в областях с плавными цветовыми переходами. Эти артефакты возникают из-за ограниченной цветовой палитры, когда незначительные цветовые вариации в исходном изображении заменяются одним центроидом в сжатом изображении. Несмотря на эти незначительные искажения, сжатое изображение остается визуально схожим с оригиналом, что демонстрирует эффективность метода K-средних в сохранении важных деталей изображения даже при уменьшении количества цветов.

Будущие улучшения могут включать адаптивные методы кластеризации, которые автоматически определяют оптимальное количество кластеров на основе содержимого изображения, или гибридные подходы к сжатию, которые сочетают кластеризацию методом K-средних с традиционными методами, такими как JPEG, для еще более эффективного хранения. Также можно рассмотреть использование моделей машинного обучения, таких как автоэнкодеры, для более качественного сжатия при минимизации объема хранения.

Заключение

В данном исследовании изучено применение кластеризации методом K-средних как эффективного метода для сжатия изображений путем уменьшения цветовой палитры. Представляя каждый пиксель как точку в пространстве RGB и группируя эти точки, мы сократили цветовую палитру изображения до 16 представительных цветов, достигнув значительного коэффициента сжатия, примерно 6:1. Это сокращение позволило сохранить основные визуальные элементы изображения при значительном уменьшении требований к объему хранения, что делает данный метод идеальным для приложений с ограниченным размером данных.

Результаты показали, что метод кластеризации K-средних может эффективно сжимать изображения, балансируя между эффективностью хранения и визуальным качеством. Несмотря на незначительные артефакты и полосы цвета, эти проблемы были минимальными, и сжатое изображение сохраняло основные характеристики оригинала. Этот метод особенно полезен в сценариях, где детализация изображения вторична по отношению к требованиям хранения, таких как веб-изображения, мобильные приложения и низкоскоростные сетевые среды.

Однако исследование также выявило некоторые ограничения, включая потенциальные видимые артефакты в изображениях с высоким цветовым разнообразием или сложными градиентами. Будущие исследования могут решить эти задачи, изучая адаптивные методы кластеризации или гибридные модели сжатия, которые оптимизируют количество кластеров в зависимости от конкретного содержания каждого изображения. Модели машинного обучения, такие как автоэнкодеры, также могут предложить перспективные пути для дальнейшего улучшения качества сжатия.

В заключение, метод K-средних предоставляет простой, но эффективный подход к сжатию изображений через уменьшение цветовой палитры, демонстрируя, что методы машинного обучения могут предложить практичные решения для эффективного хранения и передачи данных без значительного ущерба для качества изображения. Данное исследование открывает возможности для дальнейших улучшений и подчеркивает потенциал методов кластеризации в области обработки и сжатия изображений.

Список литературы

  1. Wu J. (2012). Advances in K-means Clustering: A Data Mining Thinking (Springer Theses: Recognizing Outstanding Ph.D. Research). Springer; First Edition (July 10, 2012).
  2. Ikotun A.M., Ezugwu A.E., Abualigah L., Abuhaija B., Heming J. (2023). K-means clustering algorithms: A comprehensive review, variants analysis, and advances in the era of big data. Information Sciences, 622, P. 178-210.
  3. Journal of Artificial Intelligence and Systems. (2024). A Review on Analysis of K-Means Clustering Machine Learning Algorithm Based on Unsupervised Learning. Journal of Artificial Intelligence and Systems, 6(1), P. 85-95. DOI:10.33969/AIS.2024060106.
  4. Verma G.K. (2020). Image Compression Using Deep Learning-Based Multi-structure Feature Map and K-Means Clustering. In Machine Learning, Image Processing, Network Security, and Data Sciences, P. 365-374. DOI:10.1007/978-981-15-6315-7_30.
  5. Paul R.K., Jena S., Chandran S., Bandyopadhyay A., Swain, S. (2024). Image Compression Scheme Based on Optimized K-means Clustering and Higher-Level Decomposed DWT. Procedia Computer Science, 235, P. 642-655.
  6. Patel R. (2024). Exploring Image Compression with K-means Clustering. Medium. Retrieved from https://medium.com/.

Поделиться

362

Минасов Ш. М., Аль-махакари Ш. А., Шараф А. Х. Эффективное сжатие изображений с помощью кластеризации методом K-средних // Актуальные исследования. 2024. №44 (226). Ч.I.С. 74-79. URL: https://apni.ru/article/10385-effektivnoe-szhatie-izobrazhenij-s-pomoshyu-klasterizacii-metodom-k-srednih

Обнаружили грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики)? Напишите письмо в редакцию журнала: info@apni.ru

Другие статьи из раздела «Информационные технологии»

Все статьи выпуска
Актуальные исследования

#52 (234)

Прием материалов

21 декабря - 27 декабря

осталось 7 дней

Размещение PDF-версии журнала

1 января

Размещение электронной версии статьи

сразу после оплаты

Рассылка печатных экземпляров

17 января