# Сегментация на основе кластеризации

## Что такое кластеризация? 

Кластеризация - это задача разделения популяции (набора точек) на группы по похожести. Например, зелёные шарики мы складываем в одну кучку, а красные - в другую. Вот эти кучки называются кластерами.

`Кластеризация - разбиение на группы` 

Один из наиболее широко используемых алгоритмов кластеризации - это [K-means](https://www.analyticsvidhya.com/blog/2016/11/an-introduction-to-clustering-and-different-methods-of-clustering/)

Здесь `K` обозначает количество кластеров, которые мы хотим получить. 

Как же работает этот алгоритм? 

1. Рандомно выбираем К начальных кластеров 
2. Рандомно раскидываем точки по кластерам 
3. Вычисляем центр каждого кластера 
4. Вычисляем расстояние от каждой точки до центров каждого кластера 
5. В зависимости от величины расстояния перекидываем точки к ближайшему кластеру 
6. Вычисляем центры новых кластеров (полученных после перекидывания точек в пунтке 5)
7. Повторяем шаги 4, 5 и 6 до тех пор, пока центры кластеров не перестанут изменяться или до тех пор, пока мы не достигнем установленного количества итераций. 

Самое главное достоинства алгоритма K-means - это то, что он простой и понятный.

Давайте попробуем этот алгоритм.

In [None]:
import os 

import cv2 
import matplotlib.pyplot as plt 
import numpy as np

from skimage.color import rgb2gray

In [None]:
fpath = os.path.join(os.path.dirname(os.path.abspath(os.pardir)), "assets", "cv_21.jpeg")
original_image = cv2.imread(fpath)
original_image = cv2.cvtColor(original_image, cv2.COLOR_BGR2RGB)

plt.figure(figsize=[6, 6])
plt.imshow(original_image)
plt.show()

In [None]:
original_image.shape

Эта картинка трёхканальная (то есть 3Д-матрица).

`Неподготовленному человеку может быть непонятно как плоская картинка является 3d-матрицей, поэтому можно представить картинку, как три наложенные друг на друга матрицы, где каждый элемент описывает только один канал (цвет) итогового изображения.`

Её высота: 192 

Ширина: 263 

Количество каналов: 3 (RGB)

Но для алгоритма нам нужно преобразовать её в 2Д-матрицу `(length*width, channels)`. В нашем случае, форма картинки должна быть (192*263, 3)

In [None]:
reshaped_img = original_image.reshape(original_image.shape[0]*original_image.shape[1], original_image.shape[2])
reshaped_img.shape

Дальше нам нужно обучить наш алгоритм и получить кластера. Давайте попробуем получить 5 кластеров из нашей картинки. 

In [None]:
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=5, random_state=42).fit(reshaped_img)

`cluster_centers_` вернёт центры кластеров, а `labels_` даст нам лейблы для каждого пикселя (то есть каждый пиксель будет как бы размечен по кластерам). 

Таким образом мы получим картинку, но с кластерами на ней. Но чтобы отобразить её, нам нужно будет обратно преобразовать матрицу в 3Д.

In [None]:
_tmp = kmeans.cluster_centers_[kmeans.labels_]
clustered_img = _tmp.reshape(original_image.shape).astype(np.uint8)

plt.figure(figsize=[6, 6])
plt.imshow(clustered_img)
plt.show()

Та-дам! Мы смогли сегментировать картинку, используя всего 5 кластеров. Можно попробовать увеличить количество кластеров и посмотреть, что будет. 

## Заключение

Алгоритм K-means работает хорошо, когда у нас используются маленькие картинки, но проблемы начинаются на больших данных. Так как алгоритм щупает все точки на каждой итерации и его реализация становится слишком "дорогой". То есть мы рискуем состариться, ожидая, пока алгоритм досчитается. 

## Полезные ссылки 

* [Introduction to Image Segmentation Techniques](https://www.analyticsvidhya.com/blog/2019/04/introduction-image-segmentation-techniques-python/)