# K-means
Segmentación basada en el algoritmo de k-medias

In [1]:
#Si queremos que las imágenes sean mostradas en una ventana emergente quitar el inline
# %matplotlib inline
%matplotlib

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

Using matplotlib backend: Qt5Agg


####  Leemos la imagen

In [2]:
# Cargamos la imagen y la binarizamos por el método de Otzu
img = cv.imread('piezas.png')

cv.imshow('Imagen original',img)
cv.waitKey(0)
cv.destroyAllWindows()

#### Corremos K-means

Se basa en un corrimiento a partir de K semillas (se debe indicar el número K de semillas o grupos a identificar) que se desplazan a partir del cálculo iterativo de la media de las características más cercanas.

En particular en este caso lo que se le pasa al algoritmo es una matriz con filas (de 3 columnas) con los colores RGB de cada pixel. De esta manera, cada fila es la característica (color) de ese píxel.

In [9]:
# Cambiamos el tamaño a un array de Mx3 (con M el número de píxels). Es decir, un vector de M componentes por canal (R,G,B)
Z = img.reshape((-1,3))
print('Dimensión de la matriz de características (colores): {}'.format(Z.shape))

# convert to np.float32
Z = np.float32(Z)

# Definimos el criterio de detención (Epsilon e iteraciones máximas) y número de clústers (K)
criteria = (cv.TERM_CRITERIA_MAX_ITER + cv.TERM_CRITERIA_EPS, 10, 1.0)
K = 2

# Corremos el algoritmo de K-means con:
# - El criterio de detención predefinido
# - 10 ejecuciones del algoritmo distintos parametros iniciales (devuelve los centros de la corrida que de grupos más compactos)
# - Parámetro de incialización de las semillas (aleatorio)
ret,label,center = cv.kmeans(Z,K,None,criteria,10,cv.KMEANS_RANDOM_CENTERS)

Dimensión de la matriz de características (colores): (562237, 3)


#### Interpretamos datos

A partir de los centros de los grupos encontrados por K-means y las etiquetas por píxel armamos una nueva imagen con K colores

- center: Centros de los grupos hallados
- label: etiquetas (replica de los centros) a los que corresponde cada píxel, en su ubicación en la matriz de Mx3

In [10]:
# Convertimos a uint8 y rearmamos la imagen original con los grupos hallados
#===========================================================================

# Mostramos los centros (colores) que forman cada grupo
center = np.uint8(center)
print('Centros: \n {} \n'.format(center))

# La función también devuelve un parámetro de "compactación" basado en las diferencias cuadradas entre las muestras y los centros hallados  
compact = np.uint8(ret)
print('Compactación: \n {} \n'.format(ret))

# Cada píxel que corresponde a un grupo tiene copiado como etiqueta el color al que corresponde. Hacemos un reshape al tamaño original de la matriz de imagen 
img_out = center[label.flatten()]  
img_out = img_out.reshape((img.shape))

# Mostramos la imagen compuesta
cv.imshow('Imagen posterizada',img_out)
cv.waitKey(0)
cv.destroyAllWindows()

Centros: 
 [[ 62  83  21]
 [122 155 173]] 

Compactación: 
 761144491.0817292 

