# <font color="Turquoise"><b>Práctica IV: Segmentación de de imagen</b></font>

Elaborado con el apoyo de:
Luis Fernando Becerra, BEDA Aprendizaje de Máquinas 2024-1S - 2025-1S
Andres Esteban Marin Manco, BEDA Aprendizaje de Máquinas 2025-1S

# <font color="LightPink"><b>Aplicación Clustering: Segmentación de imagen</b></font>

<p align="center">
  <img src="https://miro.medium.com/v2/resize:fit:1400/1*8GEXSMN6FyVNBWNBXVAA7A.png
" width="500"/>
</p>

<br>

En esta última parte de la Práctica 3, aplicaremos los algoritmos de `DBSCAN` y `Spectral Clustering` para realizar una **segmentación sobre una imagen RGB**.

El objetivo es analizar:

- La **selección de parámetros** adecuados para cada algoritmo.
- El **costo computacional** asociado a su ejecución, especialmente en contextos de alta dimensionalidad como las imágenes.

Para esta actividad, utilizaremos la imagen `imgflowers.png` como caso de estudio.


In [None]:
#Importamos las librerias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
#Leemos la imagen RGB


In [None]:
#Revisemos las dimensiones de los datos
img.shape

Una imagen a color o **RGB**, como la capturada por nuestros celulares o una cámara convencional, cuenta con **tres canales** (capas o bandas) que capturan respectivamente la información de color rojo <font color="red"><b>(RED)</b></font>, verde <font color="green"><b>(GREEN)</b></font> y azul <font color="blue"><b>(BLUE)</b></font>. A partir de la composición de estos colores se forma una imagen a color.

<br>

**¿Por qué estos canales?**  
Las cámaras convencionales están inspiradas en el **ojo humano**, el cual funciona con base en filtros en estas longitudes de onda.

Dependiendo del formato, la imagen puede contener más información. En este caso, el formato **PNG** tiene un **cuarto canal** correspondiente a valores de referencia para el color negro. **Vamos a trabajar solo con los primeros 3 canales.**

<br>

Adicionalmente, como estamos trabajando con la versión gratuita de Colab, **no tenemos suficiente memoria RAM** que requieren los métodos `DBSCAN` y `Spectral Clustering`. Por lo anterior, vamos a tomar **una parte de la imagen correspondiente a 100x100 píxeles.**

In [None]:
def extraer_seccion_random(imagen, alto=100, ancho=100):
    h, w = imagen.shape[:2]

    y = np.random.randint(0, h - alto + 1)
    x = np.random.randint(0, w - ancho + 1)

    return imagen[y:y+alto, x:x+ancho, 0:3]

In [None]:
#Visualización de la seccion de imagen
subimg = extraer_seccion_random(img)
plt.imshow(subimg)
plt.title("Sección aleatoria 100x100")
plt.show()

Como podemos observar, la imagen está compuesta por **flores y hojas**. Esperaríamos que un proceso de **segmentación** sea, al menos, capaz de **separar las flores de diferentes colores** y las hojas.

Esto quiere decir que podríamos obtener **al menos 3 clusters** bien diferenciados en la imagen:
1. Hojas o fondo verde
2. Flores de un primer color
3. Flores de un segundo color

Ahora, es necesario organizar los datos de tal forma que podamos emplear los métodos de agrupamiento.

Como recordarán, estos métodos requieren una **matriz de dos dimensiones**, donde:

- Las **filas** corresponden a las **muestras**.
- Las **columnas** corresponden a las **características**.

En el caso de una imagen, nuestras muestras corresponden a los **píxeles**, y las columnas a sus respectivos **valores RGB** (Rojo, Verde y Azul).  
Es decir, cada píxel se representa como un vector de tres dimensiones: `(R, G, B)`.


In [None]:
#Paso 1: Organizamos la matriz de la forma
# 3 x numero de pixeles


In [None]:
#Paso 2: trasponemos obtener la matriz de datos
data = data.transpose(1,0)
data.shape

Antes de iniciar el agrupamiento vamos a escalar la imagen de 0 a 1.

In [None]:
#Importamos MaxAbsScaler

#Escalamos la imagen de 0 a 1


## <font color="LightPink"><b>DBSCAN</b></font>

Vamos a aplicar inicialmente el metodo `DBSCAN` y explorar un poco la selección de los parametros.

In [None]:
#Importamos


In [None]:
#Configuramos los parametros

#Entrenamos el modelo

#Obtenemos las etiquetas de pertenencia


Nota: el metodo de cluster nos entregara la pertenencia de cada pixel a un cluster. Estas etiquetas serán un vector de 1 dimension correspondiente al número de pixeles.

In [None]:
#Revisar tamaño de etiquetas


Recordemos que DBSCAN no requiere el número de clusters, estos son calculados automaticamente a partir del los parametros seleccionados.

In [None]:
#Revisar numero de clusters

#-1: Corresponde a los puntos de ruido

Para graficar la segmentación, debemos reconstruir la imagen de 100x100.

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(6, 3))

#imagen original
axs[0].imshow(subimg)  #subimg: sección original 100x100x3
axs[0].set_title("Imagen original")
axs[0].axis('off')

#imagen segmentada por clustering
clusters_img = y.reshape(100, 100)  #y: etiquetas del clustering
axs[1].imshow(clusters_img)
axs[1].set_title("Imagen segmentada DBSCAN")
axs[1].axis('off')

plt.tight_layout()
plt.show()

Exploremos con diferentes valores de eps y min_samples.

## <font color="LightPink"><b>Spectral Clustering</b></font>

Con `DBSCAN` notamos:

1. Una **alta dificultad para sintonizar los parámetros**.
2. El método es **muy sensible al valor de `eps`**.
3. **No se logra con facilidad segmentar los objetos** principales de la imagen.
4. Sin embargo, es un método **rápido en tiempo de cómputo**.

Ahora vamos a evaluar el comportamiento de `Spectral Clustering` sobre el **mismo conjunto de datos**, para comparar su capacidad de segmentación visual y su costo computacional.


In [None]:
#Importamos


In [None]:
#Configuramos los parametros

#Entrenamos el modelo

#Obtenemos las etiquetas de pertenencia


In [None]:
fig, axs = plt.subplots(1, 2, figsize=(6, 3))

#imagen original
axs[0].imshow(subimg)  #subimg: sección original 100x100x3
axs[0].set_title("Imagen original")
axs[0].axis('off')

#imagen segmentada por clustering
clusters_imgSC = y_SC.reshape(100, 100)  #y: etiquetas del clustering
axs[1].imshow(clusters_imgSC)
axs[1].set_title("Imagen segmentada Spectral Clustering")
axs[1].axis('off')

plt.tight_layout()
plt.show()

### <font color="LightPink"><b>Cluster con color del centroide</b></font>

Asignamos a cada píxel el **color promedio RGB** de su cluster, de modo que la imagen segmentada refleje los colores reales de cada grupo y no solo etiquetas numéricas.


In [None]:
#@title Cluster con color del centroide: construir imagen con colores promedio por cluster

#Inicializamos un array del mismo tamaño que I (pixeles RGB)
img_SC = np.zeros_like(I)

#Para cada etiqueta de cluster, calculamos el color promedio y lo asignamos a los píxeles correspondientes
for label in np.unique(y_SC):
    img_SC[y_SC == label] = I[y_SC == label].mean(axis=0)

#Reconstruimos la imagen 2D de 100x100 con sus 3 canales RGB
img_SC = img_SC.reshape(100, 100, 3)

#Escalamos los valores a [0, 255] si están en el rango [0, 1], y convertimos a tipo uint8
img_SC = (img_SC * 255).astype(np.uint8) if img_SC.max() <= 1.0 else img_SC.astype(np.uint8)

#Mostrar resultados
fig, axs = plt.subplots(1, 2, figsize=(6, 3))
axs[0].imshow(subimg)
axs[0].set_title("Imagen original")
axs[0].axis('off')

axs[1].imshow(img_SC)
axs[1].set_title("Segmentada SC (RGB centroides)")
axs[1].axis('off')

plt.tight_layout()
plt.show()

Exploremos con diferentes numeros de clusters y valores de gamma.

Finalmente, comparemos de forma númerica los resultados obtenidos por DBSCAN y Spectral Clustering.

In [None]:
#Calcular silhouette_score
from sklearn.metrics import silhouette_score

print("Silhouette DBSCAN:", silhouette_score(I, y))
print("Silhouette Spectral Clustering:", silhouette_score(I, y_SC))