Segmentación Basada en:

A. Umbrales
1. Binary Thresholding (Umbralización Binaria):
Consiste en convertir una imagen en escala de grises en una imagen binaria. Se selecciona un valor de umbral
𝑇
T, y cada píxel de la imagen se compara con este valor:

Si el valor del píxel es mayor que
𝑇
T, el píxel se establece a 255 (blanco).
Si el valor del píxel es menor o igual a
𝑇
T, se establece a 0 (negro).
2. Variaciones de Binary Thresholding:

Inverso: Los roles de los valores binarios se invierten. Los píxeles por encima del umbral se establecen a 0 (negro), y los píxeles por debajo del umbral se establecen a 255 (blanco).

Truncado: Si el valor del píxel está por encima del umbral, se establece a
𝑇
T. Si está por debajo, se mantiene sin cambios.
A cero (Threshold to Zero): Los píxeles por debajo del umbral se establecen a 0. Los píxeles por encima del umbral se dejan sin cambios.
A cero inverso (Threshold to Zero Inverse): Los píxeles por encima del umbral se establecen a 0. Los píxeles por debajo del umbral se dejan sin cambios.
3. Método de Otsu:
Este método busca un umbral óptimo para separar los píxeles de la imagen en dos clases, maximizando la varianza entre clases. Es útil cuando no se conoce de antemano el valor del umbral.

4. Umbral Adaptativo:
En lugar de usar un único valor de umbral para toda la imagen, el umbral se calcula para pequeñas regiones de la imagen. Esto es útil en imágenes con iluminación variable.

B. Clusters
1. K-means:
K-means es un algoritmo de clustering que agrupa los píxeles en
𝐾
K clusters (grupos) basándose en su similitud. Cada píxel es asignado al cluster con el centroide más cercano, y los centroides se recalculan iterativamente hasta que las asignaciones no cambian. Es útil para segmentar una imagen en múltiples regiones de colores o características similares.

C. Regiones
1. Watershed en CV:
El algoritmo de watershed se basa en la idea de la "inundación" de una topografía, donde los puntos bajos se inundan primero y los bordes entre las cuencas hidrográficas forman las líneas divisorias de las regiones. En la visión por computadora, se usa para segmentar imágenes en regiones distintas, especialmente en imágenes con objetos superpuestos.

3. Operaciones Morfológicas
Estas son operaciones que procesan imágenes basadas en formas.

1. Erosión:
La erosión reduce las regiones blancas de una imagen binaria, eliminando píxeles en los bordes de los objetos. Es útil para eliminar ruido y separar objetos que están cerca.

2. Dilatación:
La dilatación expande las regiones blancas en una imagen binaria, añadiendo píxeles a los bordes de los objetos. Es útil para cerrar agujeros en los objetos y conectar componentes disjuntos.

Cuándo Usar Cada Técnica
Umbrales (Binary y Variaciones): Para segmentar objetos de fondo en imágenes de alto contraste. Binary Thresholding es adecuado cuando se tiene un contraste claro entre los objetos de interés y el fondo.
Método de Otsu: Cuando no se conoce de antemano el umbral adecuado y se desea una segmentación óptima basada en estadísticas de la imagen.
Umbral Adaptativo: Ideal para imágenes con iluminación no uniforme.
K-means: Para segmentar imágenes en regiones con diferentes colores o intensidades, útil en aplicaciones donde se desea identificar múltiples clases o agrupaciones en la imagen.
Watershed: Para segmentar objetos superpuestos o imágenes con detalles complejos.
Erosión y Dilatación: Se usan principalmente para el preprocesamiento de imágenes, como limpiar ruido o mejorar la estructura de los objetos antes de la segmentación final.

#**Código de umbrales**

In [None]:
import cv2
import numpy as np

# Cargar la imagen en escala de grises
img = cv2.imread('ruta_de_tu_imagen.jpg', cv2.IMREAD_GRAYSCALE)

# Aplicar umbralización binaria
_, binary_thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

# Aplicar umbralización binaria inversa
_, binary_inv_thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)

# Aplicar umbralización truncada
_, trunc_thresh = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)

# Aplicar umbralización a cero
_, tozero_thresh = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)

# Aplicar umbralización a cero inverso
_, tozero_inv_thresh = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

# Aplicar el método de Otsu
_, otsu_thresh = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# Aplicar umbralización adaptativa (mean)
adaptive_mean_thresh = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C,
                                             cv2.THRESH_BINARY, 11, 2)

# Aplicar umbralización adaptativa (gaussian)
adaptive_gaussian_thresh = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
                                                 cv2.THRESH_BINARY, 11, 2)

# Mostrar resultados
cv2.imshow("Original", img)
cv2.imshow("Binary Threshold", binary_thresh)
cv2.imshow("Binary Inverse Threshold", binary_inv_thresh)
cv2.imshow("Trunc Threshold", trunc_thresh)
cv2.imshow("To Zero Threshold", tozero_thresh)
cv2.imshow("To Zero Inverse Threshold", tozero_inv_thresh)
cv2.imshow("Otsu's Threshold", otsu_thresh)
cv2.imshow("Adaptive Mean Threshold", adaptive_mean_thresh)
cv2.imshow("Adaptive Gaussian Threshold", adaptive_gaussian_thresh)

cv2.waitKey(0)
cv2.destroyAllWindows()


Explicación del Código:
Binary Thresholding: Establece los píxeles en 255 si están por encima del umbral de 127, y en 0 si están por debajo.
Binary Inverse Thresholding: Igual que el anterior pero invertido.
Truncated Thresholding: Trunca los valores de los píxeles a 127 si están por encima de este valor.
To Zero Thresholding: Mantiene los píxeles por encima del umbral y los que están por debajo los pone a 0.
To Zero Inverse Thresholding: Los píxeles por encima del umbral se ponen a 0, mientras que los de abajo se mantienen sin cambios.
Otsu’s Thresholding: Encuentra automáticamente un umbral óptimo para segmentar la imagen.
Adaptive Thresholding (Mean y Gaussian): Calcula umbrales para pequeñas regiones de la imagen, ideal para casos con iluminación variable.
Cómo Usarlo:
Cambia 'ruta_de_tu_imagen.jpg' por la ruta de la imagen que quieras procesar.
Ejecuta el código en tu entorno de Python, y aparecerán ventanas con cada tipo de umbralización aplicada.
Cierra las ventanas para finalizar la ejecución.

##**Cluster con K-means**


In [None]:
import cv2
import numpy as np

# Cargar la imagen
img = cv2.imread('ruta_de_tu_imagen.jpg')

# Convertir la imagen a un array de 2D con cada píxel representado como un punto en un espacio de 3 dimensiones (R, G, B)
Z = img.reshape((-1, 3))
Z = np.float32(Z)

# Definir criterios y aplicar K-means
# Criterios: terminar el algoritmo después de 10 iteraciones o cuando la precisión sea menor que 1.0
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 10, 1.0)
K = 3  # Número de clusters deseados
ret, label, center = cv2.kmeans(Z, K, None, criteria, 10, cv2.KMEANS_RANDOM_CENTERS)

# Convertir los centros a valores de 8 bits y etiquetar la imagen según los clusters
center = np.uint8(center)
res = center[label.flatten()]
res2 = res.reshape((img.shape))

# Mostrar la imagen segmentada
cv2.imshow('Segmented Image', res2)
cv2.waitKey(0)
cv2.destroyAllWindows()


Reformatear la Imagen:

La imagen se convierte en un array 2D donde cada fila es un píxel representado por sus valores RGB (por ejemplo, [R, G, B]).
Convertir a float32:

Los valores de los píxeles se convierten a float32, ya que K-means en OpenCV requiere este formato de entrada.
Definir Criterios y Aplicar K-means:

El criterio determina cuándo debe detenerse el algoritmo. Aquí usamos un máximo de 10 iteraciones o una precisión (eps) menor a 1.0.
K es el número de clusters que deseamos encontrar en la imagen. Puedes ajustar este número según cuántos segmentos deseas obtener.
Convertir y Etiquetar la Imagen:

Los centros de los clusters se convierten de nuevo a valores de 8 bits (colores en RGB).
Los píxeles de la imagen original se etiquetan con el valor de su cluster correspondiente.

##**Regiones: Segmentación por Regiones con el Algoritmo Watershed**

El algoritmo Watershed es ideal para segmentar objetos que están conectados o que tienen bordes difusos. A continuación te muestro cómo puedes implementarlo en Python:


In [None]:
import cv2
import numpy as np

# Cargar la imagen
img = cv2.imread('ruta_de_tu_imagen.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Aplicar un filtro de desenfoque para reducir el ruido
blurred = cv2.GaussianBlur(gray, (5, 5), 0)

# Aplicar un umbral binario
_, binary = cv2.threshold(blurred, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

# Eliminar pequeños agujeros o ruidos usando morfología (apertura)
kernel = np.ones((3, 3), np.uint8)
opening = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel, iterations=2)

# Determinar el área de fondo usando dilatación
sure_bg = cv2.dilate(opening, kernel, iterations=3)

# Determinar el área de primer plano utilizando la distancia euclidiana
dist_transform = cv2.distanceTransform(opening, cv2.DIST_L2, 5)
_, sure_fg = cv2.threshold(dist_transform, 0.7 * dist_transform.max(), 255, 0)

# Encontrar las regiones desconocidas (bordes entre el fondo y el primer plano)
sure_fg = np.uint8(sure_fg)
unknown = cv2.subtract(sure_bg, sure_fg)

# Marcar los objetos conectados
_, markers = cv2.connectedComponents(sure_fg)

# Aumentar los valores de los marcadores para que no sean cero (Watershed requiere que los marcadores sean positivos)
markers = markers + 1

# Marcar la región desconocida con ceros
markers[unknown == 255] = 0

# Aplicar el algoritmo Watershed
markers = cv2.watershed(img, markers)
img[markers == -1] = [0, 0, 255]  # Bordes marcados en rojo

# Mostrar el resultado final
cv2.imshow('Original', img)
cv2.imshow('Segmented', img)
cv2.waitKey(0)
cv2.destroyAllWindows()


El proceso completo que te mostré tiene varios pasos previos a la aplicación del algoritmo Watershed porque es necesario preparar la imagen para que Watershed funcione correctamente. Vamos a desglosar por qué cada paso es importante:

¿Por Qué Todo el Proceso?
Reducción de Ruido:

Desenfoque (GaussianBlur):
Antes de aplicar Watershed, es importante reducir el ruido en la imagen. Un desenfoque ayuda a suavizar la imagen y a eliminar pequeñas variaciones que podrían interferir con la segmentación.
Umbralización Binaria:

Separación de Fondo y Primer Plano:
Watershed necesita saber qué es fondo y qué es primer plano. La umbralización y las operaciones morfológicas ayudan a definir estas regiones. Sin esta preparación, Watershed podría segmentar erróneamente áreas que no deseas.
Morfología:

Limpieza de la Imagen:
Las operaciones morfológicas como la apertura y la dilatación eliminan pequeños elementos no deseados (ruido) y aseguran que las regiones de interés estén bien definidas.
Marcado de Componentes Conectados:

Inicialización de Marcadores:
Los marcadores son fundamentales para que Watershed funcione correctamente. Cada marcador representa una región que el algoritmo "inundará". Si los marcadores no están bien definidos, el resultado de Watershed será incorrecto o no deseado.
¿Por Qué No Sólo Aplicar Watershed Directamente?
Si aplicas Watershed directamente sin preparar la imagen:

Falta de Marcadores Adecuados: Watershed no sabrá por dónde empezar la segmentación si no se han definido marcadores claros de fondo y primer plano.
Segmentación Incorrecta: Sin las etapas previas, es probable que Watershed detecte demasiadas regiones o no detecte las regiones correctamente.
Ruido en la Segmentación: El ruido en la imagen podría causar que Watershed cree segmentos no deseados.

##**Operaciones morfológicas**

Las operaciones morfológicas son fundamentales en el procesamiento de imágenes para manipular la estructura de las formas en una imagen binaria (blanco y negro). Las dos operaciones básicas que mencionaste son Erosión y Dilatación.

1. Erosión
La erosión reduce el tamaño de las regiones blancas (o de primer plano). Se "erosiona" el borde de las regiones blancas, lo que resulta en una reducción de estas áreas. Esta operación es útil para eliminar pequeñas manchas de ruido.

2. Dilatación
La dilatación, por otro lado, expande las regiones blancas. Añade píxeles al borde de las regiones blancas, lo que puede ayudar a cerrar pequeños agujeros o conectar elementos disjuntos en la imagen.

In [None]:
import cv2
import numpy as np

# Cargar la imagen en escala de grises
img = cv2.imread('ruta_de_tu_imagen.jpg', cv2.IMREAD_GRAYSCALE)

# Aplicar un umbral binario para crear una imagen binaria
_, binary_img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

# Definir un kernel (estructura de elemento) de tamaño 5x5
kernel = np.ones((5, 5), np.uint8)

# Aplicar erosión
erosion = cv2.erode(binary_img, kernel, iterations=1)

# Aplicar dilatación
dilation = cv2.dilate(binary_img, kernel, iterations=1)

# Mostrar resultados
cv2.imshow("Imagen Original", binary_img)
cv2.imshow("Erosión", erosion)
cv2.imshow("Dilatación", dilation)

cv2.waitKey(0)
cv2.destroyAllWindows()


Definir el Kernel:
Un kernel es una pequeña matriz que define la vecindad alrededor de cada píxel en la imagen. Aquí, usamos un kernel de 5x5 con todos sus elementos iguales a 1. El tamaño del kernel afecta la intensidad de la erosión o dilatación.

Erosión:
Se aplica la erosión usando la función cv2.erode(). Esto reduce las áreas blancas en la imagen.

Dilatación:
Se aplica la dilatación usando la función cv2.dilate(). Esto expande las áreas blancas en la imagen.

¿Cuándo Usar Erosión y Dilatación?
Erosión: Útil para eliminar ruido, separar objetos conectados, o reducir el tamaño de objetos en la imagen.
Dilatación: Útil para cerrar pequeños agujeros en objetos, conectar objetos disjuntos, o aumentar el tamaño de los objetos.

Estas operaciones son muy poderosas cuando se combinan. Por ejemplo, puedes aplicar primero la erosión para eliminar ruido y luego la dilatación para restaurar la forma original de los objetos más grandes. ¡Prueba este código y experimenta con diferentes tamaños de kernel y número de iteraciones para ver cómo cambian los resultados!