

# Práctica Introductoria nº 5: "Introducción a la librería scikit-image (skimage)" y "Detección de estructuras geométricas con OpenCV".
---
Esta última práctica introductoria se pretende mostrar el uso de la librería "scicit-image" para el tratamiento de imágenes en Python. Asimismo, se prácticarán algunos aspectos relacionados con la "detección de estructuras geométricas simples" usando OpenCV y ya explicados en el Tema 4 de la asignatura. 

# scikit-image
---
*scikit-image* (o *skimage*) es una colección de algoritmos, organizados en paquetes, para Procesamiento de Imágenes y Visión Artificial. Se trata de una librería (o biblioteca) de código abierto para el lenguaje Python, que incluye algoritmos de segmentación, transformaciones geométricas, manipulaciones entre espacios de color, análisis de formas, filtrado de imágenes, morfología mátemática, detección de características de objetos, entre otras funcionalidades. *skimage* está diseñada para interoperar con las bibliotecas numéricas y científicas NumPy y SciPy de Python. 

Muchas de las funciones que aparecen en *OpenCV* también lo están en *scikit-image*. Ambas son buenas alternativas: *OpenCV* tiene un propósito más general para Visión Artificial (incluyendo funciones para Visión 3D o reconocimiento facial) y *scikit-image* está más orientada específicamente a tratamiento de imágenes digitales. *OpenCV* ofrece APIs para diferentes lenguajes de programación (p.ej., C++) mientras que *scikit-image* se desarrolló específicamente para Python. Las implementaciones de los algoritmos son diferentes, y algunos trabajos indican que el rendimiento de *OpenCV* es superior.

La documentación sobre esta librería puede encontrarse en:
https://scikit-image.org/docs/stable/api/skimage.html

La primera versión de *skimage* aparece en agosto de 2009. Actualmente. la última versión estable es la 0.22.0 (octubre 2023).


El paquete principal de *skimage* solo proporciona algunas utilidades para convertir entre tipos de datos de imagen. Para poder usar la mayoría de las funciones de procesamiento de imágenes, es necesario importar alguno(s) de los siguientes subpaquetes específicos relacionados con el problema que se quiera resolver. Entre ellos están los siguientes: 

*color* : conversiones entre espacios de color y funciones relacionadas con el uso del color.  
*data* : contiene imágenes de prueba y datos de ejemplo.  
*draw* : permite dibujar primitivas geométricas (p.ej., líneas) que trabajan con matrices NumPy.  
*exposure* : permiten realizar ajustes sobre el brillo de la imagen (p.ej., realizar la ecualización de un histograma).  
*feature* : permiten realizar la detección y extracción de características (p.ej., esquinas, características de análisis de texturas).  
*filters* : realización de filtrados sobre imágenes (p.ej., detección de bordes).  
*morphology* : para la aplicación de operaciones morfológicas a las imágenes (p.ej., erosión, apertura, ...).  
*restoration* : para la restauración de imágenes (p.ej., deconvolución, eliminación de ruidos).   
*draw* : para dibujar sobre las imágenes.  
*io* : para leer, escribir y mostrar imágenes y vídeos.  
*measure* : para calcular medidas de características de objetos en imágenes (p.ej. distancias, perímetros, ...).  
*metrics* : métricas correspondientes a las imágenes (p.ej., distancias, similitudes,...).  
*segmentation* : algoritmos para segmentar (o dividir) una imagen en múltiples regiones.   
*transform* : lleva a cabo diferentes tipos de transformaciones sobre las imágenes (p.ej., transformaciones geométricas, Fourier, ...).  
*graph* : para manejar una imagen como un grafo (p.ej., generar grafo de etiquetas de una imagen).  
*util* : contiene utilidades diversas (p.ej., convertir los valores de los píxeles de una imagen en valores flotantes entre 0 y 1, recortar una región de una imagen, ...).  
*viewer* : una sencilla interfaz gráfica de usuario para visualizar resultados y explorar valores de parámetros.  


# Ejemplos de uso de *scikit-image*

A continuación, se codifican algunos ejemplos de uso de esta librería y se proponen algunos ejercicios con los que pretendemos que el alumno aprenda a aplicarla en la resolución de problemas sobre procesamiento de imágenes. 

### Detección de elementos en imágenes

Se proponen algunos ejemplos carga de imágenes en las que se detectan bordes, contornos y esquinas, finalmente se muestran los correspondientes resultados.

In [None]:
# Se aplica el filtrado de bordes de Sobel a una imagen ejemplo
from skimage import data, io, filters
import matplotlib.pyplot as plt

plt.subplot(1,2,1)
plt.title ('Imagen original')
image = data.coins()
io.imshow(image)

plt.subplot(1,2,2)
plt.title ('Imagen de bordes con Sobel')
# Ojo: produce combinación de filtrado vertical y horizontal
# Pueden aplicarse separadamente ambos filtrados mediante: skimage.filters.sobel_h y skimage.filters.sobel_v
edges = filters.sobel(image)    
io.imshow(edges, cmap='gray')
io.show()

*Ejercicio:* Probar algunos de los filtrados paso alto y paso bajo explicados (o no) en clase con diferentes imágenes de test

In [None]:
from skimage import data, io, filters
import matplotlib.pyplot as plt
from skimage.morphology import disk

plt.subplot(1,2,1)
plt.title ('Imagen original')
image = data.page()
io.imshow(image)

plt.subplot(1,2,2)
plt.title ('Filtrado de mediana 5x5:')
mediana = filters.median(image, disk(5))    
io.imshow(mediana)
io.show()

*Ejercicio:* Aplicar un filtrado de Canny a la imagen de 'cameraman'

In [None]:
# Se aplica el filtrado de contornos de Canny a una imagen ejemplo
from skimage import data, io, feature
import matplotlib.pyplot as plt
from skimage.color import rgb2gray

plt.subplot(1,2,1)
plt.title ('Imagen original')
image = io.imread('cameraman.png')
im_gris=rgb2gray(image)
print(image.shape)
io.imshow(im_gris)
print(im_gris.shape)

plt.subplot(1,2,2)
plt.title ('Imagen de contornos con Canny')
contours = feature.canny(im_gris) # Probar: feature.canny(im_gris, sigma=3) 
io.imshow(contours)
io.show()

*Ejercicio:* Escribir un código que aplique filtrados morfológicos a una imagen binaria sintética

In [None]:
import numpy as np
from skimage.morphology import erosion, dilation, square
cuadrado = np.array([[0, 0, 0, 0, 0],[0, 1, 1, 1, 0],[0, 1, 1, 1, 0],[0, 1, 1, 1, 0],[0, 0, 0, 0, 0]], dtype=np.uint8)
print('cuadrado')
print(cuadrado)
print()

erosionada= erosion(cuadrado, square(3))
print('erosionada')
print(erosionada)
print()

dilatada= dilation(cuadrado, square(3))
print('dilatada')
print(dilatada)

In [None]:
# Se aplica el detector de esquinas de Harris a una imagen ejemplo
import matplotlib.pyplot as plt

plt.subplot(1,2,1)
plt.title ('Imagen original')
image = data.checkerboard()
io.imshow(image)

plt.subplot(1,2,2)
plt.title ('Imagen de esquinas de Harris')
corners = feature.corner_peaks(feature.corner_harris(image), min_distance=5)
plt.plot(corners[:, 1], corners[:, 0], 'r.')
io.imshow(image)
io.show()

### Extraer propiedades sobre la forma

Se proponen algunos ejemplos de extracción de propiedades sobre las formas contenidas en una imagen binaria sintética usando la librería *measure* y la función *regionprops*.

In [None]:
# se importan librerias
import math
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

from skimage.draw import ellipse
from skimage.measure import label, regionprops, regionprops_table
from skimage.transform import rotate


In [None]:
# se crean y dibujan dos elipses sintéticas de diferentes caracteristicas en una matriz

image = np.zeros((600, 600))
rr, cc = ellipse(300, 350, 100, 220)
image[rr, cc] = 1

image = rotate(image, angle=15, order=0)

rr, cc = ellipse(100, 100, 60, 50)
image[rr, cc] = 1

label_img = label(image)
regions = regionprops(label_img)

fig, ax = plt.subplots()
ax.imshow(image, cmap=plt.cm.gray)

for props in regions:
    y0, x0 = props.centroid
    orientation = props.orientation
    x1 = x0 + math.cos(orientation) * 0.5 * props.minor_axis_length
    y1 = y0 - math.sin(orientation) * 0.5 * props.minor_axis_length
    x2 = x0 - math.sin(orientation) * 0.5 * props.major_axis_length
    y2 = y0 - math.cos(orientation) * 0.5 * props.major_axis_length

    ax.plot((x0, x1), (y0, y1), '-r', linewidth=2.5)
    ax.plot((x0, x2), (y0, y2), '-r', linewidth=2.5)
    ax.plot(x0, y0, '.g', markersize=15)

    minr, minc, maxr, maxc = props.bbox
    bx = (minc, maxc, maxc, minc, minc)
    by = (minr, minr, maxr, maxr, minr)
    ax.plot(bx, by, '-b', linewidth=2.5)

ax.axis((0, 600, 600, 0))
plt.show()

In [None]:
props = regionprops_table(label_img, properties=('centroid',
                                                 'orientation',
                                                 'minor_axis_length',
                                                 'major_axis_length'))
pd.DataFrame(props)

In [None]:
# extraer algunas características de forma contenidas en una imagen real convertida a binaria
from skimage import measure, data
from skimage.color import rgb2gray
import matplotlib.pyplot as plt

# Create a binary image
image = data.coins()
gris = rgb2gray(image)
binaria = gris > 128
plt.imshow(binaria, cmap='gray')
plt.show()


In [None]:
# rellenar agujeros en la imagen binaria
from scipy import ndimage

binaria_rellena = ndimage.binary_fill_holes(binaria)
plt.imshow(binaria_rellena, cmap='gray')
plt.show()

binaria_rellena[0:20, 0:150] = 0
plt.imshow(binaria_rellena, cmap='gray')
plt.show()

In [None]:
# aplicar calcular medidas de las regiones detectadas
from skimage.measure import label, regionprops, regionprops_table
from skimage import morphology
import pandas as pd

image = binaria_rellena
label_img = label(image)
regions = regionprops(label_img)
print('numero componentes conexas = ', len(regions))

cleaned_image = morphology.remove_small_objects(label_img, min_size=30)
regions = regionprops(cleaned_image)
print('numero objetos = ', len(regions))

# propiedades seleccionadas de los objetos
props = regionprops_table(cleaned_image, properties=('centroid',
                                                 'area',
                                                 'perimeter',
                                                 'eccentricity'))                       
pd.DataFrame(props)

### Comparativa entre imágenes

Se proponen algunos ejemplos de comparativas entre pares de imágenes usando la librería *metrics*. 

In [None]:
from skimage import data
from skimage.metrics import structural_similarity
import matplotlib.pyplot as plt

plt.subplot(1,2,1)
plt.title ('Primera imagen')
img1 = data.camera()
io.imshow(img1)

plt.subplot(1,2,2)
plt.title ('Segunda imagen')
img2 = data.moon()
io.imshow(img2)
io.show()

# Compute SSIM
ssim = structural_similarity(img1, img2, multichannel=True)

print("Structural Similarity Index: ", ssim)

# Detección de estructuras geométricas con OpenCV

A continuación, se codifican algunos métodos de detección de estructuras geométricas, explicados en el Tema 4, usando OpenCV. 

### Transformada de Hough

La transformada de Hough es una técnica para la detección de figuras geométricas en imágenes digitales. Esta técnica, que fue patentada en 1962 por Paul Hough, es mayormente usada en el campo de Visión Artificial. Con la transformada de Hough es posible encontrar todo tipo de figuras geométicas que puedan ser expresadas matemáticamente en coordenadas paramétricas, tales como rectas, circunferencias o elipses. 

In [None]:
# Transformada de Hough para detección de líneas
import numpy as np
import matplotlib.pyplot as plt
import cv2

# se lee y se visualiza la imagen
image = cv2.imread('moviles.jpg')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
plt.imshow(image)

In [None]:
# Convertimos la imagen a niveles de gris
gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
plt.imshow(gray,cmap="gray")

In [None]:
# Se definen los parámetros para la aplicación de Canny (extracción de bordes previa a Hough)
low_threshold = 130
high_threshold = 190
edges = cv2.Canny(gray, low_threshold, high_threshold)
plt.imshow(edges, cmap='gray')

In [None]:
# Se definen los parametros de la transformada de Hough
rho = 1
theta = np.pi/180
threshold = 60
min_line_length = 50
max_line_gap = 5

line_image = np.copy(image) # Se hace una copia de la imagen para dibujar en ella las lineas detectadas por Hough

lines = cv2.HoughLinesP(edges, rho, theta, threshold, np.array([]), min_line_length, max_line_gap) # Aplicación Hough

# Se recorren las lineas detectadas y se dibujan sobre la imagen copia
for line in lines:
    for x1,y1,x2,y2 in line:
        cv2.line(line_image,(x1,y1),(x2,y2),(255,0,0),2)
        
plt.imshow(line_image)

### Transformada de Hough para detección de círculos

Se ilustra cómo aplicar aplicar la transformada de Hough para detectar las circunferencias en una imagen de iris.

In [None]:
import numpy
import cv2
import matplotlib.pyplot as plt

# se carga y visualiza una imagen de un ojo
ojo = cv2.imread("eye_image2.jpg")
print(ojo.shape)
plt.title('Imagen ocular (formato RGB)')
plt.imshow(cv2.cvtColor(ojo, cv2.COLOR_BGR2RGB))

In [None]:
ojo_gris = cv2.cvtColor(ojo, cv2.COLOR_BGR2GRAY) # se convierte a gris
# se binariza adecuadamente la imagen para que los pasos sucesivos funcionen bien
umbral, ojo_bin = cv2.threshold(ojo_gris, 100, 255, cv2.THRESH_BINARY)
plt.title('Imagen ocular (binaria)')
plt.imshow(ojo_bin,cmap="gray",vmin=0,vmax=255)
print(umbral)

In [None]:
# se buscan los contornos para, a partir de ellos, sacar la pupila
ojo_gris_suaviz = cv2.blur(ojo_gris, (3,3))
ojo_bordes = cv2.Canny(ojo_gris_suaviz, 180, 200)
plt.title('contornos')
plt.imshow(ojo_bordes,cmap="gray",vmin=0,vmax=255)

In [None]:
# se aplica la transformada de Hough para círculos
c = cv2.HoughCircles(ojo_bordes, cv2.HOUGH_GRADIENT, 1, 20, param1 = 25,
              param2 = 20, minRadius = 1, maxRadius = 50)

# se muestran sobre la imagen original los dos círculos más relevantes
print(c)
for l in c: 
    for circle in l:
        center = (int(circle[0]), int(circle[1]))
        radius = int(circle[2])
        print(center)
        print(radius)
        cv2.circle(ojo, center, radius, (0, 255, 0), 2)

radius2 = int (radius/3)
cv2.circle(ojo, center, radius2, (0, 255, 0), 2)      

plt.imshow(cv2.cvtColor(ojo, cv2.COLOR_BGR2RGB))
plt.show

cv2.imwrite('ojo_procesado.png', ojo)  

### Ajuste de homografías con RANSAC y emparejamiento de Puntos de interés
RANdom SAmple Consensus (RANSAC) es un método iterativo para calcular los parámetros de un modelo matemático de un conjunto de datos observados que contiene valores atípicos. Un ejemplo de uso de RANSAC es el emparejamiento de puntos de interés extraídos en dos imágenes

In [None]:
import cv2 as cv
from matplotlib import pyplot as plt

MIN_MATCH_COUNT = 4
img2 = cv.imread('meninas_museo2.jpeg',0)          # imagen de query
img1 = cv.imread('meninas_plantilla.jpeg',0) # imagen de train
img1 = cv.resize(img1, (2*img1.shape[1],2*img1.shape[0]))
print(img1.shape)
print(img2.shape)

# Iniciar el detector y descriptor de puntos de interés ORB (Oriented FAST and Rotated BRIEF).
# ORB es básicamente una combinación del detector FAST y el descriptor BRIEF.
# ORB funciona igual de bien que SIFT en la detección (y mejor que SURF), siendo dos órdenes de magnitud más rápido. 
detector = cv.ORB_create()
descriptor = cv.ORB_create()

# Encontrar los puntos de interés y los descriptores
kp1 = detector.detect(img1)
kp1, des1 = descriptor.compute(img1,kp1)
kp2 = detector.detect(img2) 
kp2, des2 = descriptor.compute(img2,kp2)

# Matcher de puntos de interés BFMatcher con distancia L1 para descriptores binarios
matcher = cv.BFMatcher(normType=cv.NORM_L1)
matches = matcher.knnMatch(des1,des2,k=2)

# Guardar todos los "matches buenos"
good = []
for m,n in matches:
    if m.distance < 0.7*n.distance:
        good.append(m)

In [None]:
if len(good)>MIN_MATCH_COUNT:
    src_pts = np.float32([ kp1[m.queryIdx].pt for m in good ]).reshape(-1,1,2)
    dst_pts = np.float32([ kp2[m.trainIdx].pt for m in good ]).reshape(-1,1,2)
    M, mask = cv.findHomography(src_pts, dst_pts, cv.RANSAC, ransacReprojThreshold=10)
    matchesMask = mask.ravel().tolist()
    h,w = img1.shape
    pts = np.float32([ [0,0],[0,h-1],[w-1,h-1],[w-1,0] ]).reshape(-1,1,2)
    dst = cv.perspectiveTransform(pts,M)
    img2 = cv.polylines(img2,[np.int32(dst)],True,255,3, cv.LINE_AA)
else:
    print( "No se han encontrado matches suficientes - {}/{}".format(len(good), MIN_MATCH_COUNT) )
    matchesMask = None

In [None]:
draw_params = dict(matchColor = (0,255,0), # dibujar los matches en color verde
                   singlePointColor = None,
                   matchesMask = matchesMask, # dibujar solo los inliers (dentro de una región)
                   flags = 2)
img3 = cv.drawMatches(img1.copy(),kp1,img2.copy(),kp2,good,None,**draw_params)

plt.figure(figsize=(15,15))
plt.imshow(img3, 'gray'),plt.show()

### Umbralización adaptativa

En la "umbralización global" se establece un único umbral para todos los píxeles de la imagen. En la "umbralización adaptativa" (o variable) se calculan los valores de umbral a nivel de cada píxel en las imágenes. Dichos umbrales locales se calculan  en base a las características de la vecindad de cada píxel evaluado. Ello permitirá segmentar, de manera más precisa, imágenes que contengan fondos con distintos niveles de grises o incluso imágenes con iluminación no uniforme.

In [None]:
import cv2
import numpy as np
from matplotlib import pyplot as plt

img = cv2.imread('sudoku.jpg', 0) # lectura de una imagen en niveles de gris

img = cv2.medianBlur(img,5) # se atenúa el ruido mediante un filtro de mediana

# Se comparan los resultados de tres umbralizados aplicados a la imagen original: uno global,  
# otro adaptativo basado en la media de una vecindad y el último de tipo adaptativo basado en 
# una suma ponderada gaussiano de los píxeles vecinos. 
ret, img_umbrGlobal = cv2.threshold(img,127,255,cv2.THRESH_BINARY)

img_umbrAdaptMedia = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,11,2)

img_umbrAdapGaussiano = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,11,2)

# Se visualiza la imagen original y los tres umbralizados
titles = ['Imagen Original', 'Umbralización Global (v = 127)',
            'Umbr. Adap. (Media)', 'Umbr. Adap. (Gauss)']
images = [img, img_umbrGlobal, img_umbrAdaptMedia, img_umbrAdapGaussiano]
for i in range(4):
    plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])
plt.show()

### Ejercicio: Comparar el umbralizado de Otsu con una umbralzación adaptativa.

Primero probamos el método de Otsu

In [None]:
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt

img = cv.imread('constitucion-de-la-pepa-cadiz-1812_d9a3556a.jpg',0)

ret, bin_img = cv.threshold(img, 127, 255, cv.THRESH_BINARY)
ret, outs_img = cv.threshold(img, 127, 255, cv.THRESH_OTSU)

plt.imshow(img,'gray');
plt.title("Original");
plt.show()
plt.imshow(bin_img,'gray');
plt.title("Gris 127");
plt.show()
plt.imshow(outs_img,'gray');
plt.title("Otsu");
plt.show()

A continuación, probamos dos métodos de umbralización adaptativa: primero usando como umbral el valor medio de la vecindad de píxeles (menos una constante) cv.ADAPTIVE_THRESH_MEAN_C y después se usa como umbral la suma ponderada según una gaussiana de la vecindad de píxeles (menos una constante C) cv.ADAPTIVE_THRESH_GAUSSIAN_C.

In [None]:
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt

img = cv.imread('constitucion-de-la-pepa-cadiz-1812_d9a3556a.jpg',0)
ret,img_thres = cv.threshold(img, 127, 255, cv.THRESH_OTSU)
img_med = cv.adaptiveThreshold(img, 255, cv.ADAPTIVE_THRESH_MEAN_C, cv.THRESH_BINARY, 21, 30)
img_gauss = cv.adaptiveThreshold(img, 255, cv.ADAPTIVE_THRESH_GAUSSIAN_C, cv.THRESH_BINARY, 21, 30)

plt.imshow(img,'gray');
plt.title("Original");
plt.show()
plt.imshow(img_thres,'gray');
plt.title("Outsu");
plt.show()
plt.imshow(img_med,'gray');
plt.title("Adaptativo 21 media");
plt.show()
plt.imshow(img_gauss,'gray');
plt.title("Adaptativo 21 Gausiana");
plt.show()

## Detección de regiones de alto contraste con MSER
MSER (Maximally Stable Extremal Regions) es un detector de regiones estables de tamaño máximo. 
El algoritmo trabajo analizando las variaciones de intensidad en una imagen, e identifica regiones conexas con similares valores de intensidad.

In [None]:
import cv2
import numpy as np
from random import random
from colorsys import hsv_to_rgb
from matplotlib import pyplot as plt

img = cv2.imread('girasoles.jpeg', 0)
output = np.zeros((img.shape[0],img.shape[1],3),dtype=np.uint8)

mser = cv2.MSER_create(delta=10, max_variation=0.15, min_area=100, max_area=15000)
polygons = mser.detectRegions(img)
for polygon in polygons[0]:
    colorRGB = hsv_to_rgb(random(),1,1)
    colorRGB = tuple(int(color*255) for color in colorRGB)
    output = cv2.fillPoly(output,[polygon],colorRGB)

plt.figure(figsize=(15,15))    
plt.subplot(1,2,1)
plt.imshow(img, cmap="gray")
plt.subplot(1,2,2)
plt.imshow(output)