### Instalando las dependencias ...

Durante la clase se estarán utilizando las siguientes bibliotecas:
- `opencv-python` para el procesamiento de imágenes.
- `pandas` para la manipulación y análisis de datos.
- `numpy` para operaciones matemáticas y manejo de matrices.
- `matplotlib` para la visualización de datos y gráficos.
- `scikit-learn` para el aprendizaje automático y las métricas de evaluación del modelo.

Compruebe que tenga las bibliotecas o instálelas.

In [None]:
!pip install scikit-learn opencv-python pandas numpy matplotlib

# Laboratorio #5: Procesamiento de imágenes

Los Sistemas de Recuperación de Información se enfrentan a la compleja tarea de trabajar con una variedad de formatos de datos, cada uno con sus propias particularidades. Cuando se trata de datos visuales, como las imágenes, la tarea se vuelve aún más desafiante debido a la naturaleza visual de la información. En este contexto, la extracción de características se vuelve crucial ya que permite a los sistemas describir y representar cada imagen de manera significativa. Mediante la identificación de patrones, colores, formas y texturas relevantes, los sistemas pueden operar con la información extraída para proporcionar respuestas precisas a las consultas de los usuarios.

La extracción de características en imágenes no solo permite comprender el contenido visual, sino que también facilita la comparación, análisis y clasificación de imágenes, incluso en conjuntos de datos extensos y diversos. Al encontrar similitudes y relaciones entre imágenes, los sistemas de recuperación de información pueden ofrecer resultados relevantes y útiles a los usuarios. En resumen, la extracción (y selección) de características desempeña un papel fundamental en la mejora de la eficiencia y la precisión de los SRI.

El objetivo de la clase práctica es explorar y comparar diversas características extraídas de imágenes con el fin de determinar cuál de ellas es la más efectiva para predecir etiquetas predefinidas.

Como ejercicio motivador cuente con:
> Se tiene un conjunto de imágenes de Pokemon en un SRI y el desarrollador quiere indexar cada imagen según el tipo de cada criatura. A priori se cuenta con el tipo de cada Pokemon presente en los datos. El problema está en que cada año sale un nuevo juego, conocido como edición, de Pokemon y con ello nuevas criaturas, de las cuales solo se tiene su imagen, hasta que la compañía decida sacar la información de los nuevos Pokemon. Luego, el desarrollador quiere poder catalogar las nuevas imágenes de Pokemon que se pongan en el SRI, con el objetivo de indexarlas y tener su sistema actualizado en todo momento.

Para poder resolver el problema anterior es necesario determinar el mejor extractor de características de la imágenes de Pokemon y buscar algún algoritmo que relaciones las características con el tipo de Pokemon. 

**Los estudiantes se centrarán en el extractor y los profesores en el elgoritmo que establece la relación.**

In [None]:
import os
import random
import cv2
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Solución de los profesores
from classifier import classifier

Cargar las imágenes

In [None]:
image_dir = 'dataset/images'
filenames = os.listdir(image_dir)

# Lista para almacenar las imágenes
images = []
# Lista para almacenar los nombres de los Pokemon. La posición coincide con `images`
names = []

for filename in filenames:
    names.append(filename[:-4])
    # Leer la imagen como un array de NumPy
    image = cv2.imread(os.path.join(image_dir, filename))
    
    # Agregar la imagen a la lista
    images.append(image)

Cargar las etiquetas de cada Pokemon. Existen Pokemon que son de 2 tipos a la vez, para el ejercicio solo se considerará el tipo predominante el cual se encuentra en la columna `Type1`.

In [None]:
# Especifica la ruta del archivo CSV
file_path = 'dataset/pokemon.csv'

# Carga el archivo CSV en un DataFrame de pandas
dataframe = pd.read_csv(file_path)

# Muestra las primeras filas del DataFrame para verificar que se haya cargado correctamente
print(dataframe[:10])

# Establece la columna 'Name' como índice al ser todos los valores únicos
dataframe.set_index('Name', inplace=True)

# Obtiene las etiquetas del tipo de cada Pokemon
labels = dataframe['Type1'].tolist()

Mostremos una foto aleatoria del conjunto de los datos, junto al nombre y tipo del Pokemon.

In [None]:
# Mostrar una foto del dataset

# Seleccionar una posición aleatoria correspondiente a una imagen de Pokemon 
pos = random.randint(0, len(images) - 1)

# Mostrar la imagen
plt.imshow(images[pos])

# Desactivar los ejes
plt.axis('off')

# Agregar el nombre y tipo de la imagen como leyenda
plt.text(10, 10, f"{names[pos]}\n({dataframe.loc[names[pos]]['Type1']})", fontsize=14, color='white', backgroundcolor='black', alpha=1)

plt.show()

Comencemos a implementar los extractores de características.

## Escala de grises

La escala de grises de una imagen es una representación en la que cada píxel de la imagen se muestra con un solo valor de intensidad luminosa, en lugar de una combinación de colores. En otras palabras, es una imagen en blanco y negro que contiene tonos de gris que varían desde el negro más oscuro hasta el blanco más claro.

Puede utilizar la función `cv2.cvtColor/2`, la cual recibe la imagen y el flag `cv2.COLOR_BGR2GRAY` para indicar el cambio de la representación.

In [None]:
def grayscale_feature_extractor(image):
    """
    Convert an image to grayscale
    
    Arg:
        -image (numpy.ndarray) : Image.
        
    Return:
        - numpy.ndarray
    
    """
    raise Exception("Not implemented")

Comprobando este extractor para solucionar el problema inicial.

In [None]:
grayscale_knn = classifier('KNN', grayscale_feature_extractor, images, labels)
print('Model: KNN', '\nExtractor: grayscale', f'\nMetrics: {grayscale_knn}')

grayscale_svc = classifier('SVM', grayscale_feature_extractor, images, labels)
print('Model: SVM', '\nExtractor: grayscale', f'\nMetrics: {grayscale_svc}')

------

## HSV (Matiz, Saturación, Valor)

Representa un modelo de color que describe cómo se perciben y se manipulan los colores en las imágenes. A diferencia del modelo RGB (Rojo, Verde, Azul), que se basa en la combinación de diferentes intensidades de luz en tres canales de color, el modelo HSV se centra en cómo los humanos perciben y describen los colores.

Es muy útil porque separa la información del color, la intensidad y la saturación.

Puede utilizar la función `cv2.cvtColor/2`, la cual recibe la imagen y el flag `cv2.COLOR_BGR2HSV` para indicar el cambio de la representación.

In [None]:
def hsv_feature_extractor(image):
    """
    Convert an image to hsv scale
    
    Arg:
        -image (numpy.ndarray) : Image.
        
    Return:
        - numpy.ndarray
        
    """
    raise Exception("Not implemented")

Comprobando este extractor para solucionar el problema inicial.

In [None]:
hsv_knn = classifier('KNN', hsv_feature_extractor, images, labels)
print('Model: KNN', '\nExtractor: hsv', f'\nMetrics: {hsv_knn}')

print('--------------\n')

hsv_svc = classifier('SVM', hsv_feature_extractor, images, labels)
print('Model: SVM', '\nExtractor: hsv', f'\nMetrics: {hsv_svc}')

------

## Histograma

Representación gráfica de la distribución de los valores de intensidad de los píxeles en la imagen, o sea, muestra la frecuencia con la que aparecen diferentes niveles de intensidad en la imagen.

Puede utilizar la función `cv2.calcHist/5`, la cual recibe una imagen y un conjunto de parámetros que pueden poner por defecto los siguientes: `[0], None, [256], [0, 256]`. El orden indica lo siguiente:
- Canal del color de la imagen. Una imagen en escala de grises solo tiene un canal (0), en escala RGB existen 3 canales, uno por cada color.
- Región de la imagen a utilizar. `None` indica toda la imagen.
- La cantidad de contenedores para agrupar los píxeles con intensidad $k$. El número $256$ indica el total de valores distintos que puede tener cada pixel.
- Rango de intensidad que puede tomar cada pixel.

In [None]:
def histogram_feature_extractor(image):
    """
    Get the histogram of an image
    
    Arg:
        -image (numpy.ndarray) : Image.
        
    Return:
        - numpy.ndarray
    
    """
    raise Exception("Not implemented")

Comprobando este extractor para solucionar el problema inicial.

In [None]:
histogram_knn = classifier('KNN', histogram_feature_extractor, images, labels)
print('Model: KNN', '\nExtractor: histogram', f'\nMetrics: {histogram_knn}')

print('--------------\n')

histogram_svc = classifier('SVM', histogram_feature_extractor, images, labels)
print('Model: SVM', '\nExtractor: histogram', f'\nMetrics: {histogram_svc}')

------

## Color promedio

Calcula el promedio del los colores dentro de un bloque de una imagen. Se considera un bloque a una región rectangular o cuadrada dentro de la imagen.

In [None]:
def dominant_color_feature_extractor(image, block_size):
    """
    Calculates the average color per block of an image
    
    Args: 
        - image (numpy.ndarray) : Image.
        - block_size (int) : Size (height and width) of the block.
        
    Return:
        - numpy.ndarray
    
    """
    raise Exception("Not implemented")

Comprobando este extractor para solucionar el problema inicial.

In [None]:
frame_size = 30

dominant_color_knn = classifier(
    'KNN', 
    lambda x: dominant_color_feature_extractor(x, frame_size),
    images, 
    labels
)
print('Model: KNN', '\nExtractor: dominant_color', f'\nMetrics: {dominant_color_knn}')

print('--------------\n')

dominant_color_svc = classifier(
    'SVM', 
    lambda x: dominant_color_feature_extractor(x, frame_size),
    images, 
    labels
)
print('Model: SVM', '\nExtractor: dominant_color', f'\nMetrics: {dominant_color_svc}')

------

Prueba extra. Veamos cómo se comparta si se trabaja con la imagen sin extraer ningún tipo de información. 

In [None]:
without_changes_knn = classifier(
    'KNN', 
    lambda x: x,
    images, 
    labels
)
print('Model: KNN', '\nExtractor: without changes', f'\nMetrics: {without_changes_knn}')

print('--------------\n')

without_changes_svc = classifier(
    'SVM', 
    lambda x: x,
    images, 
    labels
)
print('Model: SVM', '\nExtractor: without changes', f'\nMetrics: {without_changes_svc}')

Los resultados tan malos pueden deberse a una(s) de las siguientes causas: 
- El conjunto de datos no tiene datos suficientes como para que el algoritmo capture las características comunes de los Pokemon de un mismo tipo, afectando a la predicción de un Pokemon desconocido.
- Los extractores de características usados no son los idóneos para capturar la información relevante de cada imagen.
- Los algoritmos utilizados para captar las relaciones entre las imágenes (Pokemon) y el tipo no son los correctos.