## Identificación de dígitos manuscritos
En esta práctica implementaremos una red neuronal profunda utilizando TensorFlow y Keras para resolver un problema clásico de clasificación: la identificación de dígitos manuscritos del conjunto de datos MNIST.

Este ejercicio te permitirá familiarizarte con la construcción, entrenamiento y evaluación de modelos de aprendizaje profundo aplicados a imágenes.

## Elaborado por: Luis Eduardo Ordoñez

### Importar librerías, cargar y mostrar los datos

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

from google.colab import drive
drive.mount('/content/drive')

# Editar el path en Google Drive
df = pd.read_csv('/content/drive/MyDrive/Corhuila/Visión Computacional/Notebooks/data/train.csv')

In [None]:
print("El conjunto de datos tiene {} filas y {} columnas\n".format(df.shape[0],df.shape[1]))
df.head(10)

### Preparar los datos

In [None]:
# Elimina la columna 'label' del DataFrame para quedarse solo con las características (imágenes)
x = df.drop("label", axis=1)

# Extrae los valores de la columna 'label' como un array de NumPy (las etiquetas de los dígitos)
y = df.label.values

# Convierte el DataFrame 'x' a un array de NumPy
x = x.values

# Normaliza los valores de los píxeles dividiéndolos por 255 (rango de 0 a 1)
x = x / 255.0

### Desplegar la imagen del número ubicado en la fila 0

In [None]:
# Obtiene el número en el índice 0 de los datos de entrada x y lo convierte en una matriz 2D de 28x28
number = x[0].reshape(28,28)

# Crea un gráfico de imagen del número utilizando la paleta de colores binaria (blanco y negro) proporcionada por cmap=plt.cm.binary
plt.imshow(number, cmap=plt.cm.binary)
plt.show()

### Desplegar las primeras 25 imágenes del dataset

In [None]:
plt.figure(figsize=(10,10))

for i in range(25):
    plt.subplot(5,5,i+1)
    # Quita las marcas del eje x e y del subplot actual
    plt.xticks([])
    plt.yticks([])
    # Deshabilita las líneas de la cuadrícula del subplot actual
    plt.grid(False)
    number = x[i].reshape(28,28)
    plt.imshow(number, cmap=plt.cm.binary)
    plt.xlabel(y[i])
plt.show()

### Dividir el conjunto de datos en entrenamiento (70%) y pruebas de validación

In [None]:
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.30, random_state=103)

# Construyendo y entrenando la NN

In [None]:
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.optimizers import SGD

# Crea un modelo secuencial que consta de tres capas densas
model = keras.Sequential([
    keras.layers.Dense(16, activation='sigmoid', input_shape=(784,)),
    keras.layers.Dense(16, activation='sigmoid'),
    keras.layers.Dense(10, activation='softmax')
])

# Crea un optimizador SGD con una tasa de aprendizaje de 0.1
sgd = SGD(learning_rate = 0.1)

# Compila el modelo con el optimizador SGD y la función de pérdida 'sparse_categorical_crossentropy'
model.compile(optimizer = sgd, loss = 'sparse_categorical_crossentropy')

# Entrena el modelo con los datos de entrenamiento x_train e y_train durante 100 épocas con un tamaño de lote de 30
model.fit(x_train, y_train, epochs = 10, batch_size = 30)

## Capas densas
<p style='text-align: justify;'>En Keras, una capa densa ("fully connected") es una capa de red neuronal donde todas las neuronas están conectadas a todas las neuronas de la capa anterior. En otras palabras, cada neurona en la capa densa recibe entradas de todas las neuronas en la capa anterior y luego produce una salida que se transmite a todas las neuronas en la capa siguiente.</p>
<p style='text-align: justify;'>Las capas densas se utilizan comúnmente en redes neuronales profundas para aprender representaciones más complejas de los datos de entrada. La capa densa toma una entrada de un tamaño fijo (por ejemplo, una imagen de 28x28 píxeles en el caso de MNIST) y produce una salida de un tamaño fijo (por ejemplo, un vector de 10 elementos en el caso de MNIST para clasificación de 10 clases). Cada neurona en la capa densa está conectada a todas las entradas de la capa anterior, lo que permite que la capa aprenda patrones complejos en los datos de entrada.</p>
<p style='text-align: justify;'>El caso MNIST es un conjunto de datos de imágenes de dígitos escritos a mano, ampliamente utilizado como una tarea de referencia en el campo de la visión por computadora y el aprendizaje automático. El conjunto de datos consta de 70,000 imágenes de dígitos manuscritos en escala de grises de 28x28 píxeles, divididas en un conjunto de entrenamiento de 42,000 imágenes y un conjunto de prueba de 28,000 imágenes.</p>
<p style='text-align: justify;'>El conjunto de datos MINIST se utiliza comúnmente para entrenar y evaluar algoritmos de clasificación de imágenes, como redes neuronales convolucionales (CNN). El objetivo es tomar una imagen de un dígito manuscrito y predecir a qué número corresponde la imagen.</p>

## Funcion softmax
<p style='text-align: justify;'>Es utilizada como capa final de los clasificadores basados en redes neuronales. Tales redes son comúnmente entrenadas usando un régimen de entropía cruzada, con lo que se obtiene una variante no lineal de la regresión logística multinomial.</p>
<p style='text-align: justify;'>La entropía cruzada ("cross-entropy") es una medida utilizada en aprendizaje automático para medir la diferencia entre dos distribuciones de probabilidad y ajustar los parámetros del modelo para producir mejores predicciones.</p>

## Evaluando el modelo

In [None]:
# Evalúa el modelo usando los datos de prueba (x_test, y_test) y devuelve la pérdida (loss)
test_loss = model.evaluate(x_test, y_test)

# Imprime el resultado de la evaluación en los datos de prueba
print('Test accuracy:', test_loss)

# Probando la NN

In [None]:
# Genera predicciones del modelo usando los datos de prueba (x_test)
predictions = model.predict(x_test)

In [None]:
# Muestra las predicciones del primer ejemplo del conjunto de prueba
# Esto devuelve un array con las probabilidades de que pertenezca a cada clase (del 0 al 9)
print(predictions[0])

In [None]:
# Devuelve la clase con mayor probabilidad
np.argmax(predictions[0])

### Visualización de predicciones del modelo en imágenes de prueba

In [None]:
plt.figure(figsize=(10,10))

# Muestra las primeras 25 imágenes de prueba
for i in range(25):
    # Crea una subfigura de 5x5 en la posición i+1
    plt.subplot(5,5,i+1)
    # Elimina las marcas de los ejes para que la visualización sea más limpia
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    # Reconvierte el vector de imagen a una matriz de 28x28 píxeles
    number = x_test[i].reshape(28,28)
    # Muestra la imagen en escala de grises (binaria)
    plt.imshow(number, cmap=plt.cm.binary)
    # Muestra la etiqueta real y la predicción del modelo como título de la imagen
    plt.xlabel("Real: {} Prediccion: {}".format(y_test[i], np.argmax(predictions[i])))
plt.show()

### Comparación de etiquetas reales vs etiquetas estimadas

In [None]:
# Muestra las primeras 15 etiquetas reales del conjunto de prueba
y_test[:15]

In [None]:
# Convierte las predicciones (probabilidades) en etiquetas predichas, eligiendo la clase con mayor probabilidad
y_hat = np.argmax(predictions, axis=1)

# Muestra las primeras 15 etiquetas estimadas
y_hat[:15]

In [None]:
# Compara cada etiqueta real con la correspondiente predicción
# Devuelve un array booleano: True donde son diferentes (errores), False donde coinciden (aciertos)
y_test[:15] != y_hat[:15]

### Resumen de datos

In [None]:
print("Elementos de prueba: {}".format(y_test.shape[0]))
print("Errores identificados: {}".format((y_test != y_hat).sum()))
porcentaje_error = ((y_test != y_hat).sum() * 100) / y_test.shape[0]
print("Porcentaje de error: {} %".format(porcentaje_error))

### Errores en las predicciones del conjunto de datos de prueba

In [None]:
errores = x_test[y_test != y_hat]
real_labels = y_test[y_test != y_hat]
predicted_labels = y_hat[y_test != y_hat]
print(len(errores))

### Graficar las primeras 10 filas de errores

In [None]:
k=0
for j in range(round(errores.shape[0]/5)):
    plt.figure(figsize=(10,10))
    for i in range(5):
        plt.subplot(1,5,i+1)
        plt.xticks([])
        plt.yticks([])
        plt.grid(False)
        number = errores[5*j+i].reshape(28,28)
        plt.imshow(number, cmap=plt.cm.binary)
        plt.xlabel("Real: {} Prediccion: {}".format(real_labels[5*j+i],predicted_labels[5*j+i]))
    plt.show()
    k += 1
    if k == 5:
        break

# Matriz de confusión
<p style='text-align: justify;'>Es una herramienta útil para evaluar el rendimiento de un modelo de clasificación y determinar su capacidad para clasificar correctamente las instancias en diferentes clases.</p>

In [None]:
from sklearn.metrics import confusion_matrix

# Genera la matriz de confusión comparando las etiquetas reales con las estimadas
print(confusion_matrix(y_test, y_hat))

In [None]:
import seaborn as sns

plt.figure(figsize=(10, 8))

# Dibuja un mapa de calor (heatmap) a partir de la matriz de confusión
# linewidth=0.5: grosor de las líneas entre celdas
# annot=True: muestra los valores dentro de cada celda
# cmap="YlGnBu": define el esquema de colores del gráfico
# fmt='.1f': formato numérico con un decimal
sns.heatmap(confusion_matrix(y_test, y_hat), linewidth=0.5, annot=True, cmap="YlGnBu", fmt='.1f')
plt.ylabel("Etiquetas Reales")
plt.xlabel("Etiquetas Estimadas")
plt.show()

In [None]:
# Crea una copia de la matriz de confusión para modificarla sin afectar la original
mod_confusion_matrix = confusion_matrix(y_test, y_hat).copy()

# Recorre las 10 clases (del 0 al 9)
for i in range(10):
    # Asigna cero a la diagonal (aciertos) para enfocarse solo en los errores de clasificación
    mod_confusion_matrix[i][i] = 0

plt.figure(figsize=(10, 8))
sns.heatmap(mod_confusion_matrix, linewidth=0.5, annot=True, cmap="coolwarm") # viridis, cubehelix, magma
plt.ylabel("Etiquetas Reales")
plt.xlabel("Etiquetas Estimadas")
plt.show()

### Predicciones con el conjunto de datos de prueba

In [None]:
# Editar el path en Google Drive
df_test = pd.read_csv('/content/drive/MyDrive/Corhuila/Visión Computacional/Notebooks/data/test.csv')
print(df_test.shape)
display(df_test.head())

### Visualizar ejemplos estimados

In [None]:
x = df_test
x = x.values
x = x / 255.0

# Genera predicciones del modelo usando los datos de prueba (x_test)
predictions = model.predict(x)

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    img = x[i].reshape(28,28)
    plt.imshow(img, cmap=plt.cm.binary)
    plt.xlabel(f"Pred: {y_hat[i]}")
plt.show()

### Frecuencia de las predicciones realizadas en dataset de pruebas

In [None]:
unique, counts = np.unique(y_hat, return_counts=True)
for digit, count in zip(unique, counts):
    print(f"Dígito {digit}: {count} veces")

In [None]:
sns.barplot(x=unique, y=counts)
plt.title("Distribución de predicciones del modelo")
plt.xlabel("Dígito predicho")
plt.ylabel("Frecuencia")
plt.show()