<a href="https://colab.research.google.com/github/LaraV15/TP1-AA2-GarciaValeri/blob/main/TP1_AAII_2C_2024_EJ3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lab 3a: MNIST

El objetivo de este laboratorio es entrenar una red neuronal para clasificar dígitos escritos a mano. Para ello, utilizaremos el conjunto de datos MNIST, que contiene 70,000 imágenes de 28x28 píxeles en escala de grises de dígitos escritos a mano.

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/FCEIA-AAII/lab2/blob/main/lab3a.ipynb)

## Preparación del entorno.

Si no estamos parados en el repo, clonar y cd al repo. Esto nos permite usar el mismo notebook tanto local como en Google Colab.

In [3]:
import os

REPO_NAME = "TP1-AA2-GarciaValeri"
if REPO_NAME not in os.getcwd():
  if not os.path.exists(REPO_NAME):
    !git clone https://github.com/LaraV15/TP1-AA2-GarciaValeri.git
  os.chdir(REPO_NAME)

Importar librerías

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten

Establecer GPU por defecto en caso de estar disponible.

In [None]:
# Configurar para que TensorFlow utilice la GPU por defecto
gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
    try:
        # Configurar para que TensorFlow asigne memoria dinámicamente
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
        # Especificar la GPU por defecto
        logical_gpus = tf.config.experimental.list_logical_devices('GPU')
        print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPUs")
    except RuntimeError as e:
        # Manejar error
        print(e)

## Análisis Exploratorio.

Cargar y visualizar los datos.

In [None]:
# Cargamos MNIST dataset
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# Normalizamos los datos
X_train, X_test = X_train / 255.0, X_test / 255.0

print("Ejemplos de entrenamiento:", X_train.shape)
print("Ejemplos de test:", X_test.shape)

# Mostramos algunos ejemplos al azar:
fig, axs = plt.subplots(1, 5, figsize=(15, 5))
for i in range(5):
    idx = np.random.randint(0, X_train.shape[0])
    axs[i].imshow(X_train[idx], cmap='gray')
    axs[i].set_title(f"Label: {y_train[idx]}")
    axs[i].axis('off')
plt.show()

## Entrenamiento

Definimos nuestro modelo usando tensorflow.

In [None]:
model = Sequential(
    [
        # Flatten convierte la imagen 2D en un vector 1D de 28*28=784 componentes.
        # Esto nos permite usar las imágenes directamente como entrada a la red.
        Flatten(input_shape=(28, 28)),
        ##### COMPLETAR DEFINICIÓN DE LA RED #####
        # Agregar una capa oculta de entre 50 y 200 neuronas con función de activación a elección.
        # Probar con distintas funciones de activación y cantidad de neuronas para obtener el mejor resultado.
        # Agregar la capa de salida con la cantidad de neuronas y función de activación adecuadas.
        ##########################################
    ]
)

Entrenamos el modelo.

In [None]:
model.compile(optimizer="adam",
                loss='sparse_categorical_crossentropy',
                metrics=['accuracy'])

# Train the model
history = model.fit(X_train, y_train, epochs=10, validation_data=(X_test, y_test))

Plot del historial de métricas.

In [None]:
# Plot the training history, accuracy and loss
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label = 'val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.ylim([0, 1])
plt.legend(loc='lower right')

plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='loss')
plt.plot(history.history['val_loss'], label = 'val_loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.ylim([0, 2])
plt.legend(loc='upper right')


Probamos predicciones sobre el conjunto de test.

In [None]:
# Evaluamos el modelo sobre el conjunto de test
Y_pred = model.predict(X_test)

# Mostramos algunos ejemplos al azar:
for i in range(5):
    idx = np.random.randint(0, X_test.shape[0])
    x_test = X_test[idx]
    y_test_label = y_test[idx]
    y_pred = Y_pred[idx]

    # x_test es la imagen en escala de grises.
    # y_test_label es la clase real.
    # y_pred es un vector de probabilidades, mostramos la clase más probable

    ##### COMPLETAR #####
    # Obtener la clase predicha a partir de y_pred
    # Mostrar un plot con la imagen x_test.
    # Mostrar el título con la clase real y la clase predicha.
    # Mostrar la probabilidad de la clase predicha.
    ######################