# Ejercicio 6: Clasificación de Dígitos Manuscritos (MNIST) con Keras/TensorFlow

**Objetivo:** Construir, entrenar y evaluar una red neuronal simple (MLP) para un problema de clasificación de imágenes.

**Librerías:** `tensorflow`, `keras`, `numpy`, `matplotlib`

In [None]:
# Importar librerías
import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt

# Configuración para mostrar gráficos en el notebook
%matplotlib inline

**1. Carga el dataset MNIST.**

In [None]:
# Tu código aquí
(x_train, y_train), (x_test, y_test) = # ... usar keras.datasets.mnist.load_data()
print("Datos MNIST cargados.")

**2. Inspecciona las dimensiones de los datos.**

In [None]:
# Tu código aquí
print("Forma de x_train:", # ...)
print("Forma de y_train:", # ...)
print("Forma de x_test:", # ...)
print("Forma de y_test:", # ...)

**Opcional: Visualizar algunas imágenes**

In [None]:
# Visualizar las primeras 9 imágenes
plt.figure(figsize=(6,6))
for i in range(9):
    plt.subplot(3,3,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(x_train[i], cmap=plt.cm.binary) # Mostrar en escala de grises
    plt.xlabel(y_train[i]) # Mostrar la etiqueta verdadera
plt.show()

**3. Preprocesa las imágenes:**
* Redimensiona de 28x28 a un vector de 784.
* Normaliza los valores de píxeles a [0, 1] (dividiendo por 255.0).
* Asegúrate de que el tipo de dato sea `float32`.

In [None]:
# Tu código aquí
num_pixels = x_train.shape[1] * x_train.shape[2] # 28*28 = 784

x_train = # ... redimensionar x_train (reshape)
x_test = # ... redimensionar x_test (reshape)

# Convertir a float32 y normalizar
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0

print("Forma de x_train después de preprocesar:", x_train.shape)
print("Forma de x_test después de preprocesar:", x_test.shape)

**4. Preprocesa las etiquetas (y_train, y_test):**
* Conviértelas a formato *one-hot encoding* usando `keras.utils.to_categorical()`.

In [None]:
# Tu código aquí
num_classes = 10
y_train = # ... usar keras.utils.to_categorical()
y_test = # ... usar keras.utils.to_categorical()

print("Forma de y_train después de one-hot encoding:", y_train.shape)
print("Forma de y_test después de one-hot encoding:", y_test.shape)
print("Ejemplo de etiqueta one-hot (y_train[0]):", y_train[0])

**5. Construye el modelo secuencial (`keras.Sequential`):**
* Capa Densa: 128 neuronas, activación 'relu', `input_shape=(784,)`.
* Capa Dropout: 0.2 (opcional).
* Capa Densa de Salida: 10 neuronas (clases), activación 'softmax'.

In [None]:
# Tu código aquí
model = keras.Sequential([
    # ... Añadir capa Dense (entrada/oculta)
    # ... Añadir capa Dropout (opcional)
    # ... Añadir capa Dense (salida)
])

# Muestra un resumen del modelo
model.summary()

**6. Compila el modelo (`compile()`):**
* Optimizador: 'adam'.
* Función de pérdida: 'categorical_crossentropy'.
* Métrica: 'accuracy'.

In [None]:
# Tu código aquí
# ... compilar el modelo

print("Modelo compilado.")

**7. Entrena el modelo (`fit()`):**
* Datos: `x_train`, `y_train`.
* Épocas: 10 (o más/menos según veas necesario).
* Tamaño de batch: 128.
* Datos de validación: `(x_test, y_test)`.

In [None]:
# Definir parámetros de entrenamiento
epochs = 10
batch_size = 128

# Tu código aquí
history = # ... entrenar el modelo con fit()

print("Entrenamiento completado.")

**8. Evalúa el modelo entrenado sobre el conjunto de prueba (`evaluate()`).**

In [None]:
# Tu código aquí
score = # ... evaluar el modelo con evaluate(x_test, y_test)

print(f'Pérdida en el conjunto de prueba: {score[0]:.4f}')
print(f'Precisión en el conjunto de prueba: {score[1]:.4f}')

**9. (Opcional) Realiza algunas predicciones y visualiza.**

In [None]:
# Hacer predicciones sobre el conjunto de test
predictions = model.predict(x_test)

# Función para visualizar una imagen, su etiqueta predicha y la verdadera
def plot_image(i, predictions_array, true_label, img):
  predictions_array, true_label, img = predictions_array[i], np.argmax(true_label[i]), img[i]
  plt.grid(False)
  plt.xticks([])
  plt.yticks([])
  
  img_reshaped = img.reshape(28, 28) # Volver a la forma 28x28 para mostrar
  plt.imshow(img_reshaped, cmap=plt.cm.binary)

  predicted_label = np.argmax(predictions_array)
  if predicted_label == true_label:
    color = 'blue'
  else:
    color = 'red'

  plt.xlabel(f"Pred: {predicted_label} ({100*np.max(predictions_array):2.0f}%) | True: {true_label}", color=color)

# Mostrar algunas imágenes con sus predicciones
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions, y_test, x_test) # Pasamos y_test (one-hot), la función obtiene el índice
plt.tight_layout()
plt.show()