# Actividad: Red Convolucional con Keras (Fashion MNIST)

En esta actividad vas a diseñar **tu propia red neuronal convolucional (CNN)** usando Keras.

## Contexto del problema

Imagina que trabajas para una **tienda online de ropa**. Cada vez que llega una nueva prenda,
el sistema hace una foto en blanco y negro y quiere **clasificar automáticamente** de qué tipo de prenda se trata:
camiseta, pantalón, vestido, abrigo, etc.

Tu misión es:

- Construir una **red convolucional** capaz de reconocer estas prendas a partir de las imágenes.
- Elegir tú mismo:
  - Cuántas capas de convolución usar.
  - Cuántos filtros y de qué tamaño.
  - Qué funciones de activación.
  - Qué optimizador, función de pérdida y métricas.
- Entrenar el modelo y **ponerlo a prueba** con ejemplos reales del conjunto de test.

Usaremos el dataset **Fashion MNIST**, que viene ya incluido en Keras.


## 1. Cargar librerías y comprobar el entorno

En esta celda importamos las librerías que vamos a usar y comprobamos que tenemos
TensorFlow y Keras disponibles.


In [None]:
import sys
import numpy as np
import matplotlib.pyplot as plt

import tensorflow as tf
import keras
from keras import layers
from keras.utils import plot_model

print("Python:", sys.executable)
print("TensorFlow:", tf.__version__)
print("Keras:", keras.__version__)

# Estilo de gráficos (si no existe el estilo, usamos uno básico)
try:
    plt.style.use("seaborn-v0_8")
except OSError:
    plt.style.use("seaborn")

## 2. Cargar el dataset: Fashion MNIST

Vamos a usar el conjunto de datos **Fashion MNIST**, que contiene imágenes
en escala de grises de **28×28 píxeles** de distintas prendas de ropa.

- 60.000 imágenes para entrenamiento.
- 10.000 imágenes para test.
- 10 clases (camiseta, pantalón, jersey, vestido, abrigo, sandalia, camisa, zapatilla, bolso, bota).

Primero cargamos los datos desde Keras.


In [None]:
# Carga del dataset Fashion MNIST
(fashion_x_train, fashion_y_train), (fashion_x_test, fashion_y_test) = keras.datasets.fashion_mnist.load_data()

print("Tamaño de x_train:", fashion_x_train.shape)
print("Tamaño de y_train:", fashion_y_train.shape)
print("Tamaño de x_test:", fashion_x_test.shape)
print("Tamaño de y_test:", fashion_y_test.shape)

# Nombres de las clases (para visualización)
class_names = [
    "Camiseta/Top", "Pantalón", "Jersey", "Vestido",
    "Abrigo", "Sandalia", "Camisa", "Zapatilla",
    "Bolso", "Bota"
]

## 3. Análisis Exploratorio de Datos (EDA)

En esta sección vamos a explorar un poco el dataset antes de crear la red.

### Tareas (hazlas tú en el código de abajo):

1. **Comprobar valores mínimos y máximos** de los píxeles (deberían estar entre 0 y 255).
2. Visualizar la **distribución de clases** en `fashion_y_train` (por ejemplo, con un histograma).
3. Mostrar una cuadrícula (por ejemplo, 3×3) de imágenes de entrenamiento con su etiqueta.

> Puedes usar como referencia el EDA del cuaderno de la red totalmente conectada.


In [None]:
# 3.1: Mostrar valores mínimo y máximo de los píxeles

print("Valor mínimo en fashion_x_train:", np.min(fashion_x_train))
print("Valor máximo en fashion_x_train:", np.max(fashion_x_train))

# 3.2: Distribución de clases en el conjunto de entrenamiento

plt.figure(figsize=(6,4))
plt.hist(fashion_y_train, bins=10, rwidth=0.8)
plt.xticks(range(10), class_names, rotation=45, ha="right")
plt.title("Distribución de clases en el conjunto de entrenamiento")
plt.xlabel("Clase")
plt.ylabel("Frecuencia")
plt.tight_layout()
plt.show()

# 3.3: Mostrar algunas imágenes de ejemplo con su etiqueta

plt.figure(figsize=(9,9))
for i in range(9):
    plt.subplot(3, 3, i + 1)
    plt.imshow(fashion_x_train[i], cmap="gray")
    label = fashion_y_train[i]
    plt.title(f"{class_names[label]} ({label})", fontsize=9)
    plt.axis("off")

plt.tight_layout()
plt.show()

## 4. Preparar los datos para la red convolucional

Las redes convolucionales esperan las imágenes con una **dimensión de canales**.
En este caso, nuestras imágenes son de 28×28 y tienen **1 canal** (escala de grises).

Pasos:

1. **Normalizar** los píxeles a valores entre 0 y 1 dividiendo entre 255.
2. Añadir la dimensión de canales para obtener un tensor de forma `(num_imágenes, 28, 28, 1)`.
3. Crear un pequeño conjunto de **validación** a partir del conjunto de entrenamiento.


In [None]:
# 4.1: Normalización
X_train = fashion_x_train.astype("float32") / 255.0
X_test = fashion_x_test.astype("float32") / 255.0

# 4.2: Añadir dimensión de canales (escala de grises -> 1 canal)
# Forma original: (num_imágenes, 28, 28)
# Nueva forma:    (num_imágenes, 28, 28, 1)
X_train = X_train.reshape(-1, 28, 28, 1)
X_test = X_test.reshape(-1, 28, 28, 1)

print("Nueva forma de X_train:", X_train.shape)
print("Nueva forma de X_test:", X_test.shape)

# 4.3: Crear conjunto de validación (por ejemplo, las primeras 5.000 imágenes)
X_val = X_train[:5000]
y_val = fashion_y_train[:5000]

X_train_small = X_train[5000:]
y_train_small = fashion_y_train[5000:]

print("X_train_small:", X_train_small.shape)
print("X_val:", X_val.shape)

## 5. Diseñar la red convolucional (ACTIVIDAD PRINCIPAL)

Ahora llega la parte importante: **tú vas a definir la red convolucional**.

### Requisitos mínimos de la red

- Usar al menos **2 capas de convolución** (`Conv2D`).
- Usar capas de **submuestreo** (`MaxPooling2D`) para reducir el tamaño de las imágenes intermedias. Fuente: https://keras.io/api/layers/pooling_layers/max_pooling2d/
- Añadir una capa `Flatten` para pasar de mapas de características 2D a un vector 1D.
- Añadir una o dos capas `Dense` finales:
  - Una capa de salida con **10 neuronas** y activación `softmax` (10 clases).

### Pistas

- Recuerda que la forma de entrada es `(28, 28, 1)`.
- Recuerda que la salida debe tener 10 neuronas porque tenemos 10 clases.

En el siguiente bloque de código tienes una plantilla. **Completa tú las capas.**


In [None]:
# 5.1: Definir el modelo CNN
# COMPLETA ESTA PLANTILLA AÑADIENDO LAS CAPAS QUE CONSIDERES

model = keras.Sequential(name="mi_cnn_fashion_mnist")

# TODO: Capa de entrada / primera capa de convolución
# Ejemplo orientativo (NO LO COPIES TAL CUAL SIN ENTENDERLO):
# model.add(layers.Conv2D(filters=32, kernel_size=(3,3), activation="relu", input_shape=(28,28,1)))

# TODO: Añade más capas de convolución y max pooling
# model.add(...)

# TODO: Aplanar y añadir capas densas finales
# model.add(layers.Flatten())
# model.add(layers.Dense(..., activation="relu"))
# model.add(layers.Dense(..., activation="softmax"))  # 10 neuronas para 10 clases

# Al final, mostrar el resumen del modelo
model.summary()

## 6. Compilar el modelo: optimizador, función de pérdida y métricas

Ahora tienes que **compilar** tu modelo eligiendo:

- Un **optimizador** (`"adam"`, `"sgd"`, `"rmsprop"`, etc.).
- Una **función de pérdida** adecuada para clasificación multiclase:
  - Normalmente: `"sparse_categorical_crossentropy"` (etiquetas 0–9 como enteros).
- Las **métricas** que quieres monitorizar (por ejemplo, `["accuracy"]`).

> Recuerda la guía de la unidad 3.2: “Montando una red neuronal”.


In [None]:
# 6.1: Compilar el modelo
# COMPLETA ESTOS PARÁMETROS

optimizer_name = "adam"  # TODO: prueba a cambiarlo
loss_name = "sparse_categorical_crossentropy" 
metrics_list = ["accuracy"]  # TODO: puedes añadir más métricas si quieres

model.compile(
    optimizer=optimizer_name,
    loss=loss_name,
    metrics=metrics_list
)

## 7. Entrenar la red convolucional

Ahora vamos a entrenar tu CNN con los datos de entrenamiento.

Parámetros a elegir:

- `epochs`: cuántas veces recorre todo el conjunto de entrenamiento (por ejemplo, 5, 10, 15…).
- `batch_size`: tamaño del lote (por ejemplo, 32, 64…).

**Actividad:** elige unos valores iniciales, entrena el modelo y luego vuelve a entrenar
con otros valores para comparar resultados.


In [None]:
# 7.1: Entrenamiento del modelo

epochs =        # TODO: experimenta con distintos valores
batch_size =   # TODO: experimenta con distintos valores

history = model.fit(
    X_train_small, y_train_small,
    epochs=epochs,
    batch_size=batch_size,
    validation_data=(X_val, y_val),
    verbose=1
)

## 8. Visualizar la evolución del entrenamiento

Vamos a dibujar:

- La **pérdida** (loss) de entrenamiento y validación por epoch.
- La **accuracy** de entrenamiento y validación por epoch.

Observa si tu modelo:

- Aprende poco (las curvas se quedan altas).
- Sobreajusta (train muy bien, val empeora).


In [None]:
history_dict = history.history
print(history_dict.keys())

plt.figure(figsize=(10,4))

# Pérdida
plt.subplot(1, 2, 1)
plt.plot(history_dict["loss"], label="Train loss")
plt.plot(history_dict["val_loss"], label="Val loss")
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.title("Pérdida durante el entrenamiento")
plt.legend()
plt.grid(True)

# Accuracy (si existe)
if "accuracy" in history_dict:
    plt.subplot(1, 2, 2)
    plt.plot(history_dict["accuracy"], label="Train acc")
    plt.plot(history_dict["val_accuracy"], label="Val acc")
    plt.xlabel("Epoch")
    plt.ylabel("Accuracy")
    plt.title("Accuracy durante el entrenamiento")
    plt.legend()
    plt.grid(True)

plt.tight_layout()
plt.show()

## 9. Evaluar el modelo en el conjunto de test

Ahora vamos a evaluar tu modelo con el conjunto de test, que son datos que el modelo
**no ha visto nunca** (ni para entrenar ni para validar).

Piensa en esto como el **examen final** del modelo.


In [None]:
test_loss, test_acc = model.evaluate(X_test, fashion_y_test, verbose=0)

print(f"Pérdida en test: {test_loss:.4f}")
print(f"Accuracy en test: {test_acc:.4f}")

## 10. Poner a prueba tu red con una imagen concreta

En esta sección podrás elegir **una imagen concreta** del conjunto de test y pedirle
a tu red que haga una predicción.

### Actividad

1. Cambia el valor de `idx` para elegir otra imagen.
2. Mira la imagen, la etiqueta real y la predicción.
3. Prueba varias veces con aciertos y con fallos.


In [None]:
# Función auxiliar para probar una imagen concreta
def probar_imagen(idx):
    if idx < 0 or idx >= len(X_test):
        print(f"Índice fuera de rango. Debe estar entre 0 y {len(X_test)-1}.")
        return
    
    # Preparamos la imagen para el modelo (ya está normalizada y con canal)
    img_modelo = X_test[idx].reshape(1, 28, 28, 1)
    pred_probs = model.predict(img_modelo, verbose=0)
    pred_clase = np.argmax(pred_probs, axis=1)[0]
    true_clase = fashion_y_test[idx]

    print(f"Índice de la imagen: {idx}")
    print(f"Etiqueta real     => {true_clase} ({class_names[true_clase]})")
    print(f"Predicción modelo => {pred_clase} ({class_names[pred_clase]})")

    # Mostramos la imagen original (en escala de grises 28x28)
    plt.figure(figsize=(3,3))
    plt.imshow(fashion_x_test[idx], cmap="gray")
    plt.title(f"Real: {class_names[true_clase]}\nPred: {class_names[pred_clase]}")
    plt.axis("off")
    plt.show()

# Ejemplo: probar una imagen con índice 0 (cámbialo y vuelve a ejecutar)
idx = 0  # TODO: cambia este número para probar otras imágenes
probar_imagen(idx)