<a href="https://colab.research.google.com/github/qb4745/evaluacion_1_deep_learning/blob/main/evaluacion_1_deep_learning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

## 1. Introducción

Este proyecto aborda un problema práctico de clasificación de imágenes utilizando una Red Neuronal Artificial (RNA) de tipo Perceptrón Multicapa (MLP). El objetivo es aplicar los fundamentos de Deep Learning para entrenar un modelo capaz de identificar diferentes tipos de artículos de moda a partir de imágenes en escala de grises.

Para este propósito, utilizaremos el dataset **Fashion-MNIST**. Este conjunto de datos fue desarrollado por Zalando Research y se presenta como un reemplazo directo ("drop-in replacement") del clásico dataset MNIST de dígitos escritos a mano. Mientras que MNIST es un estándar ampliamente utilizado para la validación inicial de algoritmos de Machine Learning, Fashion-MNIST ofrece un desafío potencialmente mayor manteniendo la misma estructura y formato: un conjunto de entrenamiento de 60,000 imágenes y un conjunto de prueba de 10,000 imágenes, todas ellas en escala de grises y de tamaño 28x28 píxeles, distribuidas en 10 clases distintas.

La elección de Fashion-MNIST nos permite trabajar con un dataset estandarizado, bien conocido en la comunidad, pero que requiere que el modelo aprenda características más complejas que las presentes en los dígitos manuscritos. El objetivo final de este encargo es implementar, entrenar, optimizar y evaluar un MLP utilizando TensorFlow/Keras para clasificar correctamente las imágenes de artículos de moda de este dataset, cumpliendo con los indicadores de logro especificados en la evaluación.

*Fuente oficial del dataset: [https://github.com/zalandoresearch/fashion-mnist](https://github.com/zalandoresearch/fashion-mnist)*

## 2. Descripción del Dataset (Contenido)

El dataset Fashion-MNIST se compone de imágenes y sus correspondientes etiquetas de clase. A continuación, se detallan sus características principales:

*   **Dimensiones de la Imagen:** Cada imagen tiene una altura de 28 píxeles y un ancho de 28 píxeles, resultando en un total de 784 píxeles por imagen.
*   **Formato de Píxeles:** Las imágenes están en escala de grises. Cada píxel tiene asociado un único valor numérico entero que indica su nivel de oscuridad. Este valor varía entre 0 (blanco) y 255 (negro). Valores más altos representan píxeles más oscuros.
*   **Estructura de los Datos:** Cada Fila del Dataset representa una imagen:
    *   **Primera Columna:** Corresponde a la etiqueta de clase (un número del 0 al 9) que identifica el tipo de artículo de moda representado en la imagen.
    *   **Columnas Restantes (784):** Contienen los valores de los píxeles (0-255) de la imagen asociada, generalmente desplegados en un formato aplanado (vector de 784 elementos).
*   **Etiquetas de Clase:** Cada ejemplo (imagen) está asignado a una de las siguientes 10 clases, representadas por un número entero:

    *   `0`: T-shirt/top (Camiseta/Top)
    *   `1`: Trouser (Pantalón)
    *   `2`: Pullover (Suéter)
    *   `3`: Dress (Vestido)
    *   `4`: Coat (Abrigo)
    *   `5`: Sandal (Sandalia)
    *   `6`: Shirt (Camisa)
    *   `7`: Sneaker (Zapatilla deportiva)
    *   `8`: Bag (Bolso)
    *   `9`: Ankle boot (Botín)

**En resumen:** Cada fila del dataset representa una imagen de 28x28 píxeles en escala de grises, junto con una etiqueta numérica que indica a cuál de las 10 categorías de ropa pertenece. El objetivo del modelo será aprender a predecir esta etiqueta basándose en los 784 valores de píxeles de entrada.

---



---

## 3. Configuración del Entorno y Selección del Framework

Antes de proceder con la carga y preprocesamiento de los datos, es fundamental definir el entorno de trabajo y las herramientas principales que se utilizarán para la implementación de la Red Neuronal Artificial (MLP).

### 3.1. Elección del Framework: TensorFlow con Keras

Para el desarrollo de este proyecto, hemos seleccionado **TensorFlow (versión X.Y.Z)** como la biblioteca principal de Deep Learning, utilizando específicamente su interfaz de alto nivel **Keras**.

**Justificación de la Decisión:**

La elección de TensorFlow con Keras se basa en las siguientes consideraciones clave, alineadas con los objetivos de la evaluación y los requisitos del proyecto:

1.  **Facilidad de Uso y Desarrollo Rápido (API de Keras):** Keras proporciona una API intuitiva y modular que simplifica significativamente el proceso de definición, entrenamiento y evaluación de redes neuronales, incluyendo los MLP requeridos. Esto nos permite centrarnos en la aplicación de los conceptos fundamentales de Deep Learning (como la arquitectura del modelo, funciones de activación, optimizadores y métricas) en lugar de en detalles de implementación de bajo nivel.
2.  **Cumplimiento de Requisitos:** TensorFlow/Keras ofrece todas las componentes necesarias para abordar los Indicadores de Logro de esta evaluación:
    *   Capas densas para construir el MLP.
    *   Amplia variedad de funciones de activación  y la flexibilidad para definir funciones personalizadas si fuera necesario .
    *   Diversas funciones de pérdida adecuadas para problemas de clasificación.
    *   Múltiples algoritmos de optimización para entrenar y optimizar el modelo.
    *   Herramientas integradas para la evaluación del modelo y el cálculo de métricas.
3.  **Documentación Extensa y Comunidad Activa:** TensorFlow y Keras cuentan con una documentación oficial muy completa, numerosos tutoriales y una vasta comunidad de usuarios. Esto facilita la resolución de dudas y la consulta de ejemplos durante el desarrollo.
4.  **Integración con Ecosistema:** TensorFlow se integra fácilmente con otras herramientas útiles del ecosistema de Data Science en Python, como NumPy, Pandas y Scikit-learn (que utilizaremos para la carga y preprocesamiento de datos), así como con herramientas de visualización como Matplotlib/Seaborn y TensorBoard (para un análisis más profundo del entrenamiento, si se requiere).
5.  **Entorno de Ejecución (Google Colab):** TensorFlow está preinstalado y optimizado para su uso en Google Colab, el entorno recomendado para este proyecto, permitiendo aprovechar fácilmente los recursos de hardware como GPUs o TPUs para acelerar el entrenamiento si fuera necesario.

**En resumen**, la combinación TensorFlow/Keras representa un balance adecuado entre potencia, flexibilidad y facilidad de uso, lo que la convierte en una opción idónea para implementar eficientemente el MLP solicitado y cumplir con los objetivos de esta evaluación dentro del plazo establecido. Las siguientes secciones detallarán cómo se utiliza este framework para la carga, preprocesamiento, modelado y evaluación.

---

## Importación de Librerías

En esta sección, importamos las bibliotecas fundamentales que utilizaremos a lo largo del proyecto: NumPy para operaciones numéricas y Keras (parte de TensorFlow) para construir y entrenar nuestro modelo de red neuronal.

In [None]:
import numpy as np
import keras
from keras import layers

## Preparando los Datos

In [None]:
# Parámetros del modelo / datos
num_classes = 10 # Número de clases de salida (0-9)
input_shape = (28, 28, 1) # Forma de entrada para cada imagen (28x28 píxeles, 1 canal de color gris)

# Cargar los datos y dividirlos en conjuntos de entrenamiento y prueba
# ¡Importante! Usamos fashion_mnist en lugar de mnist
(x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data()

# Escalar las imágenes al rango [0, 1]
# Convertimos los valores de píxeles (originalmente 0-255) a float32 y los normalizamos
x_train = x_train.astype("float32") / 255
x_test = x_test.astype("float32") / 255

# Asegurarse de que las imágenes tengan la forma (alto, ancho, canal)
# Añadimos una dimensión extra para el canal (aunque sea 1 para escala de grises)
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)

# Imprimir información sobre las dimensiones de los datos cargados
print("Forma de x_train:", x_train.shape)
print(x_train.shape[0], "muestras de entrenamiento")
print(x_test.shape[0], "muestras de prueba")

# Convertir los vectores de clase a matrices binarias de clase (one-hot encoding)
# Esto es necesario para usar la función de pérdida 'categorical_crossentropy'
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

print("Forma de y_train (one-hot):", y_train.shape)
print("Ejemplo de y_train[0] (one-hot):", y_train[0])

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
[1m29515/29515[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
[1m26421880/26421880[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
[1m5148/5148[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
[1m4422102/4422102[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Forma de x_train: (60000, 28, 28, 1)
60000 muestras de entrenamiento
10000 muestras de prueba
Forma de y_train (one-hot): (60000, 10)
Ejemplo de y_train[0] (one-hot): [0. 0. 0. 0. 0. 0. 0. 0. 0. 1.]


## 4. Definición del Modelo (Arquitectura CNN)
En esta sección, definimos la arquitectura de nuestra red neuronal utilizando la API Sequential de Keras. Nota: Este modelo es una Red Neuronal Convolucional (CNN), que incluye capas especializadas para procesar datos espaciales como las imágenes.

In [None]:
model = keras.Sequential(
    [
        # Define la capa de entrada con la forma esperada para cada imagen
        keras.Input(shape=input_shape),
        # Primera capa convolucional: extrae 32 patrones usando filtros 3x3. ReLU activa las neuronas.
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        # Capa de Max Pooling: reduce la dimensión espacial (a la mitad) para hacer el modelo más robusto y eficiente.
        layers.MaxPooling2D(pool_size=(2, 2)),
        # Segunda capa convolucional: extrae 64 patrones más complejos de las características anteriores.
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        # Segunda capa de Max Pooling.
        layers.MaxPooling2D(pool_size=(2, 2)),
        # Capa de Aplanamiento: convierte los mapas de características 2D resultantes en un vector 1D.
        layers.Flatten(),
        # Capa Dropout: técnica de regularización. Apaga aleatoriamente el 50% de las neuronas durante el entrenamiento para prevenir el sobreajuste.
        layers.Dropout(0.5),
        # Capa Densa de Salida: capa totalmente conectada con 10 neuronas (una por clase).
        # La activación Softmax convierte las salidas en probabilidades para cada clase.
        layers.Dense(num_classes, activation="softmax"),
    ],
    name="modelo_cnn_fashion_mnist" # Es buena práctica darle un nombre al modelo
)

# Muestra un resumen de la arquitectura del modelo: capas, formas de salida y número de parámetros.
model.summary()

## 5. Compilación del Modelo
Antes de poder entrenar el modelo, necesitamos configurarlo mediante el método compile. Este paso define la función de pérdida que se minimizará, el optimizador que se usará para ajustar los pesos del modelo, y las métricas que queremos monitorizar durante el entrenamiento y la evaluación.

In [None]:
# -------------------------------
# Compilación del modelo
# -------------------------------
# Definir el tamaño del lote y número de épocas
batch_size = 128  # Número de muestras procesadas antes de actualizar los pesos
epochs = 15       # Número de veces que el modelo verá el dataset completo

# Compilar el modelo especificando la función de pérdida, el optimizador y las métricas
model.compile(
    loss="categorical_crossentropy",  # Función de pérdida para clasificación multiclase
    optimizer="adam",                 # Optimizador Adam
    metrics=["accuracy"]             # Métrica a monitorear durante el entrenamiento
)

print("Modelo compilado con éxito.")

Modelo compilado con éxito.


## 6. Entrenamiento del Modelo
Una vez compilado, el modelo está listo para ser entrenado con los datos de entrenamiento (x_train, y_train) utilizando el método fit.


In [None]:
# -------------------------------
# Entrenamiento del modelo
# -------------------------------
# Entrenar el modelo con los datos de entrenamiento
model.fit(
    x_train, y_train,
    batch_size=batch_size,
    epochs=epochs,
    validation_split=0.1  # Usar el 10% del set de entrenamiento para validación
)

Epoch 1/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m41s[0m 95ms/step - accuracy: 0.9154 - loss: 0.2269 - val_accuracy: 0.9188 - val_loss: 0.2243
Epoch 2/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m42s[0m 99ms/step - accuracy: 0.9190 - loss: 0.2176 - val_accuracy: 0.9203 - val_loss: 0.2257
Epoch 3/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m82s[0m 99ms/step - accuracy: 0.9200 - loss: 0.2184 - val_accuracy: 0.9185 - val_loss: 0.2200
Epoch 4/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 96ms/step - accuracy: 0.9236 - loss: 0.2092 - val_accuracy: 0.9175 - val_loss: 0.2222
Epoch 5/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m40s[0m 95ms/step - accuracy: 0.9238 - loss: 0.2074 - val_accuracy: 0.9185 - val_loss: 0.2213
Epoch 6/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m41s[0m 95ms/step - accuracy: 0.9263 - loss: 0.2069 - val_accuracy: 0.9197 - val_loss: 0.2231
Epoch 7/15
[1m4

<keras.src.callbacks.history.History at 0x7899b3d50990>

## 7. Evaluación del Modelo en el Conjunto de Prueba
Una vez que el modelo ha sido entrenado, el siguiente paso crucial es evaluar su rendimiento en el conjunto de prueba (x_test, y_test). Este conjunto contiene datos que el modelo no ha visto durante el proceso de entrenamiento ni durante la fase de validación (si se usó validation_split en fit). Esta evaluación nos proporciona una estimación imparcial de cómo se espera que el modelo generalice a nuevos datos desconocidos.

In [None]:
# Evaluar el modelo entrenado utilizando el conjunto de prueba
print("Evaluando el modelo en el conjunto de prueba...")
score = model.evaluate(x_test,  # Imágenes del conjunto de prueba
                       y_test,  # Etiquetas verdaderas del conjunto de prueba (one-hot)
                       verbose=0) # verbose=0 para modo silencioso (sin barra de progreso)

# Imprimir las métricas resultantes: pérdida y exactitud (accuracy)
# score[0] contiene el valor de la función de pérdida (loss)
# score[1] contiene el valor de la métrica 'accuracy' (definida en compile)
print(f"Pérdida en el conjunto de prueba (Test loss): {score[0]:.4f}")
print(f"Exactitud en el conjunto de prueba (Test accuracy): {score[1]:.4f}")


Evaluando el modelo en el conjunto de prueba...
Pérdida en el conjunto de prueba (Test loss): 0.2407
Exactitud en el conjunto de prueba (Test accuracy): 0.9128


In [None]:
# ===============================
# MLP para Fashion MNIST
# ===============================

import numpy as np
import tensorflow as tf
from tensorflow import keras
from keras import layers

# -------------------------------
# Parámetros globales
# -------------------------------
num_classes = 10         # Número de clases de salida (0-9)
input_shape = (28, 28, 1)  # Forma de entrada para cada imagen
batch_size = 128         # Tamaño de lote
epochs = 15              # Número de épocas de entrenamiento
learning_rate = 0.001    # Tasa de aprendizaje para el optimizador

# -------------------------------
# Carga y preprocesamiento de datos
# -------------------------------
(x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data()

# Escalar imágenes a rango [0,1] y añadir dimensión de canal
x_train = x_train.astype("float32") / 255.0
x_test  = x_test.astype("float32")  / 255.0
x_train = np.expand_dims(x_train, -1)
x_test  = np.expand_dims(x_test, -1)

print(f"x_train shape: {x_train.shape}, {x_train.shape[0]} muestras")
print(f"x_test  shape: {x_test.shape}, {x_test.shape[0]} muestras")

# One-hot encoding de etiquetas
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

# -------------------------------
# Definición del modelo MLP
# -------------------------------
model = keras.Sequential(name="mlp_fashion_mnist")
model.add(layers.Flatten(input_shape=input_shape))  # Aplanar entrada
model.add(layers.Dense(128, activation="relu", name="hidden_layer_1"))
model.add(layers.Dropout(0.5, name="dropout_1"))
model.add(layers.Dense(64, activation="relu", name="hidden_layer_2"))
model.add(layers.Dropout(0.5, name="dropout_2"))
model.add(layers.Dense(num_classes, activation="softmax", name="output_layer"))

model.summary()

# -------------------------------
# Compilación del modelo
# -------------------------------
optimizer = keras.optimizers.Adam(learning_rate=learning_rate)
model.compile(
    loss="categorical_crossentropy",
    optimizer=optimizer,
    metrics=["accuracy"]
)
print("Modelo compilado con éxito.")

# -------------------------------
# Entrenamiento del modelo
# -------------------------------
history = model.fit(
    x_train, y_train,
    batch_size=batch_size,
    epochs=epochs,
    validation_split=0.1,
    verbose=2
)

# -------------------------------
# Evaluación en el conjunto de prueba
# -------------------------------
print("\nEvaluando en conjunto de prueba:")
score = model.evaluate(x_test, y_test, verbose=0)
print(f"Test loss: {score[0]:.4f}")
print(f"Test accuracy: {score[1]:.4f}")


x_train shape: (60000, 28, 28, 1), 60000 muestras
x_test  shape: (10000, 28, 28, 1), 10000 muestras


  super().__init__(**kwargs)


Modelo compilado con éxito.
Epoch 1/15
422/422 - 62s - 147ms/step - accuracy: 0.6739 - loss: 0.9229 - val_accuracy: 0.8172 - val_loss: 0.4948
Epoch 2/15
422/422 - 2s - 5ms/step - accuracy: 0.7898 - loss: 0.6046 - val_accuracy: 0.8352 - val_loss: 0.4538
Epoch 3/15
422/422 - 2s - 5ms/step - accuracy: 0.8088 - loss: 0.5433 - val_accuracy: 0.8507 - val_loss: 0.4133
Epoch 4/15
422/422 - 3s - 6ms/step - accuracy: 0.8237 - loss: 0.5066 - val_accuracy: 0.8553 - val_loss: 0.3996
Epoch 5/15
422/422 - 3s - 8ms/step - accuracy: 0.8312 - loss: 0.4832 - val_accuracy: 0.8553 - val_loss: 0.3947
Epoch 6/15
422/422 - 2s - 5ms/step - accuracy: 0.8351 - loss: 0.4671 - val_accuracy: 0.8652 - val_loss: 0.3749
Epoch 7/15
422/422 - 2s - 6ms/step - accuracy: 0.8414 - loss: 0.4581 - val_accuracy: 0.8648 - val_loss: 0.3676
Epoch 8/15
422/422 - 3s - 6ms/step - accuracy: 0.8449 - loss: 0.4383 - val_accuracy: 0.8657 - val_loss: 0.3635
Epoch 9/15
422/422 - 2s - 5ms/step - accuracy: 0.8471 - loss: 0.4368 - val_accura

## Entre los dos resultados:

| Enfoque | Test Loss | Test Accuracy |
|---------|-----------|---------------|
| **CNN** | 0.2407    | **0.9128**    |
| **MLP** | 0.3717    | 0.8669        |

- **Exactitud (accuracy)**: la CNN alcanza un 91.28 %, frente al 86.69 % del MLP, es decir una ganancia de ≈ 4.6 puntos porcentuales.  
- **Pérdida (loss)**: la CNN obtiene un valor más bajo (0.2407 vs 0.3717), lo que indica que sus predicciones están más cercanas a las distribuciones reales de las clases.

**Conclusión:** la arquitectura **CNN** ofrece mejores métricas en clasificación de Fashion MNIST, gracias a su capacidad de explotar las estructuras espaciales de las imágenes (convoluciones y pooling) antes de llegar a la capa densa final. Si tu objetivo es maximizar precisión en datos de imagen, la CNN es la opción más adecuada.

---

## Mejorando el Modelo

Para superar el ~91 % de accuracy en Fashion MNIST con una CNN básica, puedes probar varias de estas estrategias (idealmente combinándolas):  

1. **Aumentar y diversificar los datos (Data Augmentation)**  
   - Aplica transformaciones aleatorias durante el entrenamiento: rotaciones pequeñas, desplazamientos, zoom, flips horizontales.  
   - Esto ayuda al modelo a generalizar mejor ante variaciones que no están en el set original.  

   ```python
   from tensorflow.keras.preprocessing.image import ImageDataGenerator

   datagen = ImageDataGenerator(
       rotation_range=10,
       width_shift_range=0.1,
       height_shift_range=0.1,
       zoom_range=0.1,
       horizontal_flip=True
   )
   datagen.fit(x_train)
   # Luego, en lugar de model.fit, usas:
   model.fit(datagen.flow(x_train, y_train, batch_size=batch_size),
             epochs=epochs,
             validation_data=(x_test, y_test))
   ```

2. **Batch Normalization**  
   - Inserta `layers.BatchNormalization()` tras cada Convolution + ReLU.  
   - Estabiliza y acelera el entrenamiento, permitiendo tasas de aprendizaje más altas y mejor convergencia.

3. **Arquitectura más profunda o ancha**  
   - Añade una tercera o cuarta capa conv + pooling, aumentando progresivamente los filtros (por ejemplo, 128 filtros en la tercera).  
   - Prueba también colocar una capa densa intermedia antes del softmax (por ejemplo 256 → 128 neuronas).

4. **Regularización extra**  
   - Ajusta el `Dropout` en cada bloque conv (ej. 0.25) y en las densas (ej. 0.5).  
   - Considera añadir L2 weight decay en el optimizador:  
     ```python
     optimizer = keras.optimizers.Adam(learning_rate, decay=1e-4)
     ```

5. **Scheduler de tasa de aprendizaje**  
   - Empieza con LR = 1e-3 y reduce en “plateau” (p.ej. factor 0.5 tras 3 épocas sin mejora).  
   - O usa un ciclo de learning rate (CosineAnnealing, OneCycle).

6. **Early Stopping y Checkpointing**  
   - Monitorea la validación y guarda el mejor modelo para evitar overfitting.  
   - Ejemplo:
     ```python
     callbacks = [
       keras.callbacks.ReduceLROnPlateau(patience=3, factor=0.5),
       keras.callbacks.EarlyStopping(patience=5, restore_best_weights=True)
     ]
     model.fit(..., callbacks=callbacks)
     ```

7. **Ensemble de modelos**  
   - Entrena varias arquitecturas (o con diferentes inicializaciones) y promedia sus predicciones.  
   - Suele dar un pequeño “boost” adicional en accuracy.

8. **Transfer Learning ligero**  
   - Aunque Fashion MNIST es muy diferente de ImageNet, puedes probar usar un bloque convolucional preentrenado (ej. MobileNetV2) y adaptar sus primeras capas, sustituyendo la parte final por densas custom.

–––

**Recomendación de orden de experimentos (controlados):**  

1. Empieza por añadir **BatchNorm** y **ReduceLROnPlateau**.  
2. Incorpora **data augmentation** y observa mejora de val_accuracy.  
3. Prueba una capa conv extra o más filtros.  
4. Ajusta dropout / L2 para equilibrar over/underfitting.  
5. Si aún quieres exprimir más, combina dos o más modelos en **ensemble**.



Data Augmentation para generar ejemplos variados.

Batch Normalization para estabilizar el entrenamiento.

Dropout más estratégico para evitar overfitting.

Capas adicionales para aprender patrones más complejos.

Callbacks: ReduceLROnPlateau y EarlyStopping para entrenar de forma más eficiente.





In [None]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# -------------------------------
# 1. Carga y preprocesamiento de datos
# -------------------------------
num_classes = 10
input_shape = (28, 28, 1)

(x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data()
x_train = x_train.astype("float32") / 255
x_test = x_test.astype("float32") / 255

x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)

y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

# -------------------------------
# 2. Data Augmentation
# -------------------------------
datagen = ImageDataGenerator(
    rotation_range=10,
    width_shift_range=0.1,
    height_shift_range=0.1,
    zoom_range=0.1,
    horizontal_flip=True
)
datagen.fit(x_train)

# -------------------------------
# 3. Modelo CNN mejorado
# -------------------------------
model = keras.Sequential([
    keras.Input(shape=input_shape),

    layers.Conv2D(32, (3, 3), padding='same', activation='relu'),
    layers.BatchNormalization(),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Dropout(0.25),

    layers.Conv2D(64, (3, 3), padding='same', activation='relu'),
    layers.BatchNormalization(),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Dropout(0.25),

    layers.Conv2D(128, (3, 3), padding='same', activation='relu'),
    layers.BatchNormalization(),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Dropout(0.25),

    layers.Flatten(),
    layers.Dense(256, activation='relu'),
    layers.BatchNormalization(),
    layers.Dropout(0.5),
    layers.Dense(num_classes, activation='softmax')
], name="cnn_fashionmnist_improved")

model.summary()

# -------------------------------
# 4. Compilación y entrenamiento con callbacks
# -------------------------------
batch_size = 128
epochs = 50

model.compile(
    optimizer=keras.optimizers.Adam(learning_rate=0.001),
    loss="categorical_crossentropy",
    metrics=["accuracy"]
)

callbacks = [
    keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=3),
    keras.callbacks.EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)
]

history = model.fit(
    datagen.flow(x_train, y_train, batch_size=batch_size),
    epochs=epochs,
    validation_data=(x_test, y_test),
    callbacks=callbacks
)

# -------------------------------
# 5. Evaluación final
# -------------------------------
print("\nEvaluando el modelo en el conjunto de prueba...")
score = model.evaluate(x_test, y_test, verbose=0)
print(f"Pérdida en el conjunto de prueba (Test loss): {score[0]:.4f}")
print(f"Exactitud en el conjunto de prueba (Test accuracy): {score[1]:.4f}")


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
[1m29515/29515[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
[1m26421880/26421880[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
[1m5148/5148[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
[1m4422102/4422102[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step


  self._warn_if_super_not_called()


Epoch 1/50
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m171s[0m 346ms/step - accuracy: 0.6172 - loss: 1.1608 - val_accuracy: 0.6764 - val_loss: 0.8225 - learning_rate: 0.0010
Epoch 2/50
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m206s[0m 356ms/step - accuracy: 0.7757 - loss: 0.5961 - val_accuracy: 0.8412 - val_loss: 0.4320 - learning_rate: 0.0010
Epoch 3/50
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m163s[0m 349ms/step - accuracy: 0.8082 - loss: 0.5148 - val_accuracy: 0.8602 - val_loss: 0.3735 - learning_rate: 0.0010
Epoch 4/50
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m170s[0m 362ms/step - accuracy: 0.8268 - loss: 0.4597 - val_accuracy: 0.8566 - val_loss: 0.3833 - learning_rate: 0.0010
Epoch 5/50
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m164s[0m 350ms/step - accuracy: 0.8353 - loss: 0.4435 - val_accuracy: 0.8248 - val_loss: 0.5251 - learning_rate: 0.0010
Epoch 6/50
[1m469/469[0m [32m━━━━━━━━━━━━━━━━━━