# 🛠️ Mejora del modelo CNN con Data Augmentation y Regularización Avanzada
Notebook 03.5 – Mejora adicional del modelo CNN
En este notebook aplicamos técnicas adicionales para mejorar el rendimiento del modelo CNN:

- Aumento de datos avanzado (Cutout)
- Arquitectura mejorada con más filtros
- Esquema de optimización cíclico
- Label Smoothing
- Normalización mejorada

---


## 🔁 1. Carga y preprocesamiento de datos
Cargamos el dataset CIFAR-100 y aplicamos normalización avanzada usando la media y desviación estándar del conjunto de entrenamiento.


In [11]:
from tensorflow.keras.datasets import cifar100
from tensorflow.keras.utils import to_categorical
import numpy as np

# Cargar datos
(x_train, y_train), (x_test, y_test) = cifar100.load_data(label_mode='fine')

# Normalizar (método simple pero efectivo)
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0

# One-hot encoding
y_train_cat = to_categorical(y_train, 100)
y_test_cat = to_categorical(y_test, 100)

## 🔍 2. Normalización mejorada
Mejoramos la normalización calculando la media y desviación estándar del conjunto de entrenamiento para cada canal.


In [12]:
# Calcular media y desviación estándar de los datos de entrenamiento
mean = np.mean(x_train, axis=(0, 1, 2))
std = np.std(x_train, axis=(0, 1, 2))

print("Media por canal:", mean)
print("Desviación estándar por canal:", std)

# Función de normalización mejorada
def normalize_image(image):
    return (image - mean) / (std + 1e-7)

# Normalizar datos
x_train_normalized = normalize_image(x_train)
x_test_normalized = normalize_image(x_test)

Media por canal: [0.5070754  0.48655024 0.44091907]
Desviación estándar por canal: [0.26733398 0.25643876 0.2761503 ]


## 🔄 3. Aumento de datos avanzado (Cutout)
Implementamos la técnica de Cutout que elimina aleatoriamente secciones rectangulares de las imágenes durante el entrenamiento.


In [13]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

def simple_cutout(image, size=8):
    """Versión simplificada de cutout para menor carga computacional"""
    h, w = image.shape[0], image.shape[1]
    
    # Centro aleatorio
    cx = np.random.randint(0, w)
    cy = np.random.randint(0, h)
    
    # Coordenadas del recorte
    x1 = max(0, cx - size//2)
    x2 = min(w, cx + size//2)
    y1 = max(0, cy - size//2)
    y2 = min(h, cy + size//2)
    
    # Aplicar máscara
    img_copy = image.copy()
    img_copy[y1:y2, x1:x2, :] = 0.0
    
    return img_copy

# Configurar el generador con menor transformación
datagen = ImageDataGenerator(
    preprocessing_function=simple_cutout,
    rotation_range=15,
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True,
    validation_split=0.2
)

# Usar batch size mayor para acelerar el entrenamiento
batch_size = 128

# Generar los generadores
train_generator = datagen.flow(
    x_train, y_train_cat,
    batch_size=batch_size,
    subset='training'
)

val_generator = datagen.flow(
    x_train, y_train_cat,
    batch_size=batch_size,
    subset='validation'
)

## 🧱 4. Definición del bloque Inception mejorado
Creamos una versión mejorada del bloque Inception con más filtros y BatchNorm después de cada capa convolucional.


### 🏗️ 5. Construcción del modelo mejorado
Construimos el modelo con mayor capacidad, usando bloques Inception mejorados y aumentando el número de filtros.

In [14]:
from tensorflow.keras import layers, models, regularizers
import tensorflow as tf

def efficient_block(x, filters, kernel_size=3, regularization=1e-4):
    """Bloque convolucional eficiente con BatchNorm"""
    # Primera capa convolucional
    x = layers.Conv2D(filters, kernel_size, padding='same', 
                      kernel_regularizer=regularizers.l2(regularization))(x)
    x = layers.BatchNormalization()(x)
    x = layers.LeakyReLU(alpha=0.1)(x)
    
    # Segunda capa convolucional
    x = layers.Conv2D(filters, kernel_size, padding='same',
                      kernel_regularizer=regularizers.l2(regularization))(x)
    x = layers.BatchNormalization()(x)
    x = layers.LeakyReLU(alpha=0.1)(x)
    
    return x

# Construir modelo optimizado
def build_efficient_model(input_shape=(32, 32, 3), num_classes=100):
    inputs = layers.Input(shape=input_shape)
    
    # Bloque 1
    x = efficient_block(inputs, 64)
    x = layers.MaxPooling2D(pool_size=(2, 2))(x)
    x = layers.Dropout(0.2)(x)
    
    # Bloque 2
    x = efficient_block(x, 128)
    x = layers.MaxPooling2D(pool_size=(2, 2))(x)
    x = layers.Dropout(0.3)(x)
    
    # Bloque 3
    x = efficient_block(x, 256)
    x = layers.MaxPooling2D(pool_size=(2, 2))(x)
    x = layers.Dropout(0.4)(x)
    
    # Clasificación
    x = layers.GlobalAveragePooling2D()(x)
    x = layers.Dense(512, kernel_regularizer=regularizers.l2(1e-4))(x)
    x = layers.BatchNormalization()(x)
    x = layers.LeakyReLU(alpha=0.1)(x)
    x = layers.Dropout(0.5)(x)
    outputs = layers.Dense(num_classes, activation='softmax')(x)
    
    model = models.Model(inputs=inputs, outputs=outputs)
    return model

# Crear el modelo
model = build_efficient_model()

# Mostrar resumen del modelo
model.summary()

Model: "model_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_2 (InputLayer)        [(None, 32, 32, 3)]       0         
                                                                 
 conv2d_20 (Conv2D)          (None, 32, 32, 64)        1792      
                                                                 
 batch_normalization_24 (Ba  (None, 32, 32, 64)        256       
 tchNormalization)                                               
                                                                 
 leaky_re_lu_21 (LeakyReLU)  (None, 32, 32, 64)        0         
                                                                 
 conv2d_21 (Conv2D)          (None, 32, 32, 64)        36928     
                                                                 
 batch_normalization_25 (Ba  (None, 32, 32, 64)        256       
 tchNormalization)                                         

## ⚙️ 7. Configuración del optimizador y compilación
Configuramos un optimizador Adam con una tasa de aprendizaje optimizada y compilamos el modelo con Label Smoothing.


In [15]:
# Usamos Adam para convergencia rápida
optimizer = tf.keras.optimizers.Adam(learning_rate=0.001)

# Compilar con label smoothing
model.compile(
    optimizer=optimizer,
    loss=tf.keras.losses.CategoricalCrossentropy(label_smoothing=0.1),
    metrics=['accuracy']
)

## 🛑 9. Configuración de EarlyStopping mejorado
Configuramos el callback de EarlyStopping con mayor paciencia para permitir que el modelo converja completamente.


## 💾 10. Configuración de ModelCheckpoint mejorado
Configuramos el callback de ModelCheckpoint para guardar los mejores modelos durante el entrenamiento.

In [16]:
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint, ReduceLROnPlateau

# Early stopping más agresivo
early_stop = EarlyStopping(
    monitor='val_accuracy',
    patience=10,
    restore_best_weights=True,
    verbose=1
)

# Checkpoint más ligero (solo guarda el mejor modelo)
checkpoint = ModelCheckpoint(
    'checkpoints/cnn_cifar100_efficient_best.h5',
    monitor='val_accuracy',
    save_best_only=True,
    verbose=1
)

# Reducción de tasa de aprendizaje
reduce_lr = ReduceLROnPlateau(
    monitor='val_accuracy',
    factor=0.5,
    patience=5,
    min_lr=1e-6,
    verbose=1
)

## 🧠 11. Entrenamiento del modelo mejorado
Entrenamos el modelo utilizando los generadores de datos aumentados y los callbacks configurados.


In [17]:
# Entrenamos con menos épocas pero suficientes para ver mejoras
history = model.fit(
    train_generator,
    epochs=50,  # Menos épocas
    validation_data=val_generator,
    callbacks=[early_stop, checkpoint, reduce_lr],
    verbose=1
)

Epoch 1/50
Epoch 1: val_accuracy improved from -inf to 0.03890, saving model to checkpoints/cnn_cifar100_efficient_best.h5


  saving_api.save_model(


Epoch 2/50
Epoch 2: val_accuracy improved from 0.03890 to 0.12000, saving model to checkpoints/cnn_cifar100_efficient_best.h5
Epoch 3/50
Epoch 3: val_accuracy improved from 0.12000 to 0.20860, saving model to checkpoints/cnn_cifar100_efficient_best.h5
Epoch 4/50
Epoch 4: val_accuracy improved from 0.20860 to 0.22650, saving model to checkpoints/cnn_cifar100_efficient_best.h5
Epoch 5/50
Epoch 5: val_accuracy improved from 0.22650 to 0.23430, saving model to checkpoints/cnn_cifar100_efficient_best.h5
Epoch 6/50
Epoch 6: val_accuracy improved from 0.23430 to 0.29060, saving model to checkpoints/cnn_cifar100_efficient_best.h5
Epoch 7/50
Epoch 7: val_accuracy did not improve from 0.29060
Epoch 8/50
Epoch 8: val_accuracy improved from 0.29060 to 0.29580, saving model to checkpoints/cnn_cifar100_efficient_best.h5
Epoch 9/50
Epoch 9: val_accuracy improved from 0.29580 to 0.37440, saving model to checkpoints/cnn_cifar100_efficient_best.h5
Epoch 10/50
Epoch 10: val_accuracy did not improve from 

# 📊 12. Evaluación del modelo
Evaluamos el modelo mejorado en el conjunto de test y comparamos los resultados con el modelo anterior.

In [9]:
# Evaluar en el conjunto de test
test_loss, test_accuracy = model.evaluate(x_test, y_test_cat)
print(f"🔍 Test accuracy: {test_accuracy:.4f}")
print(f"📉 Test loss: {test_loss:.4f}")

# 📈 13. Visualización de resultados
Graficamos las métricas de entrenamiento y validación para analizar el comportamiento del modelo.

In [None]:
import matplotlib.pyplot as plt

def plot_history(hist):
    plt.figure(figsize=(14, 5))

    # Accuracy
    plt.subplot(1, 2, 1)
    plt.plot(hist.history['accuracy'], label='Entrenamiento')
    plt.plot(hist.history['val_accuracy'], label='Validación')
    plt.title('Precisión')
    plt.xlabel('Épocas')
    plt.ylabel('Accuracy')
    plt.legend()

    # Loss
    plt.subplot(1, 2, 2)
    plt.plot(hist.history['loss'], label='Entrenamiento')
    plt.plot(hist.history['val_loss'], label='Validación')
    plt.title('Pérdida')
    plt.xlabel('Épocas')
    plt.ylabel('Loss')
    plt.legend()

    plt.tight_layout()
    plt.show()

# Graficar el historial de entrenamiento
plot_history(history)

# 🧠 14. Conclusiones del modelo mejorado
Analizamos las mejoras obtenidas y comparamos con el modelo base y el primer modelo mejorado.