# Comparación de Modelos ResNet18 V2: Con y Sin BatchNorm/Dropout

Este notebook implementa y compara dos variantes de ResNet18 con arquitectura tipo embudo según los requisitos de la **Versión 2: Clasificador extendido tipo embudo**:

- **V2 SIN BatchNorm y SIN Dropout**: Solo capas Linear + ReLU
- **V2 CON BatchNorm y CON Dropout**: Con BatchNorm antes de ReLU y Dropout entre capas

**Arquitectura tipo embudo**: 512 → 256 → 128 → num_classes

**Objetivos:**
- Evaluar el impacto de BatchNorm y Dropout en el rendimiento
- Comparar estabilidad de entrenamiento y capacidad de generalización
- Analizar curvas de pérdida y métricas de evaluación

In [None]:
# Import Required Libraries
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import models
import matplotlib.pyplot as plt
import numpy as np

from sklearn.metrics import classification_report

# Importar funciones de utilidad
from utils.data_proccess import create_dataloaders,create_transforms,load_datasets
from utils.train_model import train_model, plot_training_metrics
from utils.evaluate_model import evaluate_model
from utils.predict_images import predict_single_image

print("Librerías importadas exitosamente")
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")

In [None]:
# Load and Prepare Data
print("Cargando y preparando datos...")

# Configuración de datos
data_dir = 'datos'  # Ajustar según tu estructura
batch_size = 32
image_size = 224

# Crear transforms usando la función de utilidad
train_transform, val_test_transform = create_transforms(img_size=image_size)

# Cargar datasets
train_dataset, val_dataset, test_dataset = load_datasets(data_dir, train_transform, val_test_transform)

# Crear dataloaders
train_loader, val_loader, test_loader = create_dataloaders(
    train_dataset, val_dataset, test_dataset,
    batch_size=batch_size
)

# Obtener nombres de clases
class_names = train_dataset.classes
num_classes = len(class_names)
print(f"Número de clases: {num_classes}")
print(f"Clases: {class_names}")
print(f"Tamaño del dataset de entrenamiento: {len(train_dataset)}")
print(f"Tamaño del dataset de validación: {len(val_dataset)}")
print(f"Tamaño del dataset de prueba: {len(test_dataset)}")

## Definición de Arquitectura V2 (Sin BatchNorm y Sin Dropout)

**Características del modelo:**
- Arquitectura tipo embudo con 3 capas ocultas: 512 → 256 → 128 → num_classes
- Solo capas Linear con activación ReLU
- **Sin BatchNormalization**
- **Sin Dropout**
- Backbone: ResNet18 preentrenado (features congeladas)
- Transfer Learning: Solo entrenar el clasificador personalizado

In [None]:
class ResNet18V2_Sin(nn.Module):
    """
    ResNet18 V2 SIN BatchNorm y SIN Dropout
    Arquitectura tipo embudo: 512 → 256 → 128 → num_classes
    Solo Linear + ReLU
    """
    def __init__(self, num_classes):
        super(ResNet18V2_Sin, self).__init__()
        
        # Cargar ResNet18 preentrenado
        self.resnet = models.resnet18(weights=models.ResNet18_Weights.DEFAULT)
        
        # Congelar las capas del feature extractor
        for param in self.resnet.parameters():
            param.requires_grad = False
            
        # Obtener el número de features del último layer
        num_features = self.resnet.fc.in_features
        
        # Reemplazar el clasificador con arquitectura tipo embudo
        self.resnet.fc = nn.Sequential(
            nn.Linear(num_features, 512),
            nn.ReLU(inplace=True),
            nn.Linear(512, 256),
            nn.ReLU(inplace=True),
            nn.Linear(256, 128),
            nn.ReLU(inplace=True),
            nn.Linear(128, num_classes)
        )
        
    def forward(self, x):
        return self.resnet(x)

# Crear el modelo
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model_v2_sin = ResNet18V2_Sin(num_classes).to(device)

print("Modelo V2 SIN BatchNorm/Dropout creado:")
print(f"Dispositivo: {device}")
print(f"Arquitectura del clasificador:")
print(model_v2_sin.resnet.fc)

## Definición de Arquitectura V2 (Con BatchNorm y Con Dropout)

**Características del modelo:**
- Misma arquitectura tipo embudo: 512 → 256 → 128 → num_classes
- **BatchNorm1d antes de cada ReLU** en capas ocultas
- **Dropout (rate=0.3)** después de cada ReLU en capas ocultas
- Activación ReLU en todas las capas ocultas
- Backbone: ResNet18 preentrenado (features congeladas)
- **Técnicas de regularización aplicadas** para prevenir overfitting

In [None]:
class ResNet18V2_Con(nn.Module):
    """
    ResNet18 V2 CON BatchNorm y CON Dropout
    Arquitectura tipo embudo: 512 → 256 → 128 → num_classes
    BatchNorm antes de ReLU, Dropout entre capas
    """
    def __init__(self, num_classes, dropout_rate=0.3):
        super(ResNet18V2_Con, self).__init__()
        
        # Cargar ResNet18 preentrenado
        self.resnet = models.resnet18(weights=models.ResNet18_Weights.DEFAULT)
        
        # Congelar las capas del feature extractor
        for param in self.resnet.parameters():
            param.requires_grad = False
            
        # Obtener el número de features del último layer
        num_features = self.resnet.fc.in_features
        
        # Reemplazar el clasificador con arquitectura tipo embudo + BN + Dropout
        self.resnet.fc = nn.Sequential(
            nn.Linear(num_features, 512),
            nn.BatchNorm1d(512),
            nn.ReLU(inplace=True),
            nn.Dropout(dropout_rate),
            
            nn.Linear(512, 256),
            nn.BatchNorm1d(256),
            nn.ReLU(inplace=True),
            nn.Dropout(dropout_rate),
            
            nn.Linear(256, 128),
            nn.BatchNorm1d(128),
            nn.ReLU(inplace=True),
            nn.Dropout(dropout_rate),
            
            nn.Linear(128, num_classes)
        )
        
    def forward(self, x):
        return self.resnet(x)

# Crear el modelo
model_v2_con = ResNet18V2_Con(num_classes, dropout_rate=0.3).to(device)

print("Modelo V2 CON BatchNorm/Dropout creado:")
print(f"Dispositivo: {device}")
print(f"Arquitectura del clasificador:")
print(model_v2_con.resnet.fc)

## Configuración de Entrenamiento

**Parámetros comunes para ambos modelos:**
- **Criterion**: CrossEntropyLoss
- **Optimizer**: Adam (lr=0.001)
- **Early stopping**: patience=5 épocas
- **Épocas máximas**: 50
- **Batch size**: 32

**Métricas a registrar:**
- Pérdidas de entrenamiento y validación
- Accuracy de entrenamiento y validación
- Época de mejor rendimiento (best_epoch)

In [None]:
# Training Setup and Configuration

# Configuración del entrenamiento
learning_rate = 0.001
num_epochs = 50
patience = 5

# Criterion (reutilizado para ambos modelos)
criterion = nn.CrossEntropyLoss()

# Optimizadores para cada modelo
optimizer_v2_sin = optim.Adam(model_v2_sin.parameters(), lr=learning_rate)
optimizer_v2_con = optim.Adam(model_v2_con.parameters(), lr=learning_rate)

# Inicializar listas para tracking de pérdidas
train_losses_v2_sin = []
val_losses_v2_sin = []
train_losses_v2_con = []
val_losses_v2_con = []

print("Configuración de entrenamiento:")
print(f"Learning rate: {learning_rate}")
print(f"Número máximo de épocas: {num_epochs}")
print(f"Early stopping patience: {patience}")
print(f"Criterion: {criterion}")
print(f"Optimizadores creados para ambos modelos")

## Entrenamiento Modelo V2 - Sin Regularización

**Modelo a entrenar:** ResNet18V2_Sin
- Arquitectura: Solo Linear + ReLU
- Sin BatchNorm, Sin Dropout
- Objetivo: Establecer baseline de rendimiento sin regularización

**Hipótesis:** Este modelo puede ser más propenso al overfitting pero podría converger más rápido inicialmente.

In [None]:
print("=" * 60)
print("ENTRENANDO MODELO V2 SIN BatchNorm/Dropout")
print("=" * 60)

# Entrenar el modelo usando la función de utilidad
model_v2_sin, train_losses_v2_sin, val_losses_v2_sin, train_accuracies_v2_sin, val_accuracies_v2_sin, best_epoch_v2_sin = train_model(
    model=model_v2_sin,
    train_loader=train_loader,
    val_loader=val_loader,
    criterion=criterion,
    optimizer=optimizer_v2_sin,
    num_epochs=num_epochs,
    device=device,
    patience=patience
)

print(f"\nEntrenamiento completado!")
print(f"Total de épocas: {len(train_losses_v2_sin)}")
print(f"Mejor época: {best_epoch_v2_sin}")
print(f"Pérdida de entrenamiento final: {train_losses_v2_sin[-1]:.4f}")
print(f"Pérdida de validación final: {val_losses_v2_sin[-1]:.4f}")
print(f"Accuracy de entrenamiento final: {train_accuracies_v2_sin[-1]:.2f}%")
print(f"Accuracy de validación final: {val_accuracies_v2_sin[-1]:.2f}%")

## Entrenamiento Modelo V2 - Con Regularización

**Modelo a entrenar:** ResNet18V2_Con
- Arquitectura: Linear + BatchNorm + ReLU + Dropout
- Con BatchNorm y Dropout (rate=0.3)
- Objetivo: Evaluar beneficios de las técnicas de regularización

**Hipótesis:** Este modelo debería tener mejor generalización y menor overfitting, posiblemente a costa de convergencia más lenta.

In [None]:
# Train Model V2 With BatchNorm/Dropout
print("=" * 60)
print("ENTRENANDO MODELO V2 CON BatchNorm/Dropout")  # Corregido el título
print("=" * 60)

# Entrenar el modelo usando la función de utilidad
model_v2_con, train_losses_v2_con, val_losses_v2_con, train_accuracies_v2_con, val_accuracies_v2_con, best_epoch_v2_con = train_model(
    model=model_v2_con,  # Corregido: usar model_v2_con
    train_loader=train_loader,
    val_loader=val_loader,
    criterion=criterion,
    optimizer=optimizer_v2_con,  # Corregido: usar optimizer_v2_con
    num_epochs=num_epochs,
    device=device,
    patience=patience
)

print(f"\nEntrenamiento completado!")
print(f"Total de épocas: {len(train_losses_v2_con)}")  # Corregido: usar variables _con
print(f"Mejor época: {best_epoch_v2_con}")
print(f"Pérdida de entrenamiento final: {train_losses_v2_con[-1]:.4f}")
print(f"Pérdida de validación final: {val_losses_v2_con[-1]:.4f}")
print(f"Accuracy de entrenamiento final: {train_accuracies_v2_con[-1]:.2f}%")
print(f"Accuracy de validación final: {val_accuracies_v2_con[-1]:.2f}%")

## Evaluación Modelo V2 - Sin BatchNorm/Dropout

**Evaluación en conjunto de prueba:**
- **Dataset**: Test set (datos no vistos durante entrenamiento)
- **Métricas**: Accuracy, Precision, Recall por clase
- **Visualizaciones**: Matriz de confusión con heatmap
- **Análisis**: Classification report detallado

**Objetivo:** Medir el rendimiento real del modelo sin regularización.

In [None]:
# Evaluate Model V2 Without BatchNorm/Dropout
print("=" * 60)
print("EVALUACIÓN MODELO V2 SIN BatchNorm/Dropout")
print("=" * 60)

# Evaluar el modelo usando las funciones de utilidad (corregido: agregar class_names)
accuracy_sin, y_true_sin, y_pred_sin = evaluate_model(
    model=model_v2_sin,  
    test_loader=test_loader,
    class_names=class_names,  # Agregar class_names como parámetro
    device=device
)

print(f"\nAccuracy V2 Sin BatchNorm/Dropout: {accuracy_sin:.4f}")

## Evaluación Modelo V2 - Con BatchNorm/Dropout

**Evaluación en conjunto de prueba:**
- **Dataset**: Test set (datos no vistos durante entrenamiento)
- **Métricas**: Accuracy, Precision, Recall por clase
- **Visualizaciones**: Matriz de confusión con heatmap
- **Análisis**: Classification report detallado

**Objetivo:** Medir el rendimiento real del modelo con regularización y comparar con el modelo base.

In [None]:
# Evaluate Model V2 With BatchNorm/Dropout
print("=" * 60)
print("EVALUACIÓN MODELO V2 CON BatchNorm/Dropout")
print("=" * 60)

# Evaluar el modelo usando las funciones de utilidad (corregido: agregar class_names)
accuracy_con, y_true_con, y_pred_con = evaluate_model(
    model=model_v2_con,
    test_loader=test_loader,
    class_names=class_names,  # Agregar class_names como parámetro
    device=device
)

print(f"\nAccuracy V2 Con BatchNorm/Dropout: {accuracy_con:.4f}")

## Comparación de Curvas de Entrenamiento

**Análisis de curvas de pérdida y accuracy:**

**Para cada modelo se visualiza:**
- Curva de pérdida de entrenamiento vs validación
- Curva de accuracy de entrenamiento vs validación
- Marcador de la mejor época (best_epoch)
- Indicadores de overfitting o underfitting

**Métricas clave a comparar:**
- Velocidad de convergencia
- Estabilidad durante el entrenamiento
- Gap entre train/validation (indicador de overfitting)
- Valor final de las métricas

In [None]:
# Visualizar curvas de entrenamiento V2 Sin BatchNorm/Dropout
print("\nVisualizando métricas V2 SIN BatchNorm/Dropout:")
plot_training_metrics(
    train_losses_v2_sin, 
    val_losses_v2_sin, 
    train_accuracies_v2_sin, 
    val_accuracies_v2_sin, 
    best_epoch_v2_sin
)

In [None]:
# Visualizar curvas de entrenamiento V2 Con BatchNorm/Dropout
print("\nVisualizando métricas V2 CON BatchNorm/Dropout:")
plot_training_metrics(
    train_losses_v2_con, 
    val_losses_v2_con, 
    train_accuracies_v2_con, 
    val_accuracies_v2_con, 
    best_epoch_v2_con
)

In [None]:
# Resumen de Resultados - Versión 2: Clasificador Tipo Embudo
print("=" * 70)
print("RESUMEN DE RESULTADOS - VERSIÓN 2")
print("=" * 70)

print("\nEXPERIMENTO REALIZADO:")
print("-" * 50)
print("• Arquitectura: ResNet18 + Clasificador tipo embudo")
print("• Estructura: 512 → 256 → 128 → num_classes")
print("• Transfer Learning: Features congeladas")
print("• Dos variantes entrenadas con mismos parámetros")

print("\nCONFIGURACIÓN DE ENTRENAMIENTO:")
print("-" * 50)
print(f"• Optimizador: Adam (lr={learning_rate})")
print(f"• Early stopping: {patience} épocas")
print(f"• Batch size: {batch_size}")
print(f"• Dataset: {num_classes} clases, {len(train_dataset)} muestras entrenamiento")

print("\nRESULTADOS OBTENIDOS:")
print("-" * 50)

print("MODELO SIN BatchNorm/Dropout:")
print(f"   • Test Accuracy: {accuracy_sin:.4f} ({accuracy_sin*100:.1f}%)")
print(f"   • Mejor época: {best_epoch_v2_sin}")
print(f"   • Total épocas: {len(train_losses_v2_sin)}")
print(f"   • Loss final train: {train_losses_v2_sin[-1]:.4f}")
print(f"   • Loss final val: {val_losses_v2_sin[-1]:.4f}")
print(f"   • Accuracy final train: {train_accuracies_v2_sin[-1]:.1f}%")
print(f"   • Accuracy final val: {val_accuracies_v2_sin[-1]:.1f}%")

print("\nMODELO CON BatchNorm/Dropout:")
print(f"   • Test Accuracy: {accuracy_con:.4f} ({accuracy_con*100:.1f}%)")
print(f"   • Mejor época: {best_epoch_v2_con}")
print(f"   • Total épocas: {len(train_losses_v2_con)}")
print(f"   • Loss final train: {train_losses_v2_con[-1]:.4f}")
print(f"   • Loss final val: {val_losses_v2_con[-1]:.4f}")
print(f"   • Accuracy final train: {train_accuracies_v2_con[-1]:.1f}%")
print(f"   • Accuracy final val: {val_accuracies_v2_con[-1]:.1f}%")

print("\nANÁLISIS DE COMPORTAMIENTO:")
print("-" * 50)

# Gap entre train y validation
gap_sin = train_accuracies_v2_sin[-1] - val_accuracies_v2_sin[-1]
gap_con = train_accuracies_v2_con[-1] - val_accuracies_v2_con[-1]

print(f"• Gap Train-Validation Sin BN/Dropout: {gap_sin:.1f}%")
print(f"• Gap Train-Validation Con BN/Dropout: {gap_con:.1f}%")

# Diferencia de accuracy
diff_accuracy = accuracy_con - accuracy_sin
if diff_accuracy > 0:
    print(f"• Modelo con regularización fue {diff_accuracy:.3f} puntos mejor")
else:
    print(f"• Modelo sin regularización fue {abs(diff_accuracy):.3f} puntos mejor")

# Convergencia
diff_epochs = best_epoch_v2_con - best_epoch_v2_sin
if diff_epochs < 0:
    print(f"• Modelo con regularización convergió {abs(diff_epochs)} épocas más rápido")
else:
    print(f"• Modelo sin regularización convergió {diff_epochs} épocas más rápido")

print("\nMÉTRICAS GENERADAS:")
print("-" * 50)
print("• Matrices de confusión para ambos modelos")
print("• Classification reports (Precision, Recall, F1)")
print("• Curvas de pérdida durante entrenamiento")
print("• Curvas de accuracy durante entrenamiento")
print("• Evaluación en conjunto de prueba independiente")

print("\nOBSERVACIONES:")
print("-" * 50)

# Determinar si hubo early stopping
if len(train_losses_v2_sin) < num_epochs:
    print(f"• Modelo sin regularización: Early stopping en época {len(train_losses_v2_sin)}")
else:
    print("• Modelo sin regularización: Entrenó todas las épocas")

if len(train_losses_v2_con) < num_epochs:
    print(f"• Modelo con regularización: Early stopping en época {len(train_losses_v2_con)}")
else:
    print("• Modelo con regularización: Entrenó todas las épocas")

# Análisis de overfitting
if abs(gap_con) < abs(gap_sin):
    print("• Regularización redujo el overfitting")
else:
    print("• Regularización no redujo el overfitting significativamente")

print("\nCUMPLIMIENTO DE OBJETIVOS:")
print("-" * 50)
print("Arquitectura tipo embudo implementada correctamente")
print("Dos entrenamientos realizados (con y sin regularización)")
print("Early stopping aplicado exitosamente")
print("Métricas completas de evaluación obtenidas")
print("Comparación de técnicas de regularización completada")

print("\n" + "=" * 70)
print("RESUMEN COMPLETADO")
print("=" * 70)