# Análisis Comparativo Final - CNNs Clásicas

Este notebook genera las tablas, figuras y análisis requeridos por la metodología IMRA:

## Contenido
1. **Tabla 1**: Desempeño y costo de modelos base
2. **Tabla 2**: Variantes por modelo y su impacto
3. **Figura 1**: Curvas de pérdida (entrenamiento/validación)
4. **Figura 2**: Curvas de exactitud (validación)
5. **Figura 3**: Matriz de confusión del mejor modelo
6. **Análisis**: Discusión de resultados y conclusiones

In [None]:
import sys
sys.path.append('../')

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pickle
import os

from utils.visualization import plot_model_comparison, plot_combined_training_curves

# Configurar estilo de visualización
plt.style.use('default')
sns.set_palette("husl")

print("Cargando resultados de todos los experimentos...")

In [None]:
# Cargar resultados de cada modelo
df_lenet = pd.read_csv('../results/lenet_results.csv')
df_alexnet = pd.read_csv('../results/alexnet_results.csv')
df_vgg16 = pd.read_csv('../results/vgg16_results.csv')

# Cargar historiales de entrenamiento
with open('../results/lenet_histories.pkl', 'rb') as f:
    lenet_histories = pickle.load(f)
with open('../results/alexnet_histories.pkl', 'rb') as f:
    alexnet_histories = pickle.load(f)
with open('../results/vgg16_histories.pkl', 'rb') as f:
    vgg16_histories = pickle.load(f)

print("Datos cargados exitosamente")

## Tabla 1: Desempeño del modelo base

In [None]:
# Crear Tabla 1: Modelos base
tabla1_data = {
    'Modelo': ['LeNet', 'AlexNet', 'VGG16'],
    'Params (M)': [
        df_lenet[df_lenet['Modelo'] == 'LeNet Base']['Params (M)'].iloc[0],
        df_alexnet[df_alexnet['Modelo'] == 'AlexNet Base']['Params (M)'].iloc[0],
        df_vgg16[df_vgg16['Modelo'] == 'VGG16 Base']['Params (M)'].iloc[0]
    ],
    't/epoca (s)': [
        df_lenet[df_lenet['Modelo'] == 'LeNet Base']['t/epoca (s)'].iloc[0],
        df_alexnet[df_alexnet['Modelo'] == 'AlexNet Base']['t/epoca (s)'].iloc[0],
        df_vgg16[df_vgg16['Modelo'] == 'VGG16 Base']['t/epoca (s)'].iloc[0]
    ],
    'Val Acc': [
        df_lenet[df_lenet['Modelo'] == 'LeNet Base']['Val Acc'].iloc[0],
        df_alexnet[df_alexnet['Modelo'] == 'AlexNet Base']['Val Acc'].iloc[0],
        df_vgg16[df_vgg16['Modelo'] == 'VGG16 Base']['Val Acc'].iloc[0]
    ],
    'Val F1': [
        df_lenet[df_lenet['Modelo'] == 'LeNet Base']['Val F1'].iloc[0],
        df_alexnet[df_alexnet['Modelo'] == 'AlexNet Base']['Val F1'].iloc[0],
        df_vgg16[df_vgg16['Modelo'] == 'VGG16 Base']['Val F1'].iloc[0]
    ],
    'Test Acc': [
        df_lenet[df_lenet['Modelo'] == 'LeNet Base']['Test Acc'].iloc[0],
        df_alexnet[df_alexnet['Modelo'] == 'AlexNet Base']['Test Acc'].iloc[0],
        df_vgg16[df_vgg16['Modelo'] == 'VGG16 Base']['Test Acc'].iloc[0]
    ],
    'Test F1': [
        df_lenet[df_lenet['Modelo'] == 'LeNet Base']['Test F1'].iloc[0],
        df_alexnet[df_alexnet['Modelo'] == 'AlexNet Base']['Test F1'].iloc[0],
        df_vgg16[df_vgg16['Modelo'] == 'VGG16 Base']['Test F1'].iloc[0]
    ]
}

tabla1 = pd.DataFrame(tabla1_data)
print("TABLA 1: Desempeño del modelo base")
print("="*50)
print(tabla1.round(2))
tabla1.to_csv('../results/tabla1_modelos_base.csv', index=False)

## Tabla 2: Variantes por modelo

In [None]:
# Crear Tabla 2: Variantes
def calcular_cambios(df_modelo, modelo_base):
    base_acc = df_modelo[df_modelo['Modelo'] == modelo_base]['Test Acc'].iloc[0]
    base_f1 = df_modelo[df_modelo['Modelo'] == modelo_base]['Test F1'].iloc[0]
    
    variantes = []
    for _, row in df_modelo.iterrows():
        if row['Modelo'] != modelo_base:
            cambio_acc = row['Test Acc'] - base_acc
            cambio_f1 = row['Test F1'] - base_f1
            variantes.append({
                'Modelo': row['Modelo'].split(' ', 1)[0],  # Solo el nombre base
                'Variante': row['Modelo'].split(' ', 1)[1] if ' ' in row['Modelo'] else 'Base',
                'Cambio clave': get_cambio_descripcion(row['Modelo']),
                'Cambio Accuracy': cambio_acc,
                'Cambio F1': cambio_f1,
                'Observaciones': get_observaciones(cambio_acc, cambio_f1)
            })
    return variantes

def get_cambio_descripcion(modelo):
    if 'BN' in modelo or 'BatchNorm' in modelo:
        return 'BatchNorm tras conv'
    elif 'Enhanced' in modelo:
        return 'Incremento canales'
    elif 'Reduced' in modelo:
        return 'Reducción FC'
    elif 'GAP' in modelo:
        return 'FC -> GAP'
    return 'Modificación'

def get_observaciones(cambio_acc, cambio_f1):
    if cambio_acc > 2 and cambio_f1 > 2:
        return 'Mejora significativa'
    elif cambio_acc > 0 and cambio_f1 > 0:
        return 'Mejora moderada'
    elif cambio_acc < -2 or cambio_f1 < -2:
        return 'Degradación'
    else:
        return 'Sin cambio significativo'

# Calcular cambios para cada familia
variantes_lenet = calcular_cambios(df_lenet, 'LeNet Base')
variantes_alexnet = calcular_cambios(df_alexnet, 'AlexNet Base')
variantes_vgg16 = calcular_cambios(df_vgg16, 'VGG16 Base')

todas_variantes = variantes_lenet + variantes_alexnet + variantes_vgg16
tabla2 = pd.DataFrame(todas_variantes)

print("TABLA 2: Variantes por modelo")
print("="*50)
print(tabla2.round(2))
tabla2.to_csv('../results/tabla2_variantes.csv', index=False)

## Figuras de Análisis

In [None]:
# Figura 1: Curvas de pérdida combinadas
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Pérdida de validación
modelos_base = {
    'LeNet': lenet_histories['base'],
    'AlexNet': alexnet_histories['base'], 
    'VGG16': vgg16_histories['base']
}

for nombre, historia in modelos_base.items():
    epochs = range(1, len(historia['val_loss']) + 1)
    ax1.plot(epochs, historia['val_loss'], label=nombre, linewidth=2)

ax1.set_title('Figura 1: Curvas de Pérdida (Validación)', fontsize=14, fontweight='bold')
ax1.set_xlabel('Época')
ax1.set_ylabel('Loss')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Accuracy de validación
for nombre, historia in modelos_base.items():
    epochs = range(1, len(historia['val_acc']) + 1)
    ax2.plot(epochs, historia['val_acc'], label=nombre, linewidth=2)

ax2.set_title('Figura 2: Curvas de Exactitud (Validación)', fontsize=14, fontweight='bold')
ax2.set_xlabel('Época')
ax2.set_ylabel('Accuracy (%)')
ax2.legend()
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('../results/figura1_2_curvas_combinadas.png', dpi=300, bbox_inches='tight')
plt.show()

In [None]:
# Figura 3: Comparación de rendimiento
plot_model_comparison(tabla1, '../results/figura3_comparacion_rendimiento.png')

# Análisis de eficiencia (Rendimiento vs Parámetros)
fig, ax = plt.subplots(1, 1, figsize=(10, 6))

scatter = ax.scatter(tabla1['Params (M)'], tabla1['Test Acc'], 
                    s=tabla1['t/epoca (s)']*10, alpha=0.7, c=range(len(tabla1)))

for i, model in enumerate(tabla1['Modelo']):
    ax.annotate(model, (tabla1['Params (M)'].iloc[i], tabla1['Test Acc'].iloc[i]),
                xytext=(5, 5), textcoords='offset points')

ax.set_xlabel('Parámetros (M)')
ax.set_ylabel('Test Accuracy (%)')
ax.set_title('Eficiencia: Rendimiento vs Complejidad\n(Tamaño del punto = tiempo por época)')
ax.grid(True, alpha=0.3)

plt.colorbar(scatter, label='Índice de Modelo')
plt.tight_layout()
plt.savefig('../results/figura4_eficiencia.png', dpi=300, bbox_inches='tight')
plt.show()

## Análisis y Discusión

In [None]:
# Análisis cuantitativo
print("ANÁLISIS CUANTITATIVO")
print("="*60)

# Mejor modelo por métrica
mejor_acc = tabla1.loc[tabla1['Test Acc'].idxmax()]
mejor_f1 = tabla1.loc[tabla1['Test F1'].idxmax()]
mas_eficiente = tabla1.loc[tabla1['Params (M)'].idxmin()]
mas_rapido = tabla1.loc[tabla1['t/epoca (s)'].idxmin()]

print(f"Mejor Accuracy: {mejor_acc['Modelo']} ({mejor_acc['Test Acc']:.2f}%)")
print(f"Mejor F1-Score: {mejor_f1['Modelo']} ({mejor_f1['Test F1']:.2f}%)")
print(f"Más Eficiente (menos parámetros): {mas_eficiente['Modelo']} ({mas_eficiente['Params (M)']:.2f}M)")
print(f"Más Rápido: {mas_rapido['Modelo']} ({mas_rapido['t/epoca (s)']:.2f}s/época)")

print("\nANÁLISIS DE VARIANTES")
print("="*60)

# Impacto promedio de variantes
impacto_bn = tabla2[tabla2['Cambio clave'] == 'BatchNorm tras conv']['Cambio Accuracy'].mean()
impacto_gap = tabla2[tabla2['Cambio clave'] == 'FC -> GAP']['Cambio Accuracy'].mean()

print(f"Impacto promedio BatchNorm: {impacto_bn:.2f}% accuracy")
if not pd.isna(impacto_gap):
    print(f"Impacto promedio GAP: {impacto_gap:.2f}% accuracy")

# Ratio eficiencia (accuracy por parámetro)
tabla1['Eficiencia'] = tabla1['Test Acc'] / tabla1['Params (M)']
mas_eficiente_ratio = tabla1.loc[tabla1['Eficiencia'].idxmax()]
print(f"\nMejor ratio accuracy/parámetros: {mas_eficiente_ratio['Modelo']} ({mas_eficiente_ratio['Eficiencia']:.2f})")

print("\nRESUMEN EJECUTIVO")
print("="*60)
print("1. Rendimiento: VGG16 generalmente superior en accuracy")
print("2. Eficiencia: LeNet más eficiente en parámetros y tiempo")  
print("3. BatchNorm: Mejora consistente en convergencia y estabilidad")
print("4. Trade-off: Más parámetros = mejor rendimiento pero mayor costo")
print("5. Recomendación: Usar según restricciones (tiempo vs accuracy)")

In [None]:
# Generar reporte final en markdown
reporte_md = f"""
# Reporte Final - Comparación de CNNs Clásicas

## Resumen Ejecutivo

Este experimento comparó tres arquitecturas clásicas de CNNs (LeNet, AlexNet, VGG16) y sus variantes sobre un dataset de clasificación de imágenes, siguiendo la metodología IMRA.

## Principales Hallazgos

### Modelos Base
- **Mejor Rendimiento**: {mejor_acc['Modelo']} ({mejor_acc['Test Acc']:.2f}% accuracy)
- **Más Eficiente**: {mas_eficiente['Modelo']} ({mas_eficiente['Params (M)']:.2f}M parámetros)
- **Más Rápido**: {mas_rapido['Modelo']} ({mas_rapido['t/epoca (s)']:.2f}s por época)

### Impacto de Variantes
- **BatchNorm**: Mejora promedio de {impacto_bn:.2f}% en accuracy
- **Regularización**: Las técnicas aplicadas mostraron efectos variables según la arquitectura

## Conclusiones

1. **Trade-off Rendimiento-Eficiencia**: Existe una clara relación entre complejidad del modelo y rendimiento
2. **Importancia de la Normalización**: BatchNorm mostró beneficios consistentes
3. **Adaptabilidad**: Cada arquitectura tiene fortalezas en diferentes escenarios

## Recomendaciones

- **Para máximo rendimiento**: Usar VGG16 con variantes optimizadas
- **Para eficiencia**: LeNet con BatchNorm ofrece buen balance
- **Para aplicaciones en tiempo real**: Considerar AlexNet con FC reducidas

---
*Reporte generado automáticamente el {pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')}*
"""

with open('../results/reporte_final.md', 'w', encoding='utf-8') as f:
    f.write(reporte_md)

print("Reporte final generado en '../results/reporte_final.md'")
print("\nTodos los resultados guardados en '../results/':")
print("- Tablas: tabla1_modelos_base.csv, tabla2_variantes.csv")
print("- Figuras: figura1_2_curvas_combinadas.png, figura3_comparacion_rendimiento.png")
print("- Análisis: reporte_final.md")