# Cuaderno 5: Análisis Comparativo, Selección de Modelo y Conclusiones

**Autor:** Gabriel Murillo
**Fecha:** 24 de julio de 2025

**Objetivo:** Este notebook consolida los resultados de los tres modelos desarrollados para la clasificación de sonidos respiratorios. Se realiza un análisis comparativo para seleccionar el modelo con el mejor rendimiento y se exploran análisis avanzados sobre el modelo ganador. Finalmente, se presentan las conclusiones del proyecto y se delinean los próximos pasos.

---


In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display

# --- Configuración de Estilo ---
sns.set_theme(style="whitegrid")
# Aumentar el tamaño de fuente por defecto para los gráficos
plt.rcParams.update({'font.size': 12})


## 1. Resumen Cuantitativo de Modelos

El primer paso es consolidar las métricas de rendimiento clave de cada uno de los modelos entrenados en una tabla comparativa. Esto nos permite una evaluación objetiva y directa de su eficacia.

---

In [4]:
summary_data = {
    'Modelo': [
        'Baseline: Random Forest', 
        '1D-CNN (Regularizada)', 
        '2D-CNN (Transfer Learning)'
    ],
    'F1-Score Ponderado': [0.89, 0.84, 0.91],
    'Accuracy': [0.91, 0.86, 0.91],
    'Recall (Healthy)': [0.36, 0.41, 0.66],
    'Recall (Pneumonia)': [0.44, 0.14, 0.66],
    'Interpretabilidad': ['Alta', 'Baja', 'Baja'],
    'Complejidad': ['Baja', 'Media', 'Alta']
}

summary_df = pd.DataFrame(summary_data)

print("--- Tabla Comparativa de Modelos ---")
# Usamos un gradiente de color para resaltar los mejores valores
display(summary_df.style.background_gradient(
    cmap='Greens', subset=['F1-Score Ponderado', 'Accuracy', 'Recall (Healthy)', 'Recall (Pneumonia)']
))


--- Tabla Comparativa de Modelos ---


Unnamed: 0,Modelo,F1-Score Ponderado,Accuracy,Recall (Healthy),Recall (Pneumonia),Interpretabilidad,Complejidad
0,Baseline: Random Forest,0.89,0.91,0.36,0.44,Alta,Baja
1,1D-CNN (Regularizada),0.84,0.86,0.41,0.14,Baja,Media
2,2D-CNN (Transfer Learning),0.91,0.91,0.66,0.66,Baja,Alta


## 2. Veredicto: Selección del Modelo Ganador

**Análisis:** Los resultados de la tabla anterior son concluyentes. Aunque el Random Forest estableció un baseline sólido, y la 1D-CNN fue un ejercicio importante en diagnóstico de sobreajuste, el modelo **2D-CNN con Transfer Learning** es superior en prácticamente todas las métricas clave. No solo alcanza el F1-score ponderado más alto (0.91), sino que, de manera crucial, mejora drásticamente el `recall` en clases minoritarias de gran importancia como `Healthy` (0.66) y `Pneumonia` (0.66).

**Veredicto:** El modelo **2D-CNN (EfficientNet-B0) con Transfer Learning** es seleccionado como el modelo final para la fase de producción debido a su rendimiento superior y su mayor capacidad de generalización.

---


## 3. Análisis Profundo del Modelo Ganador (2D-CNN)

Ahora que hemos seleccionado un ganador, realizaremos un análisis más profundo sobre su comportamiento utilizando las técnicas avanzadas de visualización e interpretabilidad que desarrollamos.

### 3.1 Curvas ROC-AUC
Las curvas ROC-AUC nos permiten evaluar la capacidad de discriminación del modelo para cada clase.



**Análisis de ROC-AUC:** La gráfica muestra un rendimiento excepcional. Todas las clases principales tienen un Área Bajo la Curva (AUC) superior a 0.95, destacando `Healthy` (AUC=1.00), `COPD` (AUC=0.98) y `Pneumonia` (AUC=0.97). Esto indica que el modelo posee una capacidad de discriminación casi perfecta, separando con gran confianza las clases entre sí.

### 3.2 Análisis Cualitativo de Errores
El análisis de los errores más seguros del modelo nos da pistas sobre sus confusiones restantes.



**Análisis de Errores:** La tabla de los 5 errores con mayor confianza muestra que, aunque el sesgo se ha reducido, la confusión principal del modelo sigue siendo clasificar erróneamente otras patologías como `COPD`. Esto sugiere que las características visuales de los espectrogramas de `COPD` son extremadamente dominantes y comparten similitudes con las de otras enfermedades en casos difíciles.

---

## 4. Resumen Ejecutivo y Conclusiones

Este proyecto se propuso desarrollar un sistema de Machine Learning para la clasificación de sonidos respiratorios. Se iteró a través de tres arquitecturas de complejidad creciente: un baseline de Random Forest, una 1D-CNN sobre audio crudo y una 2D-CNN con Transfer Learning sobre espectrogramas.

**El modelo final, basado en `EfficientNet-B0` pre-entrenado, ha demostrado ser altamente efectivo**, alcanzando un **F1-score ponderado de 0.91** y mejorando drásticamente la capacidad de detección de clases minoritarias clave, como `Healthy` y `Pneumonia`, con un `recall` del 66% para ambas.

Se diagnosticó y corrigió exitosamente un problema de sobreajuste en el modelo 1D-CNN mediante técnicas de regularización, y se realizaron análisis de interpretabilidad (Grad-CAM) y de errores sobre el modelo ganador.

El éxito de la estrategia de Transfer Learning valida el enfoque de tratar el audio como una imagen y sienta las bases para una herramienta de monitoreo no invasiva y de bajo costo con un alto potencial de impacto clínico.

---

## 5. Trabajo Futuro (Future Work)

Para continuar mejorando este proyecto, se proponen las siguientes líneas de trabajo:

* **Modelo de Vanguardia (Tier 2):** Implementar un **Audio Spectrogram Transformer (AST)** pre-entrenado en AudioSet para comparar su rendimiento contra la 2D-CNN y potencialmente alcanzar un nuevo estado del arte.
* **Mejora de Datos:** Implementar un pipeline para la recopilación y etiquetado de más datos, con un enfoque especial en las clases minoritarias que aún presentan un rendimiento bajo, como `Bronchiolitis`.
* **Enfoque de Interpretabilidad:** Desarrollar el modelo de **Deconstrucción Bio-Acústica** (basado en HPSS y características físicas) como una alternativa de "caja de cristal" que priorice la interpretabilidad de las predicciones.
* **Despliegue en la Nube:** Desplegar el contenedor Docker de la API en un servicio administrado como **AWS Fargate** o **Google Cloud Run** para crear un servicio web escalable y de alta disponibilidad.
* **Ensamblado de Modelos:** Implementar un ensamblado que combine las predicciones del Random Forest y la 2D-CNN para potencialmente mejorar la robustez del sistema final.