# 03_Evaluaci√≥n ‚Äì Visualizaci√≥n ‚Äì Reporte

**Proyecto:** MLY0100 ‚Äî Pipeline de Diabetes con Kedro  
**Autor:** Antonio Sep√∫lveda  
**Fecha:** 2025

---
Este notebook complementa el pipeline automatisado desarrollado con **Kedro**, permitiendo analizar manualmente:
- Las m√©tricas generadas por el pipeline
- Las visualizaciones exportadas autom√°ticamente
- Interpretaci√≥n del rendimiento del modelo
- Evaluaci√≥n global del sistema de clasificaci√≥n de diabetes


# üìö 1. Importaci√≥n de Librer√≠as
Se cargan las librer√≠as necesarias para visualizar y analizar los resultados.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import Image, display

# üìÅ 2. Carga de Resultados del Pipeline

El pipeline Kedro exporta autom√°ticamente los resultados de evaluaci√≥n en la carpeta:
`data/08_reporting/diabetes_evaluation_results.csv`

In [None]:
results_path = "../data/08_reporting/diabetes_evaluation_results.csv"
df_results = pd.read_csv(results_path)

print("üìÑ Resultados cargados correctamente:")
df_results

# üìä 3. Visualizaci√≥n de M√©tricas del Modelo

Se grafican las m√©tricas m√°s importantes obtenidas del modelo:
- **accuracy**
- **mse**
- **precision**
- **recall**

Estas m√©tricas provienen directamente de la ejecuci√≥n del pipeline Kedro.

In [None]:
plt.figure(figsize=(8, 5))
sns.barplot(data=df_results)
plt.title("M√©tricas del Modelo de Diabetes", fontsize=14, weight='bold')
plt.xlabel("M√©tricas")
plt.ylabel("Valor")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# üñºÔ∏è 4. Visualizaciones Generadas Automatizadamente por Kedro

El pipeline genera im√°genes autom√°ticamente y las guarda en:
`data/08_reporting/`

Im√°genes disponibles:
- `confusion_matrix_diabetes.png`
- `metrics_diabetes.png`

In [None]:
print("üìä Matriz de Confusi√≥n:")
display(Image("../data/08_reporting/confusion_matrix_diabetes.png"))

print("üìä Resumen de M√©tricas Gr√°ficas:")
display(Image("../data/08_reporting/metrics_diabetes.png"))

# üìù 5. Interpretaci√≥n de Resultados

A continuaci√≥n se realiza una interpretaci√≥n textual de las m√©tricas del pipeline.
Esto se ajusta autom√°ticamente al contenido del archivo de evaluaci√≥n.

In [None]:
accuracy = df_results['accuracy'].values[0]
mse = df_results['mse'].values[0]

print("üîç Interpretaci√≥n Autom√°tica:")
print(f"- Exactitud (Accuracy): {accuracy:.4f} ‚Üí indica que el modelo clasifica correctamente cerca del {accuracy*100:.1f}% de los casos.")
print(f"- Error Cuadr√°tico Medio (MSE): {mse:.4f} ‚Üí un valor bajo indica buena capacidad predictiva.")

print("\nüìå Conclusi√≥n:")
print("El modelo Random Forest entrenado mediante Kedro demuestra un rendimiento s√≥lido para predecir el riesgo de diabetes.")
print("Los valores obtenidos son coherentes con un modelo confiable y estable para un contexto cl√≠nico inicial.")

# ‚úÖ 6. Conclusiones Finales

El pipeline Kedro, junto con este notebook, permite:
- Validar de forma reproducible los resultados
- Visualizar m√©tricas clave
- Interpretar el rendimiento cl√≠nico del modelo
- Mantener trazabilidad y rigor acad√©mico

Este cuaderno sirve como reporte final complementario para el an√°lisis del modelo de diabetes.