In [1]:
import pandas as pd

# Carga los resultados generales y de MLP
df_clasicos = pd.read_csv("resultados_todos_escenarios.csv")
df_mlp = pd.read_csv("resultados_mlp_todos.csv")

# Unifica los dataframes
df_total = pd.concat([df_clasicos, df_mlp], ignore_index=True)

# Filtra y agrupa Escenario 1
metricas = ["Accuracy", "Recall", "Precision", "F1-score", "Specificity", "AUC-ROC"]
df_esc1 = df_total[df_total["Escenario"].str.contains("Escenario 1")]
df_esc1 = df_esc1.groupby("Modelo")[metricas].mean().sort_index()


# Escenario 1

In [3]:
import os

# Crear carpeta para guardar las gráficas
carpeta = "graficas_escenario1"
os.makedirs(carpeta, exist_ok=True)

## Gráfica 1: Comparación de métricas por modelo

In [5]:
import matplotlib.pyplot as plt

# Ya no necesitas esta línea porque df_esc1 ya está en el formato correcto
# df_metricas = df_esc1[["Modelo"] + metricas].set_index("Modelo")

df_esc1.plot(kind="bar", figsize=(12, 6))
plt.title("Comparación de métricas por modelo – Escenario 1")
plt.ylabel("Puntaje")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(True, axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario1_comparacion_metricas_modelos.png"))
plt.close()


## Gráfica 2: Tiempo de entrenamiento por modelo

In [7]:
# Calcular el promedio de tiempo por modelo en Escenario 1
df_tiempo = df_total[df_total["Escenario"].str.contains("Escenario 1")]
df_tiempo = df_tiempo.groupby("Modelo")["Tiempo (s)"].mean()

# Graficar
plt.figure(figsize=(10, 5))
plt.bar(df_tiempo.index, df_tiempo.values, color='gray')
plt.title("Tiempo de entrenamiento por modelo – Escenario 1")
plt.ylabel("Segundos")
plt.xlabel("Modelo")
plt.xticks(rotation=45)
plt.grid(True, axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario1_tiempo_entrenamiento_modelos.png"))
plt.close()


## Gráfica 3: Comparación Recall vs Specificity

In [9]:
df_recall_spec = df_esc1[["Recall", "Specificity"]]

df_recall_spec.plot(kind="bar", figsize=(10, 6))
plt.title("Recall vs Specificity – Escenario 1")
plt.ylabel("Valor")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(True, axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario1_recall_vs_specificity.png"))
plt.close()

# Escenario 2

In [11]:
# Filtra solo resultados del Escenario 2
df_esc2 = df_total[df_total["Escenario"].str.contains("Escenario 2")]

# Agrupa por modelo y calcula promedios de métricas
df_esc2 = df_esc2.groupby("Modelo")[metricas].mean().sort_index()

# Carpeta de salida
carpeta = "graficas_escenario2"
os.makedirs(carpeta, exist_ok=True)

## Gráfica 1 – Comparación de métricas por modelo

In [13]:
df_esc2.plot(kind="bar", figsize=(12, 6))
plt.title("Comparación de métricas por modelo – Escenario 2")
plt.ylabel("Puntaje")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(True, axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario2_comparacion_metricas_modelos.png"))
plt.close()


## Gráfica 2 – Recall vs Specificity

In [15]:
df_recall_spec = df_esc2[["Recall", "Specificity"]]

df_recall_spec.plot(kind="bar", figsize=(10, 6))
plt.title("Recall vs Specificity – Escenario 2")
plt.ylabel("Valor")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(True, axis='y', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario2_recall_vs_specificity.png"))
plt.close()

## Gráfica 3 – Tiempo de entrenamiento por modelo

In [17]:
# Promedio del tiempo por modelo (se extrae antes de agrupar)
df_tiempo_esc2 = df_total[df_total["Escenario"].str.contains("Escenario 2")]
df_tiempo_esc2 = df_tiempo_esc2.groupby("Modelo")["Tiempo (s)"].mean()

plt.figure(figsize=(10, 5))
plt.bar(df_tiempo_esc2.index, df_tiempo_esc2.values, color='gray')
plt.title("Tiempo de entrenamiento por modelo – Escenario 2")
plt.ylabel("Segundos")
plt.xlabel("Modelo")
plt.xticks(rotation=45)
plt.grid(True, axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario2_tiempo_entrenamiento_modelos.png"))
plt.close()

# Escenario 3

In [41]:
# Filtra y concatena los resultados del Escenario 3
df_esc3 = df_total[df_total["Escenario"].str.contains("Escenario 3")].copy()

# Agrupa por modelo para obtener métricas promedio
metricas = ["Accuracy", "Recall", "Precision", "F1-score", "Specificity", "AUC-ROC"]
df_esc3 = df_esc3.groupby("Modelo")[metricas + ["Tiempo (s)"]].mean().round(3).sort_index()

# Crea carpeta de salida
import os
import matplotlib.pyplot as plt

carpeta = "graficas_escenario3"
os.makedirs(carpeta, exist_ok=True)

# Gráfica 1 – Comparación de métricas por modelo
df_esc3[metricas].plot(kind="bar", figsize=(12, 6))
plt.title("Comparación de métricas por modelo – Escenario 3")
plt.ylabel("Puntaje")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario3_comparacion_metricas_modelos.png"))
plt.close()

# Gráfica 2 – Recall vs Specificity
df_esc3[["Recall", "Specificity"]].plot(kind="bar", figsize=(10, 6))
plt.title("Recall vs Specificity – Escenario 3")
plt.ylabel("Valor")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig(os.path.join(carpeta, "escenario3_recall_vs_specificity.png"))
plt.close()

# Filtrar solo Escenario 3 (evita falsos positivos con espacios o guiones)
df_tiempo_esc3 = df_total[df_total["Escenario"].str.strip().str.contains("Escenario 3", case=False, regex=False)]

# Agrupar por modelo y sumar tiempos
df_tiempo_esc3 = df_tiempo_esc3.groupby("Modelo", as_index=False)["Tiempo (s)"].sum().sort_values("Tiempo (s)", ascending=False)

# Graficar
plt.figure(figsize=(10, 5))
plt.bar(df_tiempo_esc3["Modelo"], df_tiempo_esc3["Tiempo (s)"], color='gray')
plt.title("Tiempo total de entrenamiento por modelo – Escenario 3")
plt.ylabel("Segundos")
plt.xlabel("Modelo")
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig("graficas_escenario3/escenario3_tiempo_total_entrenamiento_modelos.png")
plt.close()



# Escenario 4

In [39]:

# Filtra solo resultados del Escenario 4
df_esc4 = df_total[df_total["Escenario"].str.contains("Escenario 4")].copy()

# Agrupa por modelo y calcula promedios
metricas = ["Accuracy", "Recall", "Precision", "F1-score", "Specificity", "AUC-ROC"]
df_esc4 = df_esc4.groupby("Modelo")[metricas + ["Tiempo (s)"]].mean().round(3).sort_index()

# Crear carpeta de salida
carpeta_esc4 = "graficas_escenario4"
os.makedirs(carpeta_esc4, exist_ok=True)

# Gráfica 1 – Comparación de métricas por modelo
df_esc4[metricas].plot(kind="bar", figsize=(12, 6))
plt.title("Comparación de métricas por modelo – Escenario 4")
plt.ylabel("Puntaje")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig(os.path.join(carpeta_esc4, "escenario4_comparacion_metricas_modelos.png"))
plt.close()

# Gráfica 2 – Recall vs Specificity
df_esc4[["Recall", "Specificity"]].plot(kind="bar", figsize=(10, 6))
plt.title("Recall vs Specificity – Escenario 4")
plt.ylabel("Valor")
plt.ylim(0, 1)
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig(os.path.join(carpeta_esc4, "escenario4_recall_vs_specificity.png"))
plt.close()

# Tiempo total por modelo en Escenario 4
df_tiempo_esc4 = df_total[df_total["Escenario"].str.contains("Escenario 4")]
df_tiempo_esc4 = df_tiempo_esc4.groupby("Modelo")["Tiempo (s)"].sum()

plt.figure(figsize=(10, 5))
plt.bar(df_tiempo_esc4.index, df_tiempo_esc4.values, color='gray')
plt.title("Tiempo total de entrenamiento por modelo – Escenario 4")
plt.ylabel("Segundos")
plt.xlabel("Modelo")
plt.xticks(rotation=45)
plt.grid(axis='y', linestyle='--', alpha=0.6)
plt.tight_layout()
plt.savefig("graficas_escenario4/escenario4_tiempo_total_entrenamiento_modelos.png")
plt.close()




## Matrices de confusion

In [23]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os

# Crear carpeta de salida
carpeta_salida = "matrices_confusion"
os.makedirs(carpeta_salida, exist_ok=True)

# Agrupar por modelo y escenario y sumar las matrices
df_confusion = df_total.groupby(["Modelo", "Escenario"])[["TP", "FP", "FN", "TN"]].sum().reset_index()

# Función para graficar matriz
def graficar_matriz_confusion(tp, fp, fn, tn, modelo, escenario):
    matriz = [[tn, fp],
              [fn, tp]]

    etiquetas = ["Negativa", "Positiva"]
    plt.figure(figsize=(5, 4))
    sns.heatmap(matriz, annot=True, fmt="d", cmap="Blues", xticklabels=etiquetas, yticklabels=etiquetas)
    plt.xlabel("Predicción")
    plt.ylabel("Real")
    plt.title(f"{modelo} - {escenario}")
    plt.tight_layout()
    nombre_archivo = f"{carpeta_salida}/matriz_{modelo}_{escenario.replace(' ', '_').replace('–','-')}.png"
    plt.savefig(nombre_archivo)
    plt.close()

# Iterar sobre las combinaciones agrupadas
for _, fila in df_confusion.iterrows():
    modelo = fila["Modelo"]
    escenario = fila["Escenario"]
    tp, fp, fn, tn = int(fila["TP"]), int(fila["FP"]), int(fila["FN"]), int(fila["TN"])
    graficar_matriz_confusion(tp, fp, fn, tn, modelo, escenario)
