# Evaluaci√≥n Cuantitativa de Explicabilidad con Quantus

Este notebook eval√∫a cuantitativamente la calidad de las explicaciones XAI usando la librer√≠a Quantus.

**M√©tricas evaluadas:**
- **Fidelidad (Faithfulness)**: Faithfulness Correlation - mide si la explicaci√≥n refleja el comportamiento interno del modelo.
- **Robustez (Robustness)**: Average Sensitivity - eval√∫a la estabilidad ante perturbaciones leves.
- **Complejidad (Complexity)**: Entropy/Complexity - estima la simplicidad de la explicaci√≥n.
- **Aleatorizaci√≥n (Randomization)**: Randomization Test - mide la dependencia respecto a la semilla.
- **Localizaci√≥n (Localization)**: Region Perturbation - determina la precisi√≥n espacial.

**M√©todos XAI evaluados:**
- Grad-CAM
- Grad-CAM++
- Integrated Gradients
- Saliency Maps

**Nota:** Este notebook eval√∫a los 3 modelos individuales (`blood`, `retina`, `breast`) y genera gr√°ficos radar comparativos a partir de los ficheros JSON producidos por `quantus_evaluation.py`.

Comprobaci√≥n de GPU (ejecutado originalmente):

```python
import torch
torch.cuda.is_available(), torch.cuda.get_device_name(0)
```

Salida esperada en JarvisLabs:

```text
(True, 'Quadro RTX 6000')
```

In [None]:
# Configuraci√≥n inicial

import os
import json
from pathlib import Path
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
from math import pi

# Cambiar al directorio del proyecto
PROJECT_DIR = Path("/home/TFM_Laura_Monne")
os.chdir(PROJECT_DIR)
print(f"Directorio de trabajo: {os.getcwd()}")

# Configuraci√≥n de rutas
OUTPUTS_DIR = PROJECT_DIR / "outputs"
OUTPUTS_DIR.mkdir(exist_ok=True)

# Lista de datasets que vamos a usar
datasets = ["blood", "retina", "breast"]

# N√∫mero de muestras evaluadas en Quantus por dataset
NUM_SAMPLES = 30  # Aumentar implica mayor tiempo de c√≥mputo en quantus_evaluation.py

print(f"Directorio de outputs: {OUTPUTS_DIR}")
print(f"Muestras evaluadas por dataset (Quantus): {NUM_SAMPLES}")

In [None]:
# Carga de resultados Quantus para los 3 datasets

results_by_dataset = {}

for dataset in datasets:
    json_path = OUTPUTS_DIR / f"quantus_metrics_{dataset}.json"
    if json_path.exists():
        with open(json_path, "r") as f:
            results_by_dataset[dataset] = json.load(f)
        print(f"‚úÖ Cargado: {dataset} ({json_path.name})")
    else:
        print(f"‚ö†Ô∏è  No encontrado: {json_path.name}")
        print("   Ejecuta `python quantus_evaluation.py --dataset", dataset, "...` antes de usar este notebook.")

if not results_by_dataset:
    raise ValueError("‚ùå No se encontraron resultados Quantus. Genera primero los ficheros JSON con quantus_evaluation.py.")

In [None]:
from math import pi

# Lista de datasets que vamos a usar (por claridad)
datasets = ["blood", "retina", "breast"]

# M√©tricas a mostrar en los radares
metric_names = ["faithfulness", "robustness", "complexity", "localization"]
metric_labels = ["Fidelidad", "Robustez", "Complejidad", "Localizaci√≥n"]

# M√©todos XAI
methods = ["gradcam", "gradcampp", "integrated_gradients", "saliency"]
method_labels = {
    "gradcam": "Grad-CAM",
    "gradcampp": "Grad-CAM++",
    "integrated_gradients": "Integrated Gradients",
    "saliency": "Saliency",
}


In [None]:
def build_df_for_dataset(dataset_name: str) -> pd.DataFrame:
    """Devuelve un DataFrame con las m√©tricas *originales* de Quantus
    para un dataset concreto ("blood" / "retina" / "breast").

    - Filas: m√©todos XAI
    - Columnas: m√©tricas (faithfulness, robustness, complexity, localization)
    """
    results = results_by_dataset[dataset_name]

    data = {m: [] for m in methods}
    for m in methods:
        if m not in results:
            continue
        for metric in metric_names:
            info = results[m].get(metric, None)
            if info is None:
                data[m].append(np.nan)
            else:
                data[m].append(float(info["mean"]))

    df = pd.DataFrame.from_dict(data, orient="index", columns=metric_names)
    return df


In [None]:
def plot_radar_for_dataset(dataset_name: str):
    """Dibuja un gr√°fico radar para un dataset (blood/retina/breast),
    normalizando cada m√©trica entre los m√©todos XAI de ese dataset.
    """
    df = build_df_for_dataset(dataset_name)

    print(f"\n=== {dataset_name.upper()} - valores originales ===")
    display(df)

    # Normalizaci√≥n min‚Äìmax por m√©trica dentro del dataset
    df_norm = df.copy()

    for metric in metric_names:
        col = df[metric].values.astype(float)
        mn, mx = np.nanmin(col), np.nanmax(col)

        if mx - mn < 1e-8:
            # Si todos los m√©todos tienen el mismo valor en esa m√©trica
            df_norm[metric] = 0.5
        else:
            df_norm[metric] = (col - mn) / (mx - mn)

        # Invertimos las m√©tricas donde "menos es mejor"
        if metric in ["robustness", "complexity"]:
            df_norm[metric] = 1.0 - df_norm[metric]

    print(f"\n=== {dataset_name.upper()} - valores normalizados (0-1) ===")
    display(df_norm)

    # √Ångulos del radar
    N = len(metric_names)
    angles = [n / float(N) * 2 * pi for n in range(N)]
    angles += angles[:1]  # cerrar c√≠rculo

    fig, ax = plt.subplots(figsize=(8, 8), subplot_kw=dict(polar=True))

    # Dibujar cada m√©todo
    for method in df_norm.index:
        vals = df_norm.loc[method, metric_names].tolist()
        vals += vals[:1]

        ax.plot(
            angles,
            vals,
            linewidth=2,
            marker="o",
            label=method_labels.get(method, method),
        )
        ax.fill(angles, vals, alpha=0.25)

    # Ejes y est√©tica
    ax.set_xticks(angles[:-1])
    ax.set_xticklabels(metric_labels, fontsize=12)

    ax.set_ylim(0, 1)
    ax.set_yticks([0.2, 0.4, 0.6, 0.8, 1.0])
    ax.set_yticklabels(["0.2", "0.4", "0.6", "0.8", "1.0"], fontsize=9)

    ax.grid(True, linestyle="--", alpha=0.5)
    plt.title(
        f"Perfil de M√©tricas por M√©todo XAI\nDataset: {dataset_name.upper()} (normalizado 0-1)",
        size=16,
        fontweight="bold",
        pad=20,
    )

    ax.legend(loc="upper right", bbox_to_anchor=(1.3, 1.1), fontsize=10)
    plt.tight_layout()

    # Guardar figura
    out_path = OUTPUTS_DIR / f"quantus_radar_{dataset_name}.png"
    plt.savefig(out_path, dpi=300, bbox_inches="tight")
    print(f"‚úÖ Figura guardada en: {out_path}")

    plt.show()


In [None]:
# Generar gr√°ficos radar y mostrar tablas para cada dataset

for ds in datasets:
    plot_radar_for_dataset(ds)

# En este punto se generan las figuras:
# - outputs/quantus_radar_blood.png
# - outputs/quantus_radar_retina.png
# - outputs/quantus_radar_breast.png
# y se muestran en el notebook junto con las tablas de valores originales
# y normalizados que se han utilizado en el Cap√≠tulo 4 del TFM.

In [None]:
# Guardado de tablas (valores originales y normalizados) por dataset

print("\n=== Guardando tablas por dataset en outputs/ ===\n")

for dataset in datasets:
    # Construir tablas
    df_raw = build_df_for_dataset(dataset)

    # Normalizaci√≥n min‚Äìmax por dataset
    df_norm = df_raw.copy()

    for metric in metric_names:
        col = df_raw[metric].values.astype(float)
        mn, mx = np.nanmin(col), np.nanmax(col)

        if mx - mn < 1e-8:
            df_norm[metric] = 0.5
        else:
            df_norm[metric] = (col - mn) / (mx - mn)

        if metric in ["robustness", "complexity"]:
            df_norm[metric] = 1.0 - df_norm[metric]

    # Rutas de guardado
    raw_path = OUTPUTS_DIR / f"quantus_table_raw_{dataset}.csv"
    norm_path = OUTPUTS_DIR / f"quantus_table_normalized_{dataset}.csv"

    # Guardar tablas
    df_raw.to_csv(raw_path, index=True)
    df_norm.to_csv(norm_path, index=True)

    print(f"üìÅ Guardado: {raw_path.name}")
    print(f"üìÅ Guardado: {norm_path.name}")
