<!--Header-->
<div style="background-color: #fff; color: black">
<div style="padding-bottom: 20px; display: flex; justify-content: space-between; align-items: flex-start;">
<div style="width: 60%;">
<h1 style="margin: 16px">TFG - Inteligencia Artificial</h1>
<p style="margin: 16px; padding-bottom: 0">Junio de 2025</p>
</div>
<div style="width: 40%; text-align: right">
<img src="https://www.uoc.edu/portal/_resources/common/imatges/marca_UOC/UOC_Masterbrand.jpg" alt="Logo UOC">
</div>
</div>
<h2 style="text-align: justify; padding: 0 16px">Aplicación de técnicas de IA fiable en la predicción del índice de calidad de vida en personas con tratamiento oncológico mediante aprendizaje automático.</h2>
<div style="background-color: #000; width: 100%; height: 2px; margin: 24px 0"></div>
<div style="padding: 20px">
<h4 style="margin: 0 0; padding: 0 0">Pablo Pimàs Verge</h4>
<h5 style="margin: 0 0; padding: 0 0">Grado en Ingeniería Informática</h5>
<h5 style="margin: 0 0 4px; padding: 0 0">Inteligencia Artificial</h5>
<h4 style="margin: 8px 0 4px; padding: 0 0">Dra. María Moreno de Castro</h4>
<h4 style="margin: 0 0; padding: 0 0">Dr. Friman Sanchéz</h4>
</div>
</div>

# Fase 3

## Cuantificación de la incertidumbre del modelo


### Importaciones y Configuraciones

In [2]:
# Importaciones de librerías básicas
import joblib
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns
import warnings

# Importaciones de Scikit-learn 
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score, roc_auc_score
from sklearn.metrics import ConfusionMatrixDisplay, classification_report, confusion_matrix
from sklearn.model_selection import FixedThresholdClassifier
from sklearn.metrics import brier_score_loss, log_loss
from sklearn.calibration import CalibratedClassifierCV

# Librerías XAI
import shap
import dice_ml as dice

# Funciones auxiliares
import aux_functions as afn

In [3]:
%matplotlib inline
warnings.filterwarnings("ignore")
pd.options.display.float_format = '{:.2f}'.format
plt.rc('font', size=10)
plt.rcParams["legend.frameon"] = False
sns.set_theme(
    style="white",
    palette="viridis",
    rc={
        "axes.spines.left": False,
        "axes.spines.bottom": False,
        "axes.spines.right": False,
        "axes.spines.top": False
    }
)
sns.set_style("white", {"axes.grid": False})

### Carga de datos

Cargamos los conjuntos de datos que se han generado en la fase de modelado para la clasificación binaria. 

In [7]:
X_train = pd.read_csv('../Fase 2/data/QLQ_C30_C23_X_train.csv')
X_test = pd.read_csv('../Fase 2/data/QLQ_C30_C23_X_test.csv')
y_train = pd.read_csv('../Fase 2/data/QLQ_C30_C23_y_train.csv').squeeze()
y_test = pd.read_csv('../Fase 2/data/QLQ_C30_C23_y_test.csv').squeeze()

### Carga del modelo seleccionado

Se carga el modelo final entrenado durante la fase de clasificación binaria. El modelo ha sido previamente almacenado en un archivo serializado (best_bundle.pkl), que incluye tanto el clasificador como el umbral de decisión óptimo identificado durante el ajuste final.

Luego, se utiliza la clase FixedThresholdClassifier para crear una instancia del modelo que aplica el umbral personalizado directamente sobre las probabilidades predichas (predict_proba). De esta forma, se garantiza que todas las explicaciones posteriores reflejen fielmente el comportamiento real del clasificador tal y como fue evaluado, sin depender del umbral por defecto.

In [9]:
bundle = joblib.load('../Fase 2/models/best_bundle.pkl')
model = bundle['model']
threshold = bundle['threshold']
model_thresholded = FixedThresholdClassifier(model, threshold=threshold, response_method="predict_proba").fit(X_train, y_train)

## 1. Calibración