# TP Explicabilité - Partial Dependence Plots

**Auteur:** Sandie Cabon  
**Date:** 2 février 2026

Ce notebook permet de générer des Partial Dependence Plots pour analyser l'influence des variables sur les prédictions.

## Import des bibliothèques

In [None]:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from helping_functions_et import infer_column_types
import joblib
from sklearn.inspection import PartialDependenceDisplay

## Configuration (NE PAS MODIFIER)

In [None]:
print("############### CHARGEMENT DES DONNÉES #####################")

# close older figures
plt.close("all")

# load heart failure dataset
dataset = pd.read_csv("heart_failure_dataset_test.csv")

# apply good type to dataframe (custom function)
dataset = infer_column_types(dataset)

# separate feat and target values
dataset_feat = dataset.drop("DEATH_EVENT", axis=1)
dataset_target = dataset["DEATH_EVENT"]
feat_names = list(dataset_feat.columns)

# load the pipeline (composed by a preprocessor and a model)
loaded_RF = joblib.load('death_RF_predictor.pkl')

preprocessor = loaded_RF.named_steps['preprocessor']
model = loaded_RF.named_steps['model']

# settings for reproducibility
random_state = 12
np.random.seed(12)

# metric of interest
scorer = 'balanced_accuracy'

## IV. Partial Dependence Plots

### Configuration des combinaisons à afficher

In [None]:
print("############ IV. PARTIAL DEPENDENCE PLOTS ############")

# Configuration des combinasons à afficher

features_to_display = [ 
    (...), # 1ere variable
    (...), # 2eme variable
    (...), # 3eme variable
    (..., ...), # 1ere variable et 2ème variable
    (..., ...), # 1ere variable et 3ème variable
    (..., ...) # 2eme variable et 3ème variable
    ]

### Génération des PDP

In [None]:
fig, ax = plt.subplots(figsize=(15, 7))

# Configuration du PartialDependenceDisplay.from estimator
# aide : compléter avec le modèle et le jeu de données sur lequel la fonction va s'appliquer

display_tree = PartialDependenceDisplay.from_estimator(
    estimator=...,
    X=...,
    n_jobs=3,
    grid_resolution=20,
    features=features_to_display,
    random_state=random_state,
    contour_kw = {"cmap" : "viridis_r"},
    ax=ax,
    )

plt.tight_layout()
plt.show()