## Performance de Shapley ?  

L'utilisation de Shapley values pour expliquer les prédictions d'un modèle complexe est une méthode puissante pour rendre les modèles interprétables. Cependant, évaluer la performance de Shapley values dans ce contexte peut être un peu plus subtil que d'évaluer la performance d'un modèle de machine learning traditionnel. Voici quelques approches pour évaluer la performance de Shapley values :

### 1. **Consistance avec les attentes**
Vérifiez si les Shapley values correspondent à vos attentes basées sur votre connaissance du domaine. Par exemple, si vous savez qu'une certaine caractéristique devrait avoir un impact important sur la prédiction, les Shapley values devraient refléter cela.

### 2. **Comparaison avec d'autres méthodes d'explication**
Comparez les Shapley values avec d'autres méthodes d'explication de modèles, comme LIME (Local Interpretable Model-agnostic Explanations) ou les poids des caractéristiques dans des modèles plus simples. Si les explications sont cohérentes entre différentes méthodes, cela renforce la confiance dans les Shapley values.

### 3. **Évaluation quantitative**
Utilisez des métriques quantitatives pour évaluer la performance des Shapley values. Voici quelques métriques couramment utilisées :

#### a. **Fidélité**
Mesurez la fidélité des explications en comparant les prédictions du modèle original avec les prédictions d'un modèle simplifié basé sur les Shapley values. Une bonne fidélité signifie que les explications sont proches des prédictions réelles du modèle.



```python
import numpy as np
import shap

# Supposons que vous avez un modèle 'model' et des données 'X'
explainer = shap.Explainer(model, X)
shap_values = explainer(X)

# Calculer la fidélité
def fidelity(model, X, shap_values):
    original_predictions = model.predict(X)
    shap_predictions = np.sum(shap_values.values, axis=1) + shap_values.base_values
    return np.mean((original_predictions - shap_predictions) ** 2)

fidelity_score = fidelity(model, X, shap_values)
print(f"Fidelity score: {fidelity_score}")
```

#### b. **Stabilité**
Mesurez la stabilité des Shapley values en calculant les valeurs pour des échantillons légèrement perturbés. Les Shapley values devraient être relativement stables pour des échantillons similaires.

```python
def stability(model, X, shap_values, perturbation_size=0.01):
    perturbed_X = X + np.random.normal(0, perturbation_size, X.shape)
    perturbed_shap_values = explainer(perturbed_X)
    return np.mean((shap_values.values - perturbed_shap_values.values) ** 2)

stability_score = stability(model, X, shap_values)
print(f"Stability score: {stability_score}")
```

### 4. **Évaluation qualitative**
Impliquez des experts du domaine pour évaluer qualitativement les explications fournies par les Shapley values. Les experts peuvent fournir des insights sur la pertinence et la précision des explications.

### 5. **Visualisation**
Utilisez des visualisations pour inspecter les Shapley values. Les graphiques de dépendance, les graphiques de résumé et les graphiques de force peuvent aider à comprendre l'impact des différentes caractéristiques sur les prédictions.

```python
# Graphique de résumé
shap.summary_plot(shap_values, X)

# Graphique de dépendance
shap.dependence_plot("feature_name", shap_values.values, X)

# Graphique de force
shap.force_plot(explainer.expected_value, shap_values.values, X)
```

### Conclusion
Évaluer la performance des Shapley values dans le contexte de l'interprétabilité des modèles nécessite une combinaison de méthodes quantitatives et qualitatives. En utilisant des métriques comme la fidélité et la stabilité, en comparant avec d'autres méthodes d'explication, et en impliquant des experts du domaine, vous pouvez obtenir une évaluation complète de la performance des Shapley values.

# Detecting bias with SHAP

# Detecting bias with SHAP

In [None]:
from scipy import stats

gender_cols = [col for col in X_train.columns if 'Gender' in col] + ["Trans"]

gender_features_locs = [X_train.columns.get_loc(col) for col in gender_cols]

def describe_stats(gender_col):
    s = stats.describe(shap_values[X_train[gender_col]][:,gender_features_locs].sum(axis=1))
    return (gender_col, int(s.nobs), float(s.minmax[0]), float(s.minmax[1]), float(s.mean))

display(pd.DataFrame([describe_stats(col) for col in gender_cols], ["gender_col", "n", "min", "max", "mean"]))