In [41]:
import pandas as pd
import plotly.express as px
from sklearn.metrics import accuracy_score, balanced_accuracy_score, confusion_matrix
import numpy as np

In [68]:
def fairness_metrics(df, preds_col, labels_col, sensitive_col):
    """
    Calcule les métriques de fairness : accuracy, balanced accuracy, statistical parity difference, 
    et disparate impact ratio global, puis affiche les résultats.
    """
    # Calcul de l'accuracy globale
    accuracy = accuracy_score(df[labels_col], df[preds_col])
    print(f"Accuracy (globale): {accuracy}")

    # Calcul de la balanced accuracy globale
    balanced_accuracy = balanced_accuracy_score(df[labels_col], df[preds_col])
    print(f"Balanced Accuracy (globale): {balanced_accuracy}")

    # Calcul de l'accuracy et de la balanced accuracy pour chaque groupe sensible
    group_accuracy = df.groupby(sensitive_col).apply(
        lambda group: accuracy_score(group[labels_col], group[preds_col])
    )
    print(f"Accuracy par groupe sensible : \n{group_accuracy}")

    group_balanced_accuracy = df.groupby(sensitive_col).apply(
        lambda group: balanced_accuracy_score(group[labels_col], group[preds_col])
    )
    print(f"Balanced Accuracy par groupe sensible : \n{group_balanced_accuracy}")

    # Calcul du taux positif (classification 'malade') par groupe sensible
    group_positive_rate = df.groupby(sensitive_col).apply(
        lambda group: np.mean(group[preds_col] == 'malade')  # Calcul du taux positif (ici 'malade')
    )
    print(f"Taux de classification positive par groupe : \n{group_positive_rate}")

    # Calcul de la Statistical Parity Difference
    # Statistical Parity Difference = (taux de classification positive pour un groupe) - (taux de classification positif moyen)
    mean_positive_rate = group_positive_rate.mean()
    statistical_parity_diff = group_positive_rate - mean_positive_rate
    print(f"Statistical Parity Difference : \n{statistical_parity_diff}")
    
    # Calcul du Disparate Impact Ratio global
    # Disparate Impact Ratio = (taux de classification positive pour le groupe 1) / (taux de classification positive pour le groupe 2)
    # Le ratio est global, donc on prend les groupes sensibles et calculons le ratio entre les taux positifs.
    groups = df[sensitive_col].unique()
    if len(groups) == 2:
        rate_group_1 = group_positive_rate[groups[0]]
        rate_group_2 = group_positive_rate[groups[1]]
        if rate_group_2 != 0:
            disparate_impact_ratio = rate_group_1 / rate_group_2
        else:
            disparate_impact_ratio = float('inf')  # Pour éviter la division par zéro
        print(f"Disparate Impact Ratio (global) : {disparate_impact_ratio}")
    else:
        print("Disparate Impact Ratio ne peut être calculé que pour deux groupes sensibles distincts.")

## Applications

In [73]:
age1  = pd.read_csv("./1clem_out_age/preds.csv")
gender1 = pd.read_csv("./1clem_out_gender/preds.csv")
both1 = pd.read_csv("./1clem_out_both/preds.csv")
gender0  = pd.read_csv("./clem_out_genre/preds.csv")

In [70]:
fairness_metrics(age1, preds_col="preds", labels_col="labels", sensitive_col="Patient Gender")

Accuracy (globale): 0.6961259079903148
Balanced Accuracy (globale): 0.6921320357377081
Accuracy par groupe sensible : 
Patient Gender
F    0.704003
M    0.689034
dtype: float64
Balanced Accuracy par groupe sensible : 
Patient Gender
F    0.701064
M    0.683991
dtype: float64
Taux de classification positive par groupe : 
Patient Gender
F    0.447615
M    0.437500
dtype: float64
Statistical Parity Difference : 
Patient Gender
F    0.005057
M   -0.005057
dtype: float64
Disparate Impact Ratio (global) : 0.9774024738344435










In [71]:
fairness_metrics(gender1, preds_col="preds", labels_col="labels", sensitive_col="Patient Gender")

Accuracy (globale): 0.7189265536723164
Balanced Accuracy (globale): 0.7160636779783346
Accuracy par groupe sensible : 
Patient Gender
F    0.729131
M    0.709739
dtype: float64
Balanced Accuracy par groupe sensible : 
Patient Gender
F    0.725625
M    0.708151
dtype: float64
Taux de classification positive par groupe : 
Patient Gender
F    0.438671
M    0.460506
dtype: float64
Statistical Parity Difference : 
Patient Gender
F   -0.010917
M    0.010917
dtype: float64
Disparate Impact Ratio (global) : 1.0497751503960926










In [72]:
fairness_metrics(both1, preds_col="preds", labels_col="labels", sensitive_col="Patient Gender")

Accuracy (globale): 0.7096448748991122
Balanced Accuracy (globale): 0.7072462454644024


Accuracy par groupe sensible : 
Patient Gender
F    0.723169
M    0.697469
dtype: float64
Balanced Accuracy par groupe sensible : 
Patient Gender
F    0.722778
M    0.692370
dtype: float64
Taux de classification positive par groupe : 
Patient Gender
F    0.477002
M    0.435966
dtype: float64
Statistical Parity Difference : 
Patient Gender
F    0.020518
M   -0.020518
dtype: float64
Disparate Impact Ratio (global) : 0.9139721187554777










In [74]:
fairness_metrics(gender0, preds_col="preds", labels_col="labels", sensitive_col="Patient Gender")

Accuracy (globale): 0.7066182405165456
Balanced Accuracy (globale): 0.7114041650051246
Accuracy par groupe sensible : 
Patient Gender
F    0.718058
M    0.696319
dtype: float64
Balanced Accuracy par groupe sensible : 
Patient Gender
F    0.721068
M    0.702986
dtype: float64
Taux de classification positive par groupe : 
Patient Gender
F    0.518739
M    0.523773
dtype: float64
Statistical Parity Difference : 
Patient Gender
F   -0.002517
M    0.002517
dtype: float64
Disparate Impact Ratio (global) : 1.0097036275902365








