PEÑA CASTAÑO Javier, HERRERA NATIVI Vladimir

# Projet détection de symptomes radiologiques sur des X-rays 
 

## Structure du Rapport Notebook

Notre rapport sera présenté sous forme de notebook Jupyter ayant au fur et a mesure des explications grace a des markdownds, cette impkémentation nous permettra un projet plus interatifc et guidée. 
1. **Eplications** (cellules Markdown)  
   - Explications des méthodes  
   - Justifications des choix  
   - Analyse interprétative des résultats  

2. **Preuves exécutables** (cellules de code)  




## Contexte et Motivation  
Dans le domaine de la santé, l'intelligence artificielle ouvre des perspectives prometteuses pour l'aide au diagnostic, notamment dans l'analyse d'imagerie médicale. Ce projet s'inscrit dans cette idée, voulant exploiter le dataset NIH Chest X-ray 14 ([disponible sur Kaggle](https://www.kaggle.com/datasets/nih-chest-xrays/data)), contenant **112 120 radiographies thoraciques** annotées avec des informations cliniques et démographiques.  

Notre objectif ? 
- Eliminer les possibles biais par rapport a deux attributs protégés, "Patient Gender" et "Age" 
- Etudier les métriques associés au différents modèles

## Méthodologie Globale  
Le projet s'articule en deux phases complémentaires :  

1. **Pre-processing** :  
   - Rééchantillonnage/Réponderation équitable (Reweighting, DIR, Uniform Sampling)  
 

2. **Post-processing** :  
   - Ajustement des seuils de classification (Reject Option)  
   - Calibration des probabilités (Equalized Odds)  

L'évaluation s'appuie systématiquement sur la librairie AIF360.

## Imports


In [149]:
#IMPORTS
import pandas as pd
import numpy as np
from sklearn.preprocessing import MultiLabelBinarizer

# Datasets
import os 
from aif360.datasets import StandardDataset
from aif360.datasets import MEPSDataset19
from aif360.explainers import MetricTextExplainer

# Fairness metrics
from aif360.sklearn.metrics import *


#graphiques
import plotly.graph_objects as go
from plotly.subplots import make_subplots


# Modèles d'entrainement 
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipeline
from aif360.algorithms.preprocessing import *

## Chargement des données

In [150]:
data_dir = "HERRERA_NATIVI_VLADIMIR"
metadata_Vlad = pd.read_csv("HERRERA_NATIVI_VLADIMIR/metadata.csv")
metadata_Javi = pd.read_csv("PENA_CASTANO_JAVIER/metadata.csv")
# La prof ma parlé d'un tensorboard

In [151]:
print(f"Vladi : {metadata_Vlad.shape} | Javi : {metadata_Javi.shape}")

Vladi : (5627, 13) | Javi : (5477, 13)


### Choix des données utilisées:

On a choisi les données de vladimir simplement car il y a plus d'entrées, puis on a éliminé colonnes inutiles pour notre études et les lignes impossibles, incohérentes ou avec des valeurs incomplètes.

In [152]:
# Elimination des colonnes non necessaire pour notre étude initial
colonnes_a_eliminer = ['OriginalImage[Width','Height]', 'OriginalImagePixelSpacing[x', 'y]']
data = metadata_Vlad.drop(columns=colonnes_a_eliminer, inplace=False) 
data = data.loc[data['Patient Age'] <= 120] # On élimine les patients qui ont plus de 120 ans 
data.dropna()

Unnamed: 0,Image Index,Finding Labels,Follow-up #,Patient ID,Patient Age,Patient Gender,View Position,WEIGHTS,train
0,00000006_000.png,No Finding,0,6,81,M,PA,1,True
1,00000025_000.png,Effusion,0,25,71,M,PA,1,True
2,00000029_000.png,No Finding,0,29,59,F,PA,1,False
3,00000072_000.png,Atelectasis,0,72,67,F,PA,1,True
4,00000090_000.png,No Finding,0,90,67,F,PA,1,True
...,...,...,...,...,...,...,...,...,...
5622,00030752_000.png,No Finding,0,30752,64,F,AP,1,True
5623,00030772_000.png,No Finding,0,30772,26,F,AP,1,True
5624,00030772_001.png,Consolidation,1,30772,26,F,AP,1,True
5625,00030772_002.png,Consolidation,2,30772,26,F,AP,1,True


# Analyse quantitative des données 

In [153]:
data_graphiques = data.copy() 

On a crée plusieurs graphiques pour voir la repartition des données en fonction de l'age, le sexe et la position de vue.

In [154]:
#Affichage de graphiques pour la visualisation de la repartition de l'age, le follow up, le genre et la position
fig = make_subplots(rows = 2, cols=2, subplot_titles = ["Follow Up", "Age", "Gender", "Position"])
fig.add_trace (go.Histogram(x=data_graphiques['Follow-up #'], name= "follow up"), row = 1, col=1)
fig.add_trace (go.Histogram(x=data_graphiques['Patient Age'], name= "Age"), row = 1, col=2)
fig.add_trace (go.Histogram(x=data_graphiques['Patient Gender'], name= "Gender"), row = 2, col=1)
fig.add_trace (go.Histogram(x=data_graphiques['View Position'], name= "Position"), row = 2, col=2)

fig.update_layout(title = "Histograms")
fig.write_image("Histogrammes1.png")

Ici, on fait de même, mais on normalise les données et on sépare les personnes malades et les personnes saines.

Normaliser et séparer les données va nous permettre de comparer la proportion de personnes malades et saines en fonction de l'age, du genre et de la position de vue. Ceci nous a permit de répérer les attributs favorisés et les non favorisés: les attributs favorisés sont les femmes, PA et les jeunes (0-40 ans). Comme notre label a analyser est "Finding Labels" et notre valeur a favoriser est être sain ( "No Finding"), les attributs favorisés serons les attributs qui on la proportion sains/malades la plus haute.

In [155]:
# Créons d'abord une colonne pour identifier les patients malades et non malades
data_graphiques['Est_Malade'] = ~data_graphiques['Finding Labels'].str.contains('No Finding')
data_graphiques['status'] = data_graphiques['Est_Malade'].map({True: 'Malade', False: 'Non malade'})

# Histogramme pour l'âge
fig = make_subplots(rows=1, cols=3, subplot_titles=["Âge", "Genre", "Position"])

# Groupes d'âge
age_bins = [0, 40, 100]  # Définir 4 tranches d'âge
age_labels = ['0-40', '41-100+']
data_graphiques['age_group'] = pd.cut(data_graphiques['Patient Age'], bins=age_bins, labels=age_labels)

# Compte normalisé par groupe d'âge et par statut (malade/non malade)
age_counts = data_graphiques.groupby(['age_group', 'status']).size().unstack(fill_value=0)
age_counts_normalized = age_counts.div(age_counts.sum(axis=0), axis=1)

# Ajout du trace pour l'âge
for status, color in zip(['Malade', 'Non malade'], ['red', 'green']):
    if status in age_counts_normalized.columns:
        fig.add_trace(
            go.Bar(
                x=age_counts_normalized.index,
                y=age_counts_normalized[status],
                name=status,
                marker_color=color
            ),
            row=1, col=1
        )

# Histogramme pour le genre
gender_counts = data_graphiques.groupby(['Patient Gender', 'status']).size().unstack(fill_value=0)
gender_counts_normalized = gender_counts.div(gender_counts.sum(axis=0), axis=1)

for status, color in zip(['Malade', 'Non malade'], ['red', 'green']):
    if status in gender_counts_normalized.columns:
        fig.add_trace(
            go.Bar(
                x=gender_counts_normalized.index,
                y=gender_counts_normalized[status],
                name=status,
                marker_color=color,
                showlegend=False
            ),
            row=1, col=2
        )

# Histogramme pour la position
position_counts = data_graphiques.groupby(['View Position', 'status']).size().unstack(fill_value=0)
position_counts_normalized = position_counts.div(position_counts.sum(axis=0), axis=1)

for status, color in zip(['Malade', 'Non malade'], ['red', 'green']):
    if status in position_counts_normalized.columns:
        fig.add_trace(
            go.Bar(
                x=position_counts_normalized.index,
                y=position_counts_normalized[status],
                name=status,
                marker_color=color,
                showlegend=False
            ),
            row=1, col=3
        )

# Mise à jour de la mise en page
fig.update_layout(
    title="Distribution normalisée par catégorie (Malades vs Non malades)",
    height=500,
    width=1200,
    bargap=0.1,
    bargroupgap=0.2,
)

fig.update_yaxes(title_text="Proportion", range=[0, 1])
fig.update_xaxes(title_text="Groupe d'âge", row=1, col=1)
fig.update_xaxes(title_text="Genre", row=1, col=2)
fig.update_xaxes(title_text="Position", row=1, col=3)

# Sauvegarde de l'image
fig.write_image("Histogrammes_normalises.png")





## Encodage des dataframes

In [156]:
# Encodage binaire pour Patient Gender et View Position
data['Patient Gender'] = (data['Patient Gender'] == 'F').astype(int) # F est associé a la valeur 1 
data['View Position'] = (data['View Position'] == 'AP').astype(int) # AP est associé a la valeur 1  

# On effectue un encodage binaire pour finding labels du fait qu'on s'interesse uniquement au fait d'être malade ou pas (on n'essaye pas de prédire les maladies)
data['Finding Labels'] = (data['Finding Labels'] == 'No Finding').astype(int) # No Finding est associé a la valeur 1 


In [157]:

# Sauvegarder une fois que le pretraitement sera fait 
data.to_csv(f"{data_dir}/metadata_encod.csv", index=False) # sauvegarde de csv encodé 

# Pre processing

## Première methode naïve de pre-processing : reweighting

### Première aproche a la main pour "Patient Gender"

On commence avec le pre-processing, et on utilise la méthode du cours "Repondération des données".

Pour bien comprendre l'algorithme utilisé, on choisi de faire à la main le premier calcul de poids pour le genre.


In [158]:

# -------------------------------------------  Répondération en fonction du genre  -------------------------------------------
nbtotSexe =  (data["Patient Gender"]).count()
nbFemmes = (data["Patient Gender"] == 1).sum()
nbHommes = (data["Patient Gender"] == 0).sum()
nbMalades = (data["Finding Labels"] == 0).sum()
nbSains = nbtotSexe - nbMalades

# études pour les femmes
nbFemmesMalades = ((data["Patient Gender"] == 1) & (data["Finding Labels"] == 0)).sum()
nbFemmesSain = nbFemmes - nbFemmesMalades
propFMF = nbFemmesMalades / nbFemmes
propFM = nbFemmesMalades / nbtotSexe
propFS = 1 - propFM
propFSF = 1 - propFMF

# étude pour les hommes
nbHommesMalades = ((data["Patient Gender"] == 0) & (data["Finding Labels"] == 0)).sum()
nbHommesSain = nbHommes - nbHommesMalades
propHMH = nbHommesMalades / nbHommes  # proportions des Hommes malades sur popHommes 
propHM = nbHommesMalades / nbtotSexe 
propHS = 1 - propHM
propHSH = 1 - propHMH  # proportions des Hommes sains sur popHommes 


poidsFM = (nbFemmes * nbMalades) / (nbFemmesMalades * nbtotSexe)
poidsFS = (nbFemmes * nbSains) / (nbFemmesSain * nbtotSexe)

poidsHM = (nbHommes * nbMalades) / (nbHommesMalades * nbtotSexe)
poidsHS = (nbHommes * nbSains) / (nbHommesSain * nbtotSexe)

print(f"Poids calculées pour les sexes :\nFemme Malade : {poidsFM}\nFemme Saine : {poidsFS}\nHomme Malade : {poidsHM}\nHomme Sain : {poidsHS}\n")

Poids calculées pour les sexes :
Femme Malade : 1.033302225044209
Femme Saine : 0.9734456018962356
Homme Malade : 0.9754662395970608
Homme Sain : 1.0217508263870834



### Implémentation de l'algorithme automatisé

Ensuite, après avoir compris l'algo, on a mit en place une fonction "re_sampling_naive", qui prend en argument un dataframe D, un attribut S, et le label ("Finding Labels" dans ce cas).

Après avoir appliquer l'algorithme à la position de vue et a l'age, les nouveau poids on était calculés et enregistrés dans u tableau. D'autre part, on a affecté les poids a des variables à la main.

In [159]:
# Favorisés : Jeunes (0-20 ans), Femmes (F), PA

# Défavorisés : Adultes (41-80 ans),Hommes(M),AP

def groupes_bw(S):
    if S == "Patient Gender":
        return [0, 1]
    elif S == "View Position":
        return [1, 0]
    elif S == "Age Group":
        return [1, 0]


def re_sampling_naive(D, S, Label):
    W = []
    groupes = groupes_bw(S)
    for s in groupes:
        for c in [0, 1]:  # classes - et +
            num = ((D[S] == s).sum())*((D[Label]==c).sum())
            denom = (((D[S] == s) & (D[Label] == c)).sum()) * D.shape[0]
            poid =   num / denom
            W.append(poid)
    return W


In [160]:
poids_VP = re_sampling_naive(data,"View Position", "Finding Labels" )

poidsAPM = poids_VP[0]
poidsAPS = poids_VP[1]

poidsPAM = poids_VP[2]
poidsPAS = poids_VP[3]
poids_VP

[np.float64(0.8660089311858132),
 np.float64(1.150692505153632),
 np.float64(1.1149736044363807),
 np.float64(0.9197266785927081)]

En vue que les ages ne sont pas binaires, on a crée un attribut de data 'Age Group', qui sépare les jeunes (0 - 39 ans) et les vieux (40 - 120), puis on applique l'algo a cet attribut.

In [161]:
seuil_age = 40
data['Age Group'] = np.where(data['Patient Age'] >= seuil_age, 1, 0) # 1 répresent les "vieux"

poids_AGE = re_sampling_naive(data,"Age Group", "Finding Labels" )

poidsVieuxM = poids_AGE[0]
poidsVieuxS = poids_AGE[1]

poidsJeunesM = poids_AGE[2]
poidsJeunesS = poids_AGE[3]
poids_AGE

[np.float64(0.9855372894715779),
 np.float64(1.0125771911382422),
 np.float64(1.0322783050765911),
 np.float64(0.9742161286775578)]

Après affecter toutes les poids calculés, on introduit 3 colonnes avec les poids calculés a notre dataframe non encodé.

In [162]:
# Création des nouvelles colonnes avec des valeurs par défaut
# On supprime les colonnes inutiles et on filtre les patients de plus de 120 ans
data_c = metadata_Vlad.drop(columns=colonnes_a_eliminer, inplace=False)  
data_c = data_c.loc[data_c['Patient Age'] <= 120]  # Élimine les patients âgés de plus de 120 ans

# Création des colonnes de poids avec des valeurs par défaut à 1.0
data_c['Age Group'] = np.where(data_c['Patient Age'] >= seuil_age, 1, 0)  # Binarisation de l'âge (1 = vieux, 0 = jeune)
data_c['poids_reweigth_gender'] = 1.0  # Poids par défaut pour le genre
data_c['poids_reweigth_PA'] = 1.0      # Poids par défaut pour la position (AP/PA)
data_c['poids_reweigth_age'] = 1.0      # Poids par défaut pour l'âge

# Attribution des poids en fonction du genre et de l'état de santé
# Pour les femmes (Genre = "F")
data_c.loc[(data_c['Patient Gender'] == "F") & (data_c['Finding Labels'] != "No Finding"), 'poids_reweigth_gender'] = poidsFM  # Femmes malades
data_c.loc[(data_c['Patient Gender'] == "F") & (data_c['Finding Labels'] == "No Finding"), 'poids_reweigth_gender'] = poidsFS    # Femmes saines

# Pour les hommes (Genre = "M")
data_c.loc[(data_c['Patient Gender'] == "M") & (data_c['Finding Labels'] != "No Finding"), 'poids_reweigth_gender'] = poidsHM  # Hommes malades
data_c.loc[(data_c['Patient Gender'] == "M") & (data_c['Finding Labels'] == "No Finding"), 'poids_reweigth_gender'] = poidsHS    # Hommes sains

# Attribution des poids en fonction de la position (AP/PA) et de l'état de santé
# Pour la position AP (View Position = "AP")
data_c.loc[(data_c['View Position'] == "AP") & (data_c['Finding Labels'] != "No Finding"), 'poids_reweigth_PA'] = poidsAPM  # AP malade
data_c.loc[(data_c['View Position'] == "AP") & (data_c['Finding Labels'] == "No Finding"), 'poids_reweigth_PA'] = poidsAPS    # AP sain

# Pour la position PA (View Position = "PA")
data_c.loc[(data_c['View Position'] == "PA") & (data_c['Finding Labels'] != "No Finding"), 'poids_reweigth_PA'] = poidsPAM  # PA malade
data_c.loc[(data_c['View Position'] == "PA") & (data_c['Finding Labels'] == "No Finding"), 'poids_reweigth_PA'] = poidsPAS    # PA sain

# Attribution des poids en fonction de l'âge et de l'état de santé
# Pour les patients âgés (Age Group = 1)
data_c.loc[(data_c['Age Group'] == 1) & (data_c['Finding Labels'] != "No Finding"), 'poids_reweigth_age'] = poidsVieuxM  # Âgé malade
data_c.loc[(data_c['Age Group'] == 1) & (data_c['Finding Labels'] == "No Finding"), 'poids_reweigth_age'] = poidsVieuxS    # Âgé sain

# Pour les patients jeunes (Age Group = 0)
data_c.loc[(data_c['Age Group'] == 0) & (data_c['Finding Labels'] != "No Finding"), 'poids_reweigth_age'] = poidsJeunesM  # Jeune malade
data_c.loc[(data_c['Age Group'] == 0) & (data_c['Finding Labels'] == "No Finding"), 'poids_reweigth_age'] = poidsJeunesS    # Jeune sain

# Sauvegarde du nouveau jeu de données avec les poids
data_c.to_csv("HERRERA_NATIVI_VLADIMIR/metadata_c_with_weights.csv", index=False)



## Uniform-Sampling reweighting

Maintenant on s'intéresse a un deuxième algorithme du cours: Uniform sampling.

In [163]:
# Favorisés : Jeunes (0-20 ans), Femmes (F), PA

# Défavorisés : Adultes (41-80 ans), Hommes (M), AP

def uniform_sampling(D, S, Label):
    W = []
    groupes = groupes_bw(S)
    for s in groupes:
        for c in [0, 1]:
            num = ((D[S] == s).sum())*((D[Label]==c).sum())
            denom = (((D[S] == s) & (D[Label] == c)).sum()) * D.shape[0]
            poid = num / denom
            W.append(poid)

    nb_DN = ((D[S] == groupes[0]) & (D[Label] == 0)).sum()
    nb_DP = ((D[S] == groupes[0]) & (D[Label] == 1)).sum()
    nb_FN = ((D[S] == groupes[1]) & (D[Label] == 0)).sum()
    nb_FP = ((D[S] == groupes[1]) & (D[Label] == 1)).sum()

    nb_samples_DN = int(W[0]*nb_DN)
    nb_samples_DP = int(W[1]*nb_DP)
    nb_samples_FN = int(W[2]*nb_FN)
    nb_samples_FP = int(W[3]*nb_FP)

    samples_DN = D[(D[S] == groupes[0]) & (D[Label] == 0)].sample(n=nb_samples_DN, replace=True)  
    samples_DP = D[(D[S] == groupes[0]) & (D[Label] == 1)].sample(n=nb_samples_DP, replace=True)
    samples_FN = D[(D[S] == groupes[1]) & (D[Label] == 0)].sample(n=nb_samples_FN, replace=True)
    samples_FP = D[(D[S] == groupes[1]) & (D[Label] == 1)].sample(n=nb_samples_FP, replace=True)
    
    df_resampled = pd.concat([samples_DN, samples_DP, samples_FN, samples_FP])

    return df_resampled

On a constaté que l'attribut "View Position" ne peut pas être un biais car ça n'as pas de sense de discriminer quelqu'un par la "View Position".

Ici, on affecte "df_sexe" et "df_age" avec Uniform Sampling, et on sauvegarde le dataframe pour l'entreiner plus tard dans le fichier "train_classifieur.ipynb".

In [164]:
# Favorisés : Jeunes (0-20 ans), Femmes (F), PA
# Défavorisés : Adultes (41-80 ans), Hommes (M), AP

df_sexe = uniform_sampling(data, "Patient Gender", "Finding Labels")
df_age = uniform_sampling(data, "Patient Gender", "Finding Labels")


df_sexe.to_csv("HERRERA_NATIVI_VLADIMIR/metadata_uniform_genre.csv", index=False)
df_age.to_csv("HERRERA_NATIVI_VLADIMIR/metadata_uniform_age.csv", index=False)

# AIF360

On veut maintenant appliquer les méthodes de fairness en utilisant directement la bibliothèque AIF360.

Dans un premier temps, on fait une table de correspondance pour pouvoir recupérer les "Image Index", pour pouvoir bien entraîner nas modèles.

In [165]:
# Transformation du type de la colonne Image Index (string) en int et création de la table de correspondance 

mapping_dict = {val: idx for idx, val in enumerate(data['Image Index'].unique())}
data['Image Index'] = data['Image Index'].map(mapping_dict)
mapping_table = pd.DataFrame(list(mapping_dict.items()), columns=['Ancien Image Index', 'Nouveau Index'])


Ensuite, on diviser notre dataframe en 2: Validation et Entraînement

In [166]:
data_train = data[data["train"] == True].copy()
data_val = data[data["train"] == False].copy()

### Creer une instance de StandardDataset de AIF360

On encode nos données au cas où il ne sont pas encore encodés pour pouvoir ensuite transformer notre dataframe en DataSet.

In [167]:
# Création d'un dictionnaire pour gérer les colonnes catégorielles encodées en one-hot
# Ce dictionnaire va associer chaque nom de colonne catégorielle originale
# à la liste des colonnes one-hot correspondantes dans le DataFrame

categorical_columns_dic = {}
for col in data.columns:
    col_split = col.split("=")
    if len(col_split) > 1:
        cat_col = col_split[0]
        if not (cat_col in categorical_columns_dic.keys()):
            categorical_columns_dic[cat_col] = []
        categorical_columns_dic[cat_col].append(col)
categorical_features = categorical_columns_dic.keys()

### Transformation des dataFrames en Dataset

Comme dans les TDs, on trans les dataFrames de train, valid et général en Dataset, prennant en considération les attributs sur lesquels on va travailler, le label utilisé, la classe favorable et les classes privilégiés.

In [168]:
MyDataset_train = StandardDataset(
    df=data_train,
    label_name="Finding Labels",
    favorable_classes=[1],
    protected_attribute_names=["Patient Gender", "Age Group"],
    privileged_classes=[[1],[0]], # a analyser 
    categorical_features=categorical_features,
    na_values=["?", "Unknown/Invalid"],
    custom_preprocessing=None,
    metadata=None,
)

MyDataset_val = StandardDataset(
    df=data_val,
    label_name="Finding Labels",
    favorable_classes=[1],
    protected_attribute_names=["Patient Gender","Age Group"],
    privileged_classes=[[1],[0]], # a analyser 
    categorical_features=categorical_features,
    na_values=["?", "Unknown/Invalid"],
    custom_preprocessing=None,
    metadata=None,
)

MyDataset = StandardDataset(
    df=data,
    label_name="Finding Labels",
    favorable_classes=[1],
    protected_attribute_names=["Patient Gender","Age Group"],
    privileged_classes=[[1],[0]], # a analyser 
    categorical_features=categorical_features,
    na_values=["?", "Unknown/Invalid"],
    custom_preprocessing=None,
    metadata=None,
)

## Pre-processing : Implémentations Reweighing AIF360

Dans cette partie, on a constaté que le Reweighing AIF360 effectué le même calcul qu'on a fait au début du pre-processing. 
Cependant, pour la méthode avec AIF360, on a séparé l'entrainement et la validation, et c'est pour cela qu'on a des poids diférents qu'au début.

In [169]:
sens_ind = 0
sens_attr = MyDataset_train.protected_attribute_names[sens_ind]
unprivileged_groups = [
    {sens_attr: v}
    for v in MyDataset_train.unprivileged_protected_attributes[sens_ind]
]
privileged_groups = [
    {sens_attr: v}
    for v in MyDataset_train.privileged_protected_attributes[sens_ind]
]
sens_attr, unprivileged_groups, privileged_groups

('Patient Gender',
 [{'Patient Gender': np.float64(0.0)}],
 [{'Patient Gender': np.float64(1.0)}])

#### Reweighing sur le genre

Pour les deux cas de Reweighing, on affecte les trois variables dataset_transf_train, dataset_transf_val et dataset_transf, après avoir entrainé notre model. 
"dataset_transf" va nous permettre d'alloué les nouveaux poids calculés pour l'entrainement sans probèmes de taille dans notre fichier csv avec le reste des poids.

In [None]:
RW_gender = Reweighing(
    unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups
)

RW_gender.fit(MyDataset_train)

dataset_transf = RW_gender.transform(MyDataset)

dataset_transf_train = RW_gender.transform(MyDataset_train)
dataset_transf_val = RW_gender.transform(MyDataset_val)

#### Reweighing sur l'âge

In [172]:
sens_ind_age = 1
sens_attr_age = MyDataset_train.protected_attribute_names[sens_ind_age]
unprivileged_groups_age = [
    {sens_attr_age: v}
    for v in MyDataset_train.unprivileged_protected_attributes[sens_ind_age]
]
privileged_groups_age = [
    {sens_attr_age: v}
    for v in MyDataset_train.privileged_protected_attributes[sens_ind_age]
]
sens_attr_age, unprivileged_groups_age, privileged_groups_age

('Age Group',
 [{'Age Group': np.float64(1.0)}],
 [{'Age Group': np.float64(0.0)}])

In [None]:
RW_age = Reweighing(
    unprivileged_groups=unprivileged_groups_age, privileged_groups=privileged_groups_age
)

RW_age.fit(MyDataset_train)

dataset_transf_age = RW_age.transform(MyDataset)

dataset_transf_age_train = RW_age.transform(MyDataset_train)
dataset_trans_age_val = RW_age.transform(MyDataset_val)


On introduit deux colonnes avec les poids calculés a notre dataframe non encodé, de manière "automatique".

In [None]:
# Ajout des weights calculés avec aif360
data_c["weights_gender_aif360"] = dataset_transf.instance_weights
data_c["weights_age_aif360"] = dataset_transf_age.instance_weights
# Sauvegarder data_c mit à jour avec les nouvelles colonnes
data_c.to_csv("HERRERA_NATIVI_VLADIMIR/metadata_c_with_weights.csv", index=False)
data_c


Unnamed: 0,Image Index,Finding Labels,Follow-up #,Patient ID,Patient Age,Patient Gender,View Position,WEIGHTS,train,Age Group,poids_reweigth_gender,poids_reweigth_PA,poids_reweigth_age,weights_gender_aif360,weights_age_aif360
0,00000006_000.png,No Finding,0,6,81,M,PA,1,True,1,1.021751,0.919727,1.012577,0.993727,0.997075
1,00000025_000.png,Effusion,0,25,71,M,PA,1,True,1,0.975466,1.114974,0.985537,1.008043,1.003722
2,00000029_000.png,No Finding,0,29,59,F,PA,1,False,1,0.973446,0.919727,1.012577,1.007274,0.997075
3,00000072_000.png,Atelectasis,0,72,67,F,PA,1,True,1,1.033302,1.114974,0.985537,0.990955,1.003722
4,00000090_000.png,No Finding,0,90,67,F,PA,1,True,1,0.973446,0.919727,1.012577,1.007274,0.997075
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5622,00030752_000.png,No Finding,0,30752,64,F,AP,1,True,1,0.973446,1.150693,1.012577,1.007274,0.997075
5623,00030772_000.png,No Finding,0,30772,26,F,AP,1,True,0,0.973446,1.150693,0.974216,1.007274,1.005441
5624,00030772_001.png,Consolidation,1,30772,26,F,AP,1,True,0,1.033302,0.866009,1.032278,0.990955,0.993207
5625,00030772_002.png,Consolidation,2,30772,26,F,AP,1,True,0,1.033302,0.866009,1.032278,0.990955,0.993207


## Disparate Impact Remover 



In [175]:
# Disparate Impact Remover : PATIENT GENDER 

DIR_gender = DisparateImpactRemover(repair_level=1.0, sensitive_attribute="Patient Gender")

DIR_gender.fit(MyDataset_train)

dataset_transf_dir_gender = DIR_gender.fit_transform(MyDataset)
dataset_transf_dir_gender_train = DIR_gender.fit_transform(MyDataset_train)
dataset_transf_dir_gender_val = DIR_gender.fit_transform(MyDataset_val)

dataset_transf_dir_gender_train

               instance weights    features                         \
                                                                     
                                Image Index Follow-up # Patient ID   
instance names                                                       
0                           1.0         0.0         0.0        6.0   
1                           1.0         1.0         0.0       25.0   
3                           1.0         0.0         0.0        6.0   
4                           1.0         1.0         0.0       25.0   
5                           1.0         5.0         0.0       25.0   
...                         ...         ...         ...        ...   
5622                        1.0      5615.0         0.0    30711.0   
5623                        1.0      5618.0         0.0    30772.0   
5624                        1.0      5619.0         0.0    30772.0   
5625                        1.0      5624.0         1.0    30772.0   
5626                

In [176]:
# Disparate Impact Remover : AGE GROUP

DIR_age = DisparateImpactRemover(repair_level=1.0, sensitive_attribute="Age Group")
DIR_age.fit(MyDataset_train)

dataset_transf_dir_age = DIR_age.fit_transform(MyDataset)
dataset_transf_dir_age_train = DIR_age.fit_transform(MyDataset_train)
dataset_transf_dir_age_val = DIR_age.fit_transform(MyDataset_val)

dataset_transf_dir_age_train

               instance weights    features                         \
                                                                     
                                Image Index Follow-up # Patient ID   
instance names                                                       
0                           1.0         0.0         0.0        6.0   
1                           1.0         0.0         0.0        6.0   
3                           1.0         3.0         0.0       72.0   
4                           1.0         3.0         0.0       72.0   
5                           1.0         5.0         1.0       72.0   
...                         ...         ...         ...        ...   
5622                        1.0      5619.0         0.0    30711.0   
5623                        1.0      5612.0         0.0    30687.0   
5624                        1.0      5613.0         1.0    30687.0   
5625                        1.0      5617.0         2.0    30687.0   
5626                

In [177]:
data_transformed_gender = dataset_transf_dir_gender.convert_to_dataframe()[0]
data_transformed_age = dataset_transf_dir_age.convert_to_dataframe()[0]


# Ajouter les données transformées au DataFrame existant
# Vous pouvez ajouter les colonnes nécessaires de `data_transformed_gender` au DataFrame `data_dir_gender`
data_dir_gender = data_transformed_gender.copy()
data_dir_age = data_transformed_age.copy()

data_dir_age

Unnamed: 0,Image Index,Follow-up #,Patient ID,Patient Age,Patient Gender,View Position,WEIGHTS,train,Age Group,Finding Labels
0,0.0,0.0,6.0,32.0,0.0,0.0,1.0,1.0,1.0,1.0
1,0.0,0.0,6.0,25.0,0.0,0.0,1.0,1.0,1.0,0.0
2,2.0,0.0,29.0,16.0,1.0,0.0,1.0,0.0,1.0,1.0
3,2.0,0.0,29.0,22.0,1.0,0.0,1.0,1.0,1.0,0.0
4,4.0,0.0,90.0,22.0,1.0,0.0,1.0,1.0,1.0,1.0
...,...,...,...,...,...,...,...,...,...,...
5622,5619.0,0.0,30711.0,19.0,1.0,1.0,1.0,1.0,1.0,1.0
5623,5610.0,0.0,30687.0,26.0,1.0,1.0,1.0,1.0,0.0,1.0
5624,5613.0,1.0,30687.0,26.0,1.0,1.0,1.0,1.0,0.0,0.0
5625,5617.0,2.0,30687.0,26.0,1.0,1.0,1.0,1.0,0.0,0.0


In [178]:
# Créer un dictionnaire inverse où les clés sont les nouveaux index et les valeurs sont les anciens noms
inverse_mapping = {v: k for k, v in mapping_dict.items()}

# Appliquer ce mapping inverse à data_dir_gender et à data_dir_age pour retrouver les noms originaux
data_dir_gender['Image Index'] = data_dir_gender['Image Index'].map(inverse_mapping)
data_dir_age['Image Index'] = data_dir_age['Image Index'].map(inverse_mapping)


In [179]:
data_dir_gender.to_csv("HERRERA_NATIVI_VLADIMIR/metadata_DIR_genre.csv", index=False)
data_dir_age.to_csv("HERRERA_NATIVI_VLADIMIR/metadata_DIR_age.csv", index=False)

## Cacul de metriques suite au pre-processing

In [180]:
def get_group_metrics(
    y_true,
    y_pred=None,
    prot_attr=None,
    priv_group=1,
    pos_label=1,
    sample_weight=None,
):
    group_metrics = {}
    group_metrics["base_rate"] = base_rate(
        y_true=y_true, pos_label=pos_label, sample_weight=sample_weight
    )
    group_metrics["statistical_parity_difference"] = statistical_parity_difference(
        y_true=y_true, y_pred=y_pred, prot_attr=prot_attr, priv_group=priv_group, pos_label=pos_label, sample_weight=sample_weight
    )
    group_metrics["disparate_impact_ratio"] = disparate_impact_ratio(
        y_true=y_true, y_pred=y_pred, prot_attr=prot_attr, priv_group=priv_group, pos_label=pos_label, sample_weight=sample_weight
    )
    if not y_pred is None:
        group_metrics["equal_opportunity_difference"] = equal_opportunity_difference(
            y_true=y_true, y_pred=y_pred, prot_attr=prot_attr, priv_group=priv_group, pos_label=pos_label, sample_weight=sample_weight
        )
        group_metrics["average_odds_difference"] = average_odds_difference(
            y_true=y_true, y_pred=y_pred, prot_attr=prot_attr, priv_group=priv_group, pos_label=pos_label, sample_weight=sample_weight
        )
        group_metrics["conditional_demographic_disparity"] = conditional_demographic_disparity(
            y_true=y_true, y_pred=y_pred, prot_attr=prot_attr, pos_label=pos_label, sample_weight=sample_weight
        )
        group_metrics["smoothed_edf"] = smoothed_edf(
        y_true=y_true, y_pred=y_pred, prot_attr=prot_attr, pos_label=pos_label, sample_weight=sample_weight
        )
        group_metrics["df_bias_amplification"] = df_bias_amplification(
        y_true=y_true, y_pred=y_pred, prot_attr=prot_attr, pos_label=pos_label, sample_weight=sample_weight
        )
    return group_metrics

In [None]:
metrics_orig = get_group_metrics(
    y_true=data["Finding Labels"],  # Utilisez .labels pour accéder aux étiquettes
    priv_group=1,
    pos_label=1,  
    sample_weight = data_c.WEIGHTS
)

# Pour les données transformées par Reweighing pour le sexe
metrics_rw_gender = get_group_metrics(
    y_true=data["Finding Labels"],  # Utilisez .labels pour accéder aux étiquettes
    prot_attr=data["Patient Gender"],  # L'attribut protégé (ici "Patient Gender")
    priv_group=1,
    pos_label=1,  
    sample_weight = data_c.weights_gender_aif360
)

# Pour les données transformées par Reweighing pour l'âge
metrics_rw_age = get_group_metrics(
    y_true=data["Finding Labels"],  
    prot_attr=data["Age Group"], 
    priv_group=0,
    pos_label=1,
    sample_weight=data_c.weights_age_aif360
)

# Pour les données transformées par DisparateImpactRemover pour le sexe
metrics_dir_gender = get_group_metrics(
    y_true=data_dir_gender["Finding Labels"],  
    prot_attr=data_dir_gender["Patient Gender"], 
    priv_group=1,
    pos_label=1,
    sample_weight=data_dir_gender.WEIGHTS
)

# Pour les données transformées par DisparateImpactRemover pour l'âge
metrics_dir_age = get_group_metrics(
    y_true=data_dir_gender["Finding Labels"],  
    prot_attr=data_dir_age["Age Group"], 
    priv_group=0,
    pos_label=1,
    sample_weight=data_dir_age.WEIGHTS
)

# Pour les données transformées par DisparateImpactRemover pour le sexe
metrics_uniform_gender = get_group_metrics(
    y_true=df_sexe["Finding Labels"],  
    prot_attr=df_sexe["Patient Gender"], 
    priv_group=1,
    pos_label=1,
    sample_weight=df_sexe.WEIGHTS
)

# Pour les données transformées par DisparateImpactRemover pour l'âge
metrics_uniform_age = get_group_metrics(
    y_true=df_age["Finding Labels"],  
    prot_attr=df_age["Age Group"], 
    priv_group=0,
    pos_label=1,
    sample_weight=df_age.WEIGHTS
)



# Afficher ou analyser les résultats
print("Métriques originales:", metrics_orig , "\n")
print("Métriques après Reweighing (Gender):", metrics_rw_gender, "\n")
print("Métriques après Reweighing (Age):", metrics_rw_age, "\n")
print("Métriques après Disparate Impact Remover (Gender):", metrics_dir_gender, "\n")
print("Métriques après Disparate Impact Remover (Age):", metrics_dir_age, "\n")
print("Métriques après Uniform Sampling (Gender):", metrics_uniform_gender, "\n")
print("Métriques après Uniform Sampling  (Age):", metrics_uniform_age, "\n")


Métriques originales: {'base_rate': np.float64(0.5415926057589762), 'statistical_parity_difference': np.float64(0.5416888888888889), 'disparate_impact_ratio': 0.0} 

Métriques après Reweighing (Gender): {'base_rate': np.float64(0.5413524681936874), 'statistical_parity_difference': np.float64(-0.03389554132548789), 'disparate_impact_ratio': 0.9395148406767924}
Métriques après Reweighing (Age): {'base_rate': np.float64(0.541431091861975), 'statistical_parity_difference': np.float64(-0.02573446024774384), 'disparate_impact_ratio': 0.9539589999836494}
Métriques après Disparate Impact Remover (Gender): {'base_rate': np.float64(0.5415926057589762), 'statistical_parity_difference': np.float64(-0.02630329442442525), 'disparate_impact_ratio': 0.9527230874266526}
Métriques après Disparate Impact Remover (Age): {'base_rate': np.float64(0.5415926057589762), 'statistical_parity_difference': np.float64(-0.02106104410981824), 'disparate_impact_ratio': 0.9621154191538104}
Métriques après Uniform Sampl


Ratio is ill-defined and being set to 0.0 due to no positive privileged samples. Use `zero_division` parameter to control this behavior.



# Post-processing


### On effectuera une regression logistique qui nos permettra d'obtenir les probabiltés de predictions

## Reject-option classification

In [183]:
from aif360.algorithms.postprocessing import RejectOptionClassification
from aif360.metrics import ClassificationMetric
import pandas as pd

def single_attribute_fairness_analysis(dataset_train, dataset_val, protected_attributes):
    """
    Perform ROC fairness adjustment for each protected attribute separately
    
    Args:
        dataset_train: AIF360 training dataset
        dataset_val: AIF360 validation dataset
        protected_attributes: List of protected attribute names to analyze
        
    Returns:
        Dictionary of fairness metrics per attribute
    """
    # 1. Train base model
    model = LogisticRegression(max_iter=1000, solver='lbfgs', random_state=42)
    model.fit(dataset_train.features, dataset_train.labels.ravel())
    
    # 2. Get predicted scores
    val_scores = model.predict_proba(dataset_val.features)[:, 1]
    val_pred = dataset_val.copy(deepcopy=True)
    val_pred.scores = val_scores.reshape(-1, 1)
    
    results = {}
    
    for attr in protected_attributes:
        print(f"\n{'='*40}\nAnalyzing attribute: {attr}\n{'='*40}")
        
        # 3. Get attribute-specific groups
        attr_idx = dataset_val.protected_attribute_names.index(attr)
        privileged_group = [{attr: dataset_val.privileged_protected_attributes[attr_idx][0]}]
        unprivileged_group = [{attr: v} for v in dataset_val.unprivileged_protected_attributes[attr_idx]]
        
        # 4. Configure ROC
        roc = RejectOptionClassification(
            unprivileged_groups=unprivileged_group,
            privileged_groups=privileged_group,
            metric_name="Statistical parity difference",
            metric_ub=0.05,
            metric_lb=-0.05,
            low_class_thresh=0.01,
            high_class_thresh=0.99,
            num_class_thresh=50,
            num_ROC_margin=30,
        )
        
        # 5. Fit and predict
        roc.fit(dataset_val, val_pred)
        fair_pred = roc.predict(val_pred)
        
        # 6. Calculate metrics
        metric = ClassificationMetric(
            dataset_val,
            fair_pred,
            unprivileged_groups=unprivileged_group,
            privileged_groups=privileged_group
        )
        
        # Store results
        results[attr] = {
            'threshold': roc.classification_threshold,
            'margin': roc.ROC_margin,
            'spd': metric.statistical_parity_difference(),
            'eod': metric.equal_opportunity_difference(),
            'aod': metric.average_odds_difference()
        }
        
        # Print results
        print(f"\n{attr} fairness metrics:")
        print(f"  Optimal threshold: {results[attr]['threshold']:.4f}")
        print(f"  Statistical parity difference: {results[attr]['spd']:.4f}")
        print(f"  Equal opportunity difference: {results[attr]['eod']:.4f}")
        print(f"  Average odds difference: {results[attr]['aod']:.4f}")
    
    return results

# =================================================================
# Usage with your dataset
# =================================================================

# List of protected attributes to analyze separately
protected_attributes = ["Patient Gender", "Age Group"]

# Run analysis
metrics_results = single_attribute_fairness_analysis(
    MyDataset_train,
    MyDataset_val,
    protected_attributes
)

# Optional: Create combined fair predictions
final_predictions = MyDataset_val.copy(deepcopy=True)
for attr in protected_attributes:
    # Get attribute-specific predictions
    attr_idx = MyDataset_val.protected_attribute_names.index(attr)
    privileged_group = [{attr: MyDataset_val.privileged_protected_attributes[attr_idx][0]}]
    unprivileged_group = [{attr: v} for v in MyDataset_val.unprivileged_protected_attributes[attr_idx]]
    
    roc = RejectOptionClassification(
        unprivileged_groups=unprivileged_group,
        privileged_groups=privileged_group,
        metric_name="Statistical parity difference",
        metric_ub=0.05,
        metric_lb=-0.05
    ).fit(MyDataset_val, final_predictions)
    
    final_predictions = roc.predict(final_predictions)

print("\nFinal combined metrics:")
combined_metric = ClassificationMetric(
    MyDataset_val,
    final_predictions,
    unprivileged_groups=unprivileged_groups,
    privileged_groups=privileged_groups
)
print(f"Statistical parity difference: {combined_metric.statistical_parity_difference():.4f}")
print(f"Equal opportunity difference: {combined_metric.equal_opportunity_difference():.4f}")


Analyzing attribute: Patient Gender

Patient Gender fairness metrics:
  Optimal threshold: 0.4900
  Statistical parity difference: 0.0288
  Equal opportunity difference: 0.0466
  Average odds difference: 0.0454

Analyzing attribute: Age Group

Age Group fairness metrics:
  Optimal threshold: 0.4900
  Statistical parity difference: 0.0135
  Equal opportunity difference: 0.0440
  Average odds difference: 0.0242



Unable to satisy fairness constraints




Final combined metrics:
Statistical parity difference: -0.1098
Equal opportunity difference: 0.0000


## Calibrated Equalized-Odds

In [184]:
from aif360.algorithms.postprocessing.calibrated_eq_odds_postprocessing import CalibratedEqOddsPostprocessing

def calibrated_eq_odds_analysis(dataset_train, dataset_val, protected_attributes, cost_constraint="fnr"):
    """
    Perform Calibrated Equalized Odds fairness adjustment for each protected attribute
    
    Args:
        dataset_train: AIF360 training dataset
        dataset_val: AIF360 validation dataset
        protected_attributes: List of protected attribute names
        cost_constraint: Optimization target ("fnr", "fpr", or "weighted")
        
    Returns:
        Dictionary of fairness metrics per attribute
    """
    # 1. Train base model
    model = LogisticRegression(max_iter=1000, solver='lbfgs', random_state=42)
    model.fit(dataset_train.features, dataset_train.labels.ravel())
    
    # 2. Get predicted scores
    val_scores = model.predict_proba(dataset_val.features)[:, 1]
    val_pred = dataset_val.copy(deepcopy=True)
    val_pred.scores = val_scores.reshape(-1, 1)
    
    results = {}
    
    for attr in protected_attributes:
        print(f"\n{'='*40}\nAnalyzing attribute: {attr}\n{'='*40}")
        
        # 3. Get attribute-specific groups
        attr_idx = dataset_val.protected_attribute_names.index(attr)
        privileged_group = [{attr: dataset_val.privileged_protected_attributes[attr_idx][0]}]
        unprivileged_group = [{attr: v} for v in dataset_val.unprivileged_protected_attributes[attr_idx]]
        
        # 4. Configure Calibrated Equalized Odds
        ceo = CalibratedEqOddsPostprocessing(
            privileged_groups=privileged_group,
            unprivileged_groups=unprivileged_group,
            cost_constraint=cost_constraint,
            seed=42
        )
        
        # 5. Fit and predict
        ceo.fit(dataset_val, val_pred)
        fair_pred = ceo.predict(val_pred)
        
        # 6. Calculate metrics
        metric = ClassificationMetric(
            dataset_val,
            fair_pred,
            unprivileged_groups=unprivileged_group,
            privileged_groups=privileged_group
        )
        
        # Store results
        results[attr] = {
            'spd': metric.statistical_parity_difference(),
            'eod': metric.equal_opportunity_difference(),
            'aod': metric.average_odds_difference(),
            'fnr_diff': metric.false_negative_rate_difference(),
            'fpr_diff': metric.false_positive_rate_difference()
        }
        
        # Print results
        print(f"\n{attr} fairness metrics:")
        print(f"  Statistical parity difference: {results[attr]['spd']:.4f}")
        print(f"  Equal opportunity difference: {results[attr]['eod']:.4f}")
        print(f"  Average odds difference: {results[attr]['aod']:.4f}")
        print(f"  FNR difference: {results[attr]['fnr_diff']:.4f}")
        print(f"  FPR difference: {results[attr]['fpr_diff']:.4f}")
    
    return results

# =================================================================
# Usage with your dataset
# =================================================================

# List of protected attributes
protected_attributes = ["Patient Gender", "Age Group"]

# Run analysis with different cost constraints
for cost_constraint in ["fnr", "fpr", "weighted"]:
    print(f"\n{'#'*40}")
    print(f"Running analysis with cost constraint: {cost_constraint}")
    print(f"{'#'*40}")
    
    metrics_results = calibrated_eq_odds_analysis(
        MyDataset_train,
        MyDataset_val,
        protected_attributes,
        cost_constraint=cost_constraint
    )


########################################
Running analysis with cost constraint: fnr
########################################

Analyzing attribute: Patient Gender

Patient Gender fairness metrics:
  Statistical parity difference: -0.1106
  Equal opportunity difference: -0.1076
  Average odds difference: -0.0947
  FNR difference: 0.1076
  FPR difference: -0.0817

Analyzing attribute: Age Group

Age Group fairness metrics:
  Statistical parity difference: -0.2835
  Equal opportunity difference: -0.2824
  Average odds difference: -0.2715
  FNR difference: 0.2824
  FPR difference: -0.2606

########################################
Running analysis with cost constraint: fpr
########################################

Analyzing attribute: Patient Gender

Patient Gender fairness metrics:
  Statistical parity difference: -0.1125
  Equal opportunity difference: -0.1110
  Average odds difference: -0.0964
  FNR difference: 0.1110
  FPR difference: -0.0817

Analyzing attribute: Age Group

Age Group f

# Calcul de Metrics suite au Post-processing



In [185]:
# Predictions : 
preds_weights = pd.read_csv("expe_log/predsOrig.csv")
preds_age_AIF360 = pd.read_csv("expe_log/predsAgeAIF360.csv")
preds_age_DIR = pd.read_csv("expe_log/predsAgeDIR_AIF360.csv")
preds_age_naive = pd.read_csv("expe_log/predsAgeNaive.csv")
preds_age_unifSampl = pd.read_csv("expe_log/predsAgeUniformSampling.csv")
preds_sexe_AIF360 = pd.read_csv("expe_log/predsGenderAIF360.csv")
preds_sexe_naive = pd.read_csv("expe_log/predsGenderNaive.csv")
preds_sexe_DIR = pd.read_csv("expe_log/predsGenreDIR_AIF360.csv")
preds_sexe_UnifSampl = pd.read_csv("expe_log/predsGenreUniformSampling.csv")
preds_pv_naive = pd.read_csv("expe_log/predsPANaive.csv")




preds_weights['preds'] = (preds_weights['preds'] == 'sain').astype(int)
preds_age_AIF360['preds'] = (preds_age_AIF360['preds'] == 'sain').astype(int)
preds_age_DIR['preds'] = (preds_age_DIR['preds'] == 'sain').astype(int)
preds_age_naive['preds'] = (preds_age_naive['preds'] == 'sain').astype(int)
preds_age_unifSampl['preds'] = (preds_age_unifSampl['preds'] == 'sain').astype(int)
preds_sexe_AIF360['preds'] = (preds_sexe_AIF360['preds'] == 'sain').astype(int)
preds_sexe_naive['preds'] = (preds_sexe_naive['preds'] == 'sain').astype(int)
preds_sexe_DIR['preds'] = (preds_sexe_DIR['preds'] == 'sain').astype(int)
preds_sexe_UnifSampl['preds'] = (preds_sexe_UnifSampl['preds'] == 'sain').astype(int)
preds_pv_naive['preds'] = (preds_pv_naive['preds'] == 'sain').astype(int)

FileNotFoundError: [Errno 2] No such file or directory: 'expe_log/predsOrig.csv'

In [None]:
prediction_files = {
    "Age AIF360":             {"file": preds_age_AIF360, "prot_attr":                            data["Age Group"],      "sample_weight": data_c.weights_age_aif360, "class": "Age"},
    "Ages DIR AIF360":        {"file": preds_age_DIR, "prot_attr":       data_dir_age["Age Group"],      "sample_weight": data_dir_age.WEIGHTS, "class": "Age"},
    "Age Naive":              {"file": preds_age_naive, "prot_attr":             data["Age Group"],      "sample_weight": data_c.poids_reweigth_age, "class": "Age"},
    "Age Uniform Sampling":   {"file": preds_age_unifSampl, "prot_attr":   df_age["Age Group"],      "sample_weight": df_age.WEIGHTS, "class": "Age", "reshape" : True, "y_vrai" : df_age["Finding Labels"]},
    "Gender AIF360":          {"file": preds_sexe_AIF360, "prot_attr":         data["Patient Gender"], "sample_weight": data_c.weights_gender_aif360, "class": "Sexe"},
    "Genre Naive":            {"file": preds_sexe_naive, "prot_attr":           data["Patient Gender"], "sample_weight": data_c.poids_reweigth_gender, "class": "Sexe"},
    "Genre DIR AIF360":       {"file": preds_sexe_DIR, "prot_attr":     data_dir_gender["Patient Gender"], "sample_weight": data_dir_gender.WEIGHTS, "class": "Sexe"},
    "Genre Uniform Sampling": {"file": preds_sexe_UnifSampl, "prot_attr": df_sexe["Patient Gender"], "sample_weight": df_sexe.WEIGHTS, "class": "Sexe"},
    "Orig":                   {"file": preds_weights, "prot_attr":                 data["Patient Gender"], "sample_weight": data_c.WEIGHTS, "class": "Sexe"},
    "PANaive":                {"file": preds_pv_naive, "prot_attr":              data["View Position"], "sample_weight": data_c.poids_reweigth_PA, "class": "VP"}
}

all_metrics = {}

for key, val in prediction_files.items():
    preds_df = val["file"]
   

    # Make sure the column with predictions is correctly referenced, e.g., "Prediction"
    if val["class"]=="Age": 
        if val["reshape"]: 
            metrics = get_group_metrics(
                y_true=val["y_vrai"],
                y_pred=preds_df["preds"],
                prot_attr=val["prot_attr"],
                priv_group=0,
                pos_label=1,
                sample_weight=val["sample_weight"]
            )
        else : 
            metrics = get_group_metrics(
                y_true=data["Finding Labels"],
                y_pred=preds_df["preds"],
                prot_attr=val["prot_attr"],
                priv_group=0,
                pos_label=1,
                sample_weight=val["sample_weight"]
            )
        
        all_metrics[key] = metrics
    elif val["class"]=="Sexe": 
        metrics = get_group_metrics(
            y_true=data["Finding Labels"],
            y_pred=preds_df["preds"],
            prot_attr=val["prot_attr"],
            priv_group=1,
            pos_label=1,
            sample_weight=val["sample_weight"]
        )
        
        all_metrics[key] = metrics
    elif val["class"]=="VP": 
        metrics = get_group_metrics(
            y_true=data["Finding Labels"],
            y_pred=preds_df["preds"],
            prot_attr=val["prot_attr"],
            priv_group=0,
            pos_label=1,
            sample_weight=val["sample_weight"]
        )
        
        all_metrics[key] = metrics


for method, metrics in all_metrics.items():
    print(f"\nMetrics for {method}:")
    for metric_name, value in metrics.items():
        print(f" {metric_name} : {value}")

(1.0393763368635225, np.float64(0.5415926057589762))