In [1]:
from imblearn.over_sampling import SMOTE
import pandas as pd

In [3]:
from sklearn.linear_model import SGDClassifier
from sklearn.multiclass import OneVsRestClassifier
import matplotlib.pyplot as plt

In [4]:
df_train = pd.read_csv('df_train.csv')

In [7]:
X_train = df_train.iloc[:, :768]
Y_train = df_train.iloc[:, 768]
gender_train = df_train.iloc[:, 769]

In [5]:
df_validation = pd.read_csv('df_validation.csv')

In [6]:
X_validation = df_validation.iloc[:, :768]
Y_validation = df_validation.iloc[:, 768]
gender_validation = df_validation.iloc[:, 769]

# Combinaison de X_train et gender_train

In [29]:
from sklearn.multiclass import OneVsRestClassifier
from sklearn.linear_model import SGDClassifier
import evaluator

In [30]:
def train_and_evaluate(model, X_train, Y_train, X_validation, Y_validation, gender_validation):
    """
    Entraîne le modèle et évalue les performances sur l'ensemble de validation,
    y compris l'évaluation de la justice à l'aide des fonctions fournies dans evaluator.py.
    """
    # Entraîner le modèle
    model.fit(X_train, Y_train)

    # Faire des prédictions sur l'ensemble de validation
    predictions = model.predict(X_validation)

    # Évaluation des métriques de performance et de justice en utilisant evaluator.py
    eval_scores, confusion_matrices = evaluator.gap_eval_scores(
        predictions, Y_validation, gender_validation, metrics=['TPR', 'FPR', 'PPR']
    )

    # Utilisation directe de 'accuracy' tel que retourné par gap_eval_scores
    accuracy = eval_scores['accuracy']

    # Les métriques de performance et de justice sont extraites directement des résultats d'évaluation
    performance_metrics = {
        'Accuracy': accuracy,
        'Macro F1 Score': eval_scores['macro_fscore'],
        'Micro F1 Score': eval_scores['micro_fscore'],
    }

    fairness_metrics = {
        'TPR_GAP': eval_scores.get('TPR_GAP', 0),
        'FPR_GAP': eval_scores.get('FPR_GAP', 0),
        'PPR_GAP': eval_scores.get('PPR_GAP', 0),
    }

    final_score = (performance_metrics['Macro F1 Score'] + (1 - fairness_metrics['TPR_GAP'])) / 2

    # Affichage des résultats
    print("Performance Metrics:")
    for key, value in performance_metrics.items():
        print(f"{key}: {value}")

    print("\nFairness Metrics:")
    for key, value in fairness_metrics.items():
        print(f"{key}: {value}")

    print(f"\nFinal Score: {final_score}")
    print(f"Number of Estimators: {len(model.estimators_)}")

    return {
        'performance_metrics': performance_metrics,
        'fairness_metrics': fairness_metrics,
        'number_of_estimators': len(model.estimators_),
        'final_score': final_score,
    }

Cette fonction a été mis sous format .py avec l'ajout de la validation croisée pour entrainer le modèle en fonction de notre critère de précision et d'équité. 

In [31]:
# Exemple d'utilisation avec OneVsRestClassifier et SGDClassifier
ovr_clf = OneVsRestClassifier(SGDClassifier(random_state=42))

In [32]:
results = train_and_evaluate(ovr_clf, X_train, Y_train, X_validation, Y_validation, gender_validation)

Performance Metrics:
Accuracy: 0.7387387387387387
Macro F1 Score: 0.6257162124859735
Micro F1 Score: 0.7387387387387387

Fairness Metrics:
TPR_GAP: 0.18877768365076086
FPR_GAP: 0.008478595565504461
PPR_GAP: 0.025465046424129084

Final Score: 0.7184692644176063
Number of Estimators: 28


In [36]:
results

{'performance_metrics': {'Accuracy': 0.7387387387387387,
  'Macro F1 Score': 0.6257162124859735,
  'Micro F1 Score': 0.7387387387387387},
 'fairness_metrics': {'TPR_GAP': 0.18877768365076086,
  'FPR_GAP': 0.008478595565504461,
  'PPR_GAP': 0.025465046424129084},
 'final_score': 0.7184692644176063,
 'number_of_estimators': 28}

Pour gérer à la fois le déséquilibre de classe et l'iniquité tout en maintenant une bonne précision, On derva prioriser le Macro F1 Score pour le déséquilibre de classe, les métriques TPR_GAP, FPR_GAP, et PPR_GAP pour l'évaluation de l'iniquité, et utiliser l'Accuracy avec prudence, en complément d'autres métriques plus informatives dans ces contextes spécifiques.