[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/Trusted-AI/AIF360/blob/main/examples/sklearn/demo_learning_fair_representations.ipynb)

# Learning Fair Representations

The Learned Fair Representations method (LFR) aims to learn an encoding of the data which preserves as much information as possible while removing protected information. It does this by forming a probabilistic mapping of the data to a set of "prototypes" (clusters). The learned representation can be used by a downstream estimator (pre-processing) or as a linear model itself, using weights learned in the encoding process.

In [2]:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
pd.set_option('display.max_columns', None)
import seaborn as sns
from sklearn.metrics import accuracy_score, balanced_accuracy_score
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.ensemble import GradientBoostingClassifier

from aif360.sklearn.metrics import * 
from aif360.sklearn.preprocessing import LearnedFairRepresentations
from aif360.sklearn.datasets.utils import standardize_dataset

from sklearn.metrics import *

pip install 'aif360[AdversarialDebiasing]'
pip install 'aif360[AdversarialDebiasing]'
  warn_deprecated('vmap', 'torch.vmap')
pip install 'aif360[inFairness]'
pip install 'aif360[FairAdapt]'


In [3]:
RANDOM_STATE = 42

In [8]:
def fetch_dataset(protected_attributes, subset='all', *, data_home=None, cache=True, binary_race=True,
                usecols=None, dropcols=None, numeric_only=False, dropna=False):
    if subset not in {'train', 'test', 'all'}:
        raise ValueError("subset must be either 'train', 'test', or 'all'; "
                         "cannot be {}".format(subset))
    df = pd.read_csv('./../data/synth_data_for_training.csv')
    


    return standardize_dataset(df, prot_attr=protected_attributes,
                               target='checked',
                               usecols=usecols, dropcols=dropcols,
                               numeric_only=numeric_only, dropna=dropna)

Fetch Adult dataset, encode categorical features, and split into train/test.

In [9]:
protected_attributes = ["persoon_geslacht_vrouw", "typering_ind"]

X, y= fetch_dataset(protected_attributes=protected_attributes)


# X.index = y.index = pd.MultiIndex.from_arrays(X.index.codes, names=X.index.names)
y = pd.Series(y.factorize(sort=True)[0], index=y.index, name=y.name)
X = pd.get_dummies(X, prefix_sep='__', drop_first=True)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, shuffle=False)
X_train

Unnamed: 0_level_0,Unnamed: 1_level_0,adres_aantal_brp_adres,adres_aantal_verschillende_wijken,adres_aantal_verzendadres,adres_aantal_woonadres_handmatig,adres_dagen_op_adres,adres_recentst_onderdeel_rdam,adres_recentste_buurt_groot_ijsselmonde,adres_recentste_buurt_nieuwe_westen,adres_recentste_buurt_other,adres_recentste_buurt_oude_noorden,adres_recentste_buurt_vreewijk,adres_recentste_plaats_other,adres_recentste_plaats_rotterdam,adres_recentste_wijk_charlois,adres_recentste_wijk_delfshaven,adres_recentste_wijk_feijenoord,adres_recentste_wijk_ijsselmonde,adres_recentste_wijk_kralingen_c,adres_recentste_wijk_noord,adres_recentste_wijk_other,adres_recentste_wijk_prins_alexa,adres_recentste_wijk_stadscentru,adres_unieke_wijk_ratio,afspraak_aanmelding_afgesloten,afspraak_aantal_woorden,afspraak_afgelopen_jaar_afsprakenplan,afspraak_afgelopen_jaar_monitoring_insp__wet_taaleis_na_12_mnd_n_a_v__taa04_____geen_maatregel,afspraak_afgelopen_jaar_ontheffing,afspraak_afgelopen_jaar_ontheffing_taaleis,afspraak_afgelopen_jaar_plan_van_aanpak,afspraak_afgelopen_jaar_signaal_voor_medewerker,afspraak_afgelopen_jaar_vervolgmeting_matchbaarheid_werkzoekende_klant,afspraak_afgelopen_jaar_voortgang_aanmelding_en_deelname,afspraak_afsprakenplan,afspraak_controle_aankondiging_maatregel,afspraak_controle_verwijzing,afspraak_deelname_compleet_uit_webapplicatie,afspraak_galo_gesprek,afspraak_gespr__einde_zoekt___galo_gesprek_,afspraak_inspanningsperiode,afspraak_laatstejaar_aantal_woorden,afspraak_laatstejaar_resultaat_ingevuld,afspraak_laatstejaar_resultaat_ingevuld_uniek,afspraak_other,afspraak_participatietrede_vervolgmeting,afspraak_resultaat_ingevuld_uniek,afspraak_signaal_van_aanbieder,afspraak_signaal_voor_medewerker,afspraak_toevoegen_inschrijving_uwvwb,afspraak_vervolgmeting_matchbaarheid_werkzoekende_klant,afspraak_verzenden_beschikking_i_v_m__niet_voldoen_aan_wet_taaleis,afspraak_voortgangsgesprek,belemmering_aantal_huidig,belemmering_dagen_financiele_problemen,belemmering_dagen_lichamelijke_problematiek,belemmering_dagen_psychische_problemen,belemmering_financiele_problemen,belemmering_hist_lichamelijke_problematiek,belemmering_hist_psychische_problemen,belemmering_hist_stabiele_mix__sz____dagbesteding_werk,belemmering_hist_taal,belemmering_hist_verslavingsproblematiek,belemmering_ind,belemmering_ind_hist,belemmering_niet_computervaardig,belemmering_psychische_problemen,belemmering_woonsituatie,beschikbaarheid_aantal_historie_afwijkend_wegens_medische_omstandigheden,beschikbaarheid_aantal_historie_afwijkend_wegens_sociaal_maatschappelijke_situatie,beschikbaarheid_huidig_afwijkend_wegens_medische_omstandigheden,beschikbaarheid_huidig_bekend,beschikbaarheid_recent_afwijkend_wegens_medische_omstandigheden,beschikbaarheid_recent_afwijkend_wegens_sociaal_maatschappelijke_situatie,competentie_aansturen,competentie_analyseren,competentie_ethisch_en_integer_handelen,competentie_formuleren_en_rapporteren,competentie_gedrevenheid_en_ambitie_tonen,competentie_instructies_en_procedures_opvolgen,competentie_kwaliteit_leveren,competentie_leren,competentie_materialen_en_middelen_inzetten,competentie_met_druk_en_tegenslag_omgaan,competentie_omgaan_met_verandering_en_aanpassen,competentie_onderzoeken,competentie_op_de_behoeften_en_verwachtingen_van_de__klant__richten,competentie_other,competentie_overtuigen_en_beïnvloeden,competentie_plannen_en_organiseren,competentie_samenwerken_en_overleggen,competentie_vakdeskundigheid_toepassen,contacten_onderwerp__arbeids_motivatie,contacten_onderwerp__pre__intake,contacten_onderwerp__werk_intake,contacten_onderwerp_arbeidsdiagnose_dariuz,contacten_onderwerp_beoordelen_taaleis,contacten_onderwerp_boolean__arbeids_motivatie,contacten_onderwerp_boolean__pre__intake,contacten_onderwerp_boolean__werk_intake,contacten_onderwerp_boolean_beoordelen_taaleis,contacten_onderwerp_boolean_contact_derden,contacten_onderwerp_boolean_contact_met_aanbieder,contacten_onderwerp_boolean_diagnosegesprek,contacten_onderwerp_boolean_documenten__innemen_,contacten_onderwerp_boolean_documenttype__cv_,contacten_onderwerp_boolean_documenttype__diploma_s_en_certificaten_,contacten_onderwerp_boolean_documenttype__overeenkomst_,contacten_onderwerp_boolean_financiële_situatie,contacten_onderwerp_boolean_groepsbijeenkomst,contacten_onderwerp_boolean_inkomen,contacten_onderwerp_boolean_maatregel_overweging,contacten_onderwerp_boolean_match___werk,contacten_onderwerp_boolean_matching,contacten_onderwerp_boolean_motivatie,contacten_onderwerp_boolean_mutatie,contacten_onderwerp_boolean_no_show,contacten_onderwerp_boolean_overige,contacten_onderwerp_boolean_overleg_met_inkomen,contacten_onderwerp_boolean_scholing,contacten_onderwerp_boolean_sollicitatie,contacten_onderwerp_boolean_taaleis___voldoet,contacten_onderwerp_boolean_terugbelverzoek,contacten_onderwerp_boolean_traject,contacten_onderwerp_boolean_uitnodiging,contacten_onderwerp_boolean_ziek__of_afmelding,contacten_onderwerp_boolean_zorg,contacten_onderwerp_contact_derden,contacten_onderwerp_contact_met_aanbieder,contacten_onderwerp_diagnosegesprek,contacten_onderwerp_documenten__innemen_,contacten_onderwerp_documenttype__cv_,contacten_onderwerp_documenttype__overeenkomst_,contacten_onderwerp_financiële_situatie,contacten_onderwerp_groepsbijeenkomst,contacten_onderwerp_inkomen,contacten_onderwerp_inname_aanvraag,contacten_onderwerp_inspanningstoets,contacten_onderwerp_maatregel_overweging,contacten_onderwerp_matching,contacten_onderwerp_mutatie,contacten_onderwerp_no_show,contacten_onderwerp_overige,contacten_onderwerp_overleg_met_inkomen,contacten_onderwerp_quickscan,contacten_onderwerp_scholing,contacten_onderwerp_screening,contacten_onderwerp_terugbelverzoek,contacten_onderwerp_traject,contacten_onderwerp_uitnodiging,contacten_onderwerp_vakantie,contacten_onderwerp_werkintake__niet_verschenen,contacten_onderwerp_ziek__of_afmelding,contacten_onderwerp_zorg,contacten_soort_afgelopenjaar_anders,contacten_soort_afgelopenjaar_document__inkomend_,contacten_soort_afgelopenjaar_document__uitgaand_,contacten_soort_afgelopenjaar_e_mail__inkomend_,contacten_soort_afgelopenjaar_e_mail__uitgaand_,contacten_soort_afgelopenjaar_gesprek,contacten_soort_afgelopenjaar_gesprek_op_locatie,contacten_soort_afgelopenjaar_rapportage_rib,contacten_soort_afgelopenjaar_telefoontje__inkomend_,contacten_soort_afgelopenjaar_telefoontje__uitgaand_,contacten_soort_anders,contacten_soort_document__inkomend_,contacten_soort_document__uitgaand_,contacten_soort_e_mail__inkomend_,contacten_soort_e_mail__uitgaand_,contacten_soort_gesprek_op_locatie,contacten_soort_groepsbijeenkomsten,contacten_soort_rapportage_deelname,contacten_soort_rapportage_rib,contacten_soort_telefoontje__inkomend_,contacten_soort_telefoontje__uitgaand_,deelname_act_actueel_projecten_uniek,deelname_act_hist_projecten_niet_gestart,deelname_act_reintegratieladder_ondersteunende_instrumenten,deelname_act_reintegratieladder_werk_re_integratie,instrument_aantal_laatstejaar,instrument_ladder_historie_activering,instrument_ladder_historie_other,instrument_ladder_huidig_activering,instrument_ladder_huidig_other,instrument_ladder_huidig_werk_re_integratie,instrument_reden_beeindiging_historie_centrale_actie_wigo4it,instrument_reden_beeindiging_historie_diagnose_gesteld,instrument_reden_beeindiging_historie_direct_matchbaar,instrument_reden_beeindiging_historie_doelstelling_bereikt__geen_uitstroom,instrument_reden_beeindiging_historie_doelstelling_bereikt__uitstroom_naar_regulier_werk,instrument_reden_beeindiging_historie_doelstelling_bereikt__uitstroom_overig,instrument_reden_beeindiging_historie_doelstelling_niet_bereikt__geen_uitstroom,instrument_reden_beeindiging_historie_niet_matchbaar,instrument_reden_beeindiging_historie_niet_succesvol,instrument_reden_beeindiging_historie_niet_succesvol__reden_bij_werkzoekende,instrument_reden_beeindiging_historie_op_termijn_matchbaar,instrument_reden_beeindiging_historie_other,instrument_reden_beeindiging_historie_overdracht_naar_mo,instrument_reden_beeindiging_historie_overdracht_naar_prematching,instrument_reden_beeindiging_historie_overdracht_naar_regulier_team_iwpm,instrument_reden_beeindiging_historie_overdracht_succesvol,instrument_reden_beeindiging_historie_succesvol,instrument_reden_beeindiging_historie_succesvol__doelstelling_bereikt,instrument_reden_beeindiging_historie_uitval__aanbod_niet_langer_zinvol_volgens_gemeente,instrument_reden_beeindiging_historie_uitval__klant_wz__ziet_af_van_aanbod,ontheffing_actueel_ind,ontheffing_dagen_hist_mean,ontheffing_dagen_hist_vanwege_uw_medische_omstandigheden,ontheffing_hist_ind,ontheffing_reden_hist_medische_gronden,ontheffing_reden_hist_other,ontheffing_reden_hist_sociale_gronden,ontheffing_reden_hist_tijdelijke_ontheffing_arbeidsverpl__en_tegenprestatie,ontheffing_reden_hist_tijdelijke_ontheffing_arbeidsverplichtingen,ontheffing_reden_hist_vanwege_uw_sociaal_maatschappelijke_situatie,ontheffing_reden_tijdelijke_ontheffing_arbeidsverpl__en_tegenprestatie,persoon_geslacht_vrouw,persoon_leeftijd_bij_onderzoek,persoonlijke_eigenschappen_communicatie_opm,persoonlijke_eigenschappen_dagen_sinds_opvoer,persoonlijke_eigenschappen_dagen_sinds_taaleis,persoonlijke_eigenschappen_doorzettingsvermogen_opm,persoonlijke_eigenschappen_flexibiliteit_opm,persoonlijke_eigenschappen_hobbies_sport,persoonlijke_eigenschappen_houding_opm,persoonlijke_eigenschappen_ind_activering_traject,persoonlijke_eigenschappen_ind_buiten_kantoortijden,persoonlijke_eigenschappen_ind_regulier_arbeidsritme,persoonlijke_eigenschappen_initiatief_opm,persoonlijke_eigenschappen_leergierigheid_opm,persoonlijke_eigenschappen_motivatie_opm,persoonlijke_eigenschappen_nl_begrijpen3,persoonlijke_eigenschappen_nl_lezen3,persoonlijke_eigenschappen_nl_lezen4,persoonlijke_eigenschappen_nl_schrijven0,persoonlijke_eigenschappen_nl_schrijven1,persoonlijke_eigenschappen_nl_schrijven2,persoonlijke_eigenschappen_nl_schrijven3,persoonlijke_eigenschappen_nl_schrijvenfalse,persoonlijke_eigenschappen_nl_spreken1,persoonlijke_eigenschappen_nl_spreken2,persoonlijke_eigenschappen_nl_spreken3,persoonlijke_eigenschappen_opstelling,persoonlijke_eigenschappen_overige_opmerkingen,persoonlijke_eigenschappen_presentatie_opm,persoonlijke_eigenschappen_spreektaal,persoonlijke_eigenschappen_spreektaal_anders,persoonlijke_eigenschappen_taaleis_schrijfv_ok,persoonlijke_eigenschappen_taaleis_voldaan,persoonlijke_eigenschappen_uiterlijke_verzorging_opm,persoonlijke_eigenschappen_uitstroom_verw_vlgs_klant,persoonlijke_eigenschappen_uitstroom_verw_vlgs_km,persoonlijke_eigenschappen_zelfstandigheid_opm,pla_actueel_pla_categorie_doelstelling_16,pla_actueel_pla_categorie_doelstelling_9,pla_einde_doelstelling_bereikt,pla_einde_doelstelling_bereikt__nieuw_trajectplan,pla_einde_doelstelling_bereikt__overdracht,pla_einde_doelstelling_niet_bereikt,pla_einde_doelstelling_niet_bereikt__nieuw_trajectplan,pla_einde_doelstelling_niet_bereikt__overdracht,pla_einde_geplande_einddatum_overschreden_zonder_nader_bericht,pla_einde_other,pla_einde_uitstroom_anders_dan_volgen_onderwijs__regulier_werk_of_als_zelfstandige,pla_hist_pla_categorie_doelstelling_1,pla_hist_pla_categorie_doelstelling_10,pla_hist_pla_categorie_doelstelling_11,pla_hist_pla_categorie_doelstelling_16,pla_hist_pla_categorie_doelstelling_2,pla_hist_pla_categorie_doelstelling_27,pla_hist_pla_categorie_doelstelling_3,pla_hist_pla_categorie_doelstelling_4,pla_hist_pla_categorie_doelstelling_5,pla_hist_pla_categorie_doelstelling_6,pla_hist_pla_categorie_doelstelling_9,pla_hist_pla_categorie_doelstelling_other,pla_historie_maatschappelijke_inspanning,pla_historie_ontwikkeling,pla_historie_other,pla_historie_werk,pla_historie_werk_en_inburgering,pla_ondertekeningen_actueel,pla_ondertekeningen_historie,relatie_kind_basisschool_kind,relatie_kind_heeft_kinderen,relatie_kind_huidige_aantal,relatie_kind_jongvolwassen,relatie_kind_leeftijd_verschil_ouder_eerste_kind,relatie_kind_tiener,relatie_kind_volwassen,relatie_overig_actueel_vorm__gemachtigde,relatie_overig_actueel_vorm__kostendeler,relatie_overig_actueel_vorm__onderhoudsplichtige,relatie_overig_actueel_vorm__ouders_verzorgers,relatie_overig_actueel_vorm_other,relatie_overig_bewindvoerder,relatie_overig_historie_vorm__andere_inwonende,relatie_overig_historie_vorm__gemachtigde,relatie_overig_historie_vorm__kostendeler,relatie_overig_historie_vorm__onderhoudsplichtige,relatie_overig_kostendeler,relatie_partner_aantal_partner___partner__gehuwd_,relatie_partner_aantal_partner___partner__ongehuwd_,relatie_partner_huidige_partner___partner__gehuwd_,relatie_partner_totaal_dagen_partner,typering_aantal,typering_dagen_som,typering_hist_aantal,typering_hist_inburgeringsbehoeftig,typering_hist_ind,typering_hist_sector_zorg,typering_ind,typering_indicatie_geheime_gegevens,typering_other,typering_transport__logistiek___tuinbouw,typering_zorg__schoonmaak___welzijn
persoon_geslacht_vrouw,typering_ind,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1,Unnamed: 56_level_1,Unnamed: 57_level_1,Unnamed: 58_level_1,Unnamed: 59_level_1,Unnamed: 60_level_1,Unnamed: 61_level_1,Unnamed: 62_level_1,Unnamed: 63_level_1,Unnamed: 64_level_1,Unnamed: 65_level_1,Unnamed: 66_level_1,Unnamed: 67_level_1,Unnamed: 68_level_1,Unnamed: 69_level_1,Unnamed: 70_level_1,Unnamed: 71_level_1,Unnamed: 72_level_1,Unnamed: 73_level_1,Unnamed: 74_level_1,Unnamed: 75_level_1,Unnamed: 76_level_1,Unnamed: 77_level_1,Unnamed: 78_level_1,Unnamed: 79_level_1,Unnamed: 80_level_1,Unnamed: 81_level_1,Unnamed: 82_level_1,Unnamed: 83_level_1,Unnamed: 84_level_1,Unnamed: 85_level_1,Unnamed: 86_level_1,Unnamed: 87_level_1,Unnamed: 88_level_1,Unnamed: 89_level_1,Unnamed: 90_level_1,Unnamed: 91_level_1,Unnamed: 92_level_1,Unnamed: 93_level_1,Unnamed: 94_level_1,Unnamed: 95_level_1,Unnamed: 96_level_1,Unnamed: 97_level_1,Unnamed: 98_level_1,Unnamed: 99_level_1,Unnamed: 100_level_1,Unnamed: 101_level_1,Unnamed: 102_level_1,Unnamed: 103_level_1,Unnamed: 104_level_1,Unnamed: 105_level_1,Unnamed: 106_level_1,Unnamed: 107_level_1,Unnamed: 108_level_1,Unnamed: 109_level_1,Unnamed: 110_level_1,Unnamed: 111_level_1,Unnamed: 112_level_1,Unnamed: 113_level_1,Unnamed: 114_level_1,Unnamed: 115_level_1,Unnamed: 116_level_1,Unnamed: 117_level_1,Unnamed: 118_level_1,Unnamed: 119_level_1,Unnamed: 120_level_1,Unnamed: 121_level_1,Unnamed: 122_level_1,Unnamed: 123_level_1,Unnamed: 124_level_1,Unnamed: 125_level_1,Unnamed: 126_level_1,Unnamed: 127_level_1,Unnamed: 128_level_1,Unnamed: 129_level_1,Unnamed: 130_level_1,Unnamed: 131_level_1,Unnamed: 132_level_1,Unnamed: 133_level_1,Unnamed: 134_level_1,Unnamed: 135_level_1,Unnamed: 136_level_1,Unnamed: 137_level_1,Unnamed: 138_level_1,Unnamed: 139_level_1,Unnamed: 140_level_1,Unnamed: 141_level_1,Unnamed: 142_level_1,Unnamed: 143_level_1,Unnamed: 144_level_1,Unnamed: 145_level_1,Unnamed: 146_level_1,Unnamed: 147_level_1,Unnamed: 148_level_1,Unnamed: 149_level_1,Unnamed: 150_level_1,Unnamed: 151_level_1,Unnamed: 152_level_1,Unnamed: 153_level_1,Unnamed: 154_level_1,Unnamed: 155_level_1,Unnamed: 156_level_1,Unnamed: 157_level_1,Unnamed: 158_level_1,Unnamed: 159_level_1,Unnamed: 160_level_1,Unnamed: 161_level_1,Unnamed: 162_level_1,Unnamed: 163_level_1,Unnamed: 164_level_1,Unnamed: 165_level_1,Unnamed: 166_level_1,Unnamed: 167_level_1,Unnamed: 168_level_1,Unnamed: 169_level_1,Unnamed: 170_level_1,Unnamed: 171_level_1,Unnamed: 172_level_1,Unnamed: 173_level_1,Unnamed: 174_level_1,Unnamed: 175_level_1,Unnamed: 176_level_1,Unnamed: 177_level_1,Unnamed: 178_level_1,Unnamed: 179_level_1,Unnamed: 180_level_1,Unnamed: 181_level_1,Unnamed: 182_level_1,Unnamed: 183_level_1,Unnamed: 184_level_1,Unnamed: 185_level_1,Unnamed: 186_level_1,Unnamed: 187_level_1,Unnamed: 188_level_1,Unnamed: 189_level_1,Unnamed: 190_level_1,Unnamed: 191_level_1,Unnamed: 192_level_1,Unnamed: 193_level_1,Unnamed: 194_level_1,Unnamed: 195_level_1,Unnamed: 196_level_1,Unnamed: 197_level_1,Unnamed: 198_level_1,Unnamed: 199_level_1,Unnamed: 200_level_1,Unnamed: 201_level_1,Unnamed: 202_level_1,Unnamed: 203_level_1,Unnamed: 204_level_1,Unnamed: 205_level_1,Unnamed: 206_level_1,Unnamed: 207_level_1,Unnamed: 208_level_1,Unnamed: 209_level_1,Unnamed: 210_level_1,Unnamed: 211_level_1,Unnamed: 212_level_1,Unnamed: 213_level_1,Unnamed: 214_level_1,Unnamed: 215_level_1,Unnamed: 216_level_1,Unnamed: 217_level_1,Unnamed: 218_level_1,Unnamed: 219_level_1,Unnamed: 220_level_1,Unnamed: 221_level_1,Unnamed: 222_level_1,Unnamed: 223_level_1,Unnamed: 224_level_1,Unnamed: 225_level_1,Unnamed: 226_level_1,Unnamed: 227_level_1,Unnamed: 228_level_1,Unnamed: 229_level_1,Unnamed: 230_level_1,Unnamed: 231_level_1,Unnamed: 232_level_1,Unnamed: 233_level_1,Unnamed: 234_level_1,Unnamed: 235_level_1,Unnamed: 236_level_1,Unnamed: 237_level_1,Unnamed: 238_level_1,Unnamed: 239_level_1,Unnamed: 240_level_1,Unnamed: 241_level_1,Unnamed: 242_level_1,Unnamed: 243_level_1,Unnamed: 244_level_1,Unnamed: 245_level_1,Unnamed: 246_level_1,Unnamed: 247_level_1,Unnamed: 248_level_1,Unnamed: 249_level_1,Unnamed: 250_level_1,Unnamed: 251_level_1,Unnamed: 252_level_1,Unnamed: 253_level_1,Unnamed: 254_level_1,Unnamed: 255_level_1,Unnamed: 256_level_1,Unnamed: 257_level_1,Unnamed: 258_level_1,Unnamed: 259_level_1,Unnamed: 260_level_1,Unnamed: 261_level_1,Unnamed: 262_level_1,Unnamed: 263_level_1,Unnamed: 264_level_1,Unnamed: 265_level_1,Unnamed: 266_level_1,Unnamed: 267_level_1,Unnamed: 268_level_1,Unnamed: 269_level_1,Unnamed: 270_level_1,Unnamed: 271_level_1,Unnamed: 272_level_1,Unnamed: 273_level_1,Unnamed: 274_level_1,Unnamed: 275_level_1,Unnamed: 276_level_1,Unnamed: 277_level_1,Unnamed: 278_level_1,Unnamed: 279_level_1,Unnamed: 280_level_1,Unnamed: 281_level_1,Unnamed: 282_level_1,Unnamed: 283_level_1,Unnamed: 284_level_1,Unnamed: 285_level_1,Unnamed: 286_level_1,Unnamed: 287_level_1,Unnamed: 288_level_1,Unnamed: 289_level_1,Unnamed: 290_level_1,Unnamed: 291_level_1,Unnamed: 292_level_1,Unnamed: 293_level_1,Unnamed: 294_level_1,Unnamed: 295_level_1,Unnamed: 296_level_1,Unnamed: 297_level_1,Unnamed: 298_level_1,Unnamed: 299_level_1,Unnamed: 300_level_1,Unnamed: 301_level_1,Unnamed: 302_level_1,Unnamed: 303_level_1,Unnamed: 304_level_1,Unnamed: 305_level_1,Unnamed: 306_level_1,Unnamed: 307_level_1,Unnamed: 308_level_1,Unnamed: 309_level_1,Unnamed: 310_level_1,Unnamed: 311_level_1,Unnamed: 312_level_1,Unnamed: 313_level_1,Unnamed: 314_level_1,Unnamed: 315_level_1,Unnamed: 316_level_1
0,0,6,3,1,0,1012,1,0,0,1,0,0,0,1,0,1,0,0,0,0,0,0,0,1,2,178,0,0,0,0,1,4,0,3,1,0,1,1,1,1,1,82,3,0,2,1,3,2,8,0,1,1,1,2,5923,8794,6113,1,1,1,0,0,0,1,1,0,1,0,0,1,0,0,0,0,0,1,0,1,0,0,1,0,0,0,0,0,0,2,1,0,0,1,8,0,2,0,1,1,0,1,0,1,1,0,1,1,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,1,1,1,0,6,7,0,3,1,1,1,0,1,0,1,1,5,0,1,4,1,0,0,0,8,11,4,0,1,2,2,3,1,3,1,4,1,0,1,2,1,3,10,44,8,7,1,1,0,3,7,5,1,3,5,7,1,1,1,1,0,0,1,0,0,0,0,0,1,0,2,0,0,1,1,0,0,0,2,0,1,0,0,1159,1125,1,0,0,0,1,0,1,0,0,59,1,442,105,0,1,1,1,1,0,0,1,1,1,1,0,0,0,1,0,0,0,1,0,0,1,1,1,57,1,0,0,1,6,6,1,1,0,1,0,0,1,0,0,1,1,0,1,0,1,1,1,1,1,1,1,0,1,0,0,1,0,0,0,0,4,0,0,1,1,6,0,0,0,1,0,1,0,0,1,1,2,1,0,0,0,0,12,0,917,2,0,1,0,0,0,0,0,0
0,1,4,2,1,0,5268,1,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,1,2,172,1,0,1,0,2,1,0,6,2,1,0,2,1,1,1,98,6,2,2,1,5,2,1,1,0,1,1,4,-423,2377,-9805,0,1,1,0,0,0,1,1,0,1,0,1,0,0,1,1,0,1,0,0,1,1,0,1,0,0,0,0,0,0,4,1,1,1,1,2,1,1,1,1,1,0,1,0,1,1,0,0,1,0,0,1,1,1,0,0,0,0,0,0,1,1,1,0,0,1,0,1,1,0,3,3,0,1,2,0,4,1,2,0,1,0,4,0,1,11,2,1,2,1,3,2,2,0,0,2,2,1,3,10,5,5,2,1,2,1,2,8,2,36,10,7,1,0,0,3,4,1,0,1,3,7,3,2,1,0,0,1,0,0,0,1,0,0,1,0,1,0,0,0,0,0,0,1,3,0,0,1,1,1509,1718,1,1,0,0,0,0,1,0,0,43,1,11,2,1,1,1,1,0,0,0,1,0,1,1,1,0,0,0,0,1,0,0,0,1,1,1,1,57,1,0,2,1,5,6,1,0,0,1,2,1,1,1,0,0,0,1,1,0,0,0,0,0,1,1,0,1,0,1,0,0,1,1,0,0,2,1,0,1,0,3,0,0,0,1,0,0,1,0,1,1,2,0,0,0,0,0,468,2,1603,2,0,1,0,1,0,1,0,0
1,0,4,2,0,1,1820,1,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,1,2,195,1,0,1,0,0,0,0,1,0,0,0,0,1,1,1,65,3,1,1,3,3,0,0,1,0,0,2,1,3165,-12158,-23657,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,1,1,0,0,0,0,1,1,1,0,0,1,1,0,0,0,0,1,0,0,1,1,1,1,0,0,1,0,0,0,1,1,0,0,1,0,1,1,1,0,1,0,0,5,1,1,4,1,2,1,0,0,7,0,1,10,2,1,1,0,1,7,2,0,1,5,1,2,2,7,3,5,2,0,0,2,3,2,7,41,10,13,0,0,2,0,2,7,0,3,5,2,3,1,0,0,1,0,0,0,0,1,0,0,3,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1263,1740,1,0,0,0,0,0,0,0,1,48,1,188,172,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,0,0,1,0,6,0,1,0,0,0,2,0,0,2,1,0,0,1,0,0,0,0,0,0,2,0,2,2,0,1,1,0,1,1,0,0,3,0,0,1,0,7,0,0,0,1,0,0,0,0,0,0,1,1,0,0,0,0,571,0,-4769,1,0,1,0,0,0,0,0,0
0,1,3,2,0,1,9056,1,0,0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,1,2,295,0,0,0,1,2,2,0,1,2,1,0,1,0,0,1,90,3,3,3,2,4,1,5,0,1,1,1,2,-689,-4632,6909,1,0,1,0,0,0,1,1,0,0,0,1,0,0,0,0,0,1,1,1,1,0,1,1,1,0,1,1,0,1,1,0,1,0,1,9,1,0,0,1,1,1,0,0,1,0,1,1,0,0,0,0,1,1,0,0,0,0,0,1,1,1,0,0,0,0,1,1,0,0,6,2,1,5,0,0,2,1,2,0,0,1,1,0,1,7,3,0,1,1,1,7,3,1,1,1,1,2,2,3,2,2,1,0,1,0,0,4,7,41,13,7,0,0,0,2,2,4,1,3,7,1,0,2,2,1,0,0,1,0,0,2,0,0,2,0,1,0,0,1,0,0,0,1,1,0,1,0,1,1029,1199,1,1,0,1,0,0,0,0,0,58,1,741,204,1,1,1,1,0,1,1,1,1,1,0,1,0,0,0,0,1,0,0,0,1,1,0,1,57,0,0,0,0,6,3,1,0,0,1,2,0,1,0,0,0,1,0,0,1,1,1,0,1,0,1,1,2,1,0,1,1,0,1,0,0,7,1,0,0,1,17,0,1,1,2,0,0,0,0,0,1,3,0,1,1,0,0,2760,1,4189,2,0,1,0,1,0,0,0,0
0,1,3,3,0,2,5246,1,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,1,1,285,1,0,1,0,2,2,1,5,1,1,0,2,2,1,1,138,4,4,0,0,5,4,5,0,0,0,0,2,2111,8361,-2326,0,2,0,0,0,0,1,1,0,0,0,2,0,0,0,1,0,0,0,0,1,0,0,1,0,0,0,0,0,0,2,1,1,0,0,4,0,2,1,1,1,0,1,1,0,0,0,1,1,0,1,1,0,0,0,0,0,0,0,0,0,1,0,0,0,1,0,1,1,0,2,2,0,2,1,1,3,1,0,0,1,0,1,1,1,0,2,0,0,0,8,2,2,0,0,3,2,2,2,6,3,2,2,0,2,2,2,1,9,18,4,8,0,1,1,3,10,5,1,2,3,2,2,3,0,0,1,0,0,0,0,2,0,0,0,0,2,0,0,0,0,0,0,0,3,0,0,0,0,1496,929,1,1,0,0,1,0,0,0,0,52,1,225,397,1,1,1,1,0,0,0,0,0,1,1,0,0,0,0,1,0,0,0,1,0,1,0,0,57,0,0,0,0,6,6,1,0,0,1,0,0,1,1,0,0,0,0,1,0,0,1,0,1,1,0,0,0,1,1,0,1,0,1,0,1,4,0,0,0,1,7,0,1,0,1,0,0,1,0,1,0,2,1,1,1,0,0,1786,1,502,1,0,1,0,1,0,0,0,0
0,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
0,1,6,2,0,1,16126,1,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,4,226,0,0,0,0,0,3,0,0,0,0,0,0,0,0,0,62,1,0,0,3,1,1,6,1,0,0,1,1,-5055,1078,-17119,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,2,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,1,1,1,1,1,1,2,0,0,1,0,1,0,0,0,3,0,0,12,1,0,1,0,3,7,2,0,0,2,3,0,1,1,1,2,0,0,1,2,2,2,7,22,5,7,0,1,0,1,6,4,0,1,4,2,0,0,1,0,0,0,1,0,0,2,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,1424,1867,1,1,0,1,0,0,0,0,0,47,0,23,78,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,3,1,0,3,0,1,0,0,1,1,0,0,0,0,2,0,1,1,0,0,1,0,0,1,0,0,0,1,0,1,1,16,1,1,0,1,1,0,0,0,0,0,1,1,0,0,0,0,708,2,3272,3,0,1,0,1,0,1,0,0
1,1,6,4,1,1,2248,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,4,408,0,0,1,0,1,4,0,2,1,1,0,2,1,1,1,163,1,2,2,1,5,4,7,1,1,0,2,4,5849,22350,10102,1,2,1,0,0,0,1,1,0,1,0,2,1,1,1,1,0,1,1,0,0,1,1,1,1,1,0,0,0,1,3,1,1,1,1,10,0,1,1,2,1,0,1,1,1,0,0,1,0,1,1,0,1,0,1,0,0,0,0,0,1,1,0,0,0,1,1,0,1,1,4,1,1,10,1,2,1,2,0,0,1,1,1,0,1,12,2,0,1,1,9,13,1,0,0,3,3,2,3,3,3,3,3,0,1,3,5,7,24,50,6,5,0,0,3,3,10,13,1,3,5,11,1,3,0,1,1,1,0,0,0,2,0,0,1,1,1,0,0,2,1,0,0,1,2,0,1,0,1,3521,3403,1,0,0,0,1,1,0,0,1,55,1,186,660,1,1,1,1,1,0,0,1,1,1,0,0,0,0,0,1,0,0,0,1,0,1,1,1,1,1,0,1,1,1,5,1,1,0,1,1,0,0,0,2,0,0,1,1,0,0,2,1,0,3,0,1,0,1,0,0,1,0,1,0,1,4,0,0,0,0,2,0,0,0,1,0,0,0,0,1,0,1,0,0,0,0,0,1585,1,2102,3,0,1,0,1,0,0,0,0
0,0,2,2,1,1,9158,1,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,1,0,189,0,0,0,0,0,2,1,1,1,1,0,2,0,0,2,50,3,2,2,1,4,3,4,0,1,1,1,2,2267,4493,8347,1,1,1,0,0,0,1,1,0,1,0,2,0,0,1,1,0,0,0,0,1,0,1,1,0,1,0,0,0,0,2,0,0,0,1,2,1,1,0,1,1,1,1,1,0,0,1,1,0,0,0,1,0,0,0,0,0,0,1,1,1,0,0,0,0,0,1,1,0,1,2,1,1,5,0,0,4,1,1,0,0,0,4,1,3,10,1,1,0,1,2,4,1,0,0,2,7,0,3,5,2,3,2,0,2,2,0,10,5,42,3,5,0,0,2,3,7,1,0,2,5,9,2,0,0,0,1,1,0,0,1,0,0,0,2,0,1,0,0,1,1,0,0,1,2,0,1,0,0,1150,3474,1,0,0,0,1,0,0,0,0,46,1,98,53,1,1,1,1,0,0,0,1,1,1,0,0,0,0,0,1,0,0,0,1,0,1,1,1,0,0,0,0,1,3,6,1,0,0,0,2,0,1,0,1,0,0,1,0,0,0,0,0,0,2,0,1,1,0,0,1,0,0,1,0,0,1,0,0,0,0,0,0,0,0,1,0,0,1,1,1,0,1,0,0,0,0,0,426,1,-482,1,0,1,0,0,0,1,0,0
0,1,3,2,0,0,7318,1,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,1,2,164,0,0,0,0,0,1,0,0,1,1,0,1,0,0,0,22,0,0,1,2,2,1,4,1,0,0,0,1,-501,-3609,1617,0,0,0,0,1,0,1,0,0,1,0,0,0,0,0,0,0,0,0,1,1,0,0,0,1,0,1,0,1,0,2,0,0,0,1,1,1,0,0,0,0,1,0,0,1,0,0,0,0,0,1,0,1,0,1,0,1,0,0,0,1,0,1,1,1,1,1,0,0,0,2,0,0,0,0,2,0,2,1,0,0,1,5,0,1,6,0,0,2,0,3,7,1,1,0,1,1,2,0,1,1,2,0,0,0,1,2,3,0,15,1,6,0,0,2,1,2,4,0,2,5,3,0,0,0,0,0,1,1,0,0,2,0,0,2,0,0,0,0,0,0,0,0,0,1,0,1,1,1,573,760,1,0,0,0,0,0,0,0,0,35,0,757,329,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,57,1,1,0,0,0,0,1,0,0,0,2,0,0,3,0,0,0,0,1,0,0,0,1,0,2,0,0,0,0,1,0,0,0,1,0,0,1,1,0,1,1,21,1,1,0,1,0,0,0,0,0,0,3,0,1,0,0,0,741,1,-1686,1,0,1,0,1,0,0,0,0


Create some scoring functions we can use in a grid search. We will use the balanced accuracy version of the delta function to avoid getting stuck in the case of predicting all zeros.

In [10]:
from sklearn import metrics as skm

def discrimination(y_true, y_pred):
    return abs(statistical_parity_difference(y_true, y_pred, prot_attr=protected_attributes))

def delta(y_true, y_pred, use_bal_acc=False):
    if use_bal_acc:
        return balanced_accuracy_score(y_true, y_pred) - discrimination(y_true, y_pred)
    else:
        return accuracy_score(y_true, y_pred) - discrimination(y_true, y_pred)

min_disc = make_scorer(statistical_parity_difference, prot_attr=protected_attributes)
max_delta = skm.make_scorer(delta, use_bal_acc=True)

Use a grid search to find the best model. Note: this takes a while to run.

In [11]:

protected_attributes = ["persoon_geslacht_vrouw", "typering_ind"]


lfr = LearnedFairRepresentations(protected_attributes, n_prototypes=25, max_iter=10, random_state=RANDOM_STATE)
lfr.fit(X_train, y_train)


params = {'reconstruct_weight': [1e-2, 1e-3, 1e-4],
        'target_weight': [100, 1000],
        'fairness_weight': [0, 100, 1000]}
grid = GridSearchCV(lfr, params, scoring=max_delta, cv=3, n_jobs=-1).fit(X_train, y_train)
res = pd.DataFrame(grid.cv_results_)
res

AttributeError: 'str' object has no attribute 'decode'

Compare predictions from naive logistic regression, LFR (in-processing), and LFR (pre-processing) with a logistic regression classifier.

In [None]:
y_pred_lfr = grid.predict(X_test)
gbc = GradientBoostingClassifier(random_state=RANDOM_STATE)
y_pred_lr = gbc.fit(X_train, y_train).predict(X_test)
y_pred_lfr_lr = gbc.fit(grid.transform(X_train), y_train).predict(X_test)

In [None]:
conf_matrix = confusion_matrix(y_test, y_pred_lr)
print(conf_matrix)

class_report = classification_report(y_test, y_pred_lr)
print(class_report)

[[2815   22]
 [ 175  150]]
              precision    recall  f1-score   support

           0       0.94      0.99      0.97      2837
           1       0.87      0.46      0.60       325

    accuracy                           0.94      3162
   macro avg       0.91      0.73      0.78      3162
weighted avg       0.93      0.94      0.93      3162



In [None]:
conf_matrix = confusion_matrix(y_test, y_pred_lfr)
print(conf_matrix)

class_report = classification_report(y_test, y_pred_lfr)
print(class_report)

[[2837    0]
 [ 325    0]]
              precision    recall  f1-score   support

           0       0.90      1.00      0.95      2837
           1       0.00      0.00      0.00       325

    accuracy                           0.90      3162
   macro avg       0.45      0.50      0.47      3162
weighted avg       0.80      0.90      0.85      3162



  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))


Feel free to try this out with other datasets as well!