# Projet Final - Classification binaire

- **Description du projet :**

> Ce projet consiste à prédire le parti politique gagnant des élections présidentielles de 2020 aux États-Unis à partir des données socio-démographiques.

![US](https://prod-media-eng.dhakatribune.com/uploads/2020/06/bigstock-illustration-of-election-357906857-1592827070539.jpg)

Dans cette partie de `modélisation` et `d'évaluation` nous allons prendre en compte les conclusions faites dans la précendente partie d'`exploration de données` afin de bien définir les modalités de `modélisation`. Il tient à noter que nous `évaluerons` nos `modèles` avec la `métrique` de `Score F1`

## Table de matières
<ol>
    <li><a href="#def">Définition du problème</a></li>
    <li><a href="#import_data">Importation et acquisition de données</a>
        <ol>
            <li><a href="#import">Importation des librairies</a></li>
            <li><a href="#get_data">Acquisition de données</a></li>
        </ol>
    </li>
    <li><a href="#feat_engin">Feature Engineering</a></li>
    <li><a href="#model">Construction de modèle</a>
        <ol>
            <li><a href="#pipeline">Pipeline</a></li>
            <li><a href="#hyperparams">Optimisation des hyperparamètres et évaluation</a></li>
        </ol>
    </li>
    <li><a href="#expli">Explicabilité de modèle</a>
        <ol>
            <li><a href="#globale">Analyse de l'importance des variables globales</a></li>
        </ol>
    </li>
</ol>

<a id="def"></a>
## 1. Définition du problème

- L'objectif est de *`prédire` le parti politique victorieux de chaque état U.S aux élections de 2020 en fonction d'un ensemble de données socio-démographiques et d'évaluer la performance du `modèle`.*

- Nous avons à notre disposition plusieurs jeux de données, notamment ceux des résulatats entre 2008 et 2016 et également ceux de 2020 mais les prédictions se feront uniquement avec le `Dataset` des élections de `2020`.

- Nous partirons de rien et essayer de construire progressivement une solution atteignant une très bonne performance.

- Il s'agit bien d'un problème de *`Machine Learning Supervisé`* et plus précisement d'une tâche de *`classification binaire`* dont l'objectif est de prédire une variable `qualitative discrète` : *`Parti Républicain (1)`* ou *`Parti Démocrate (0)`.*

- Le `modèle` sera évalué en utilisant la métrique de *`Score F1`* qui est le rapport entre deux métriques *`Precision`* et  *`Recall`* mais nous utiliserons également d'autres `métriques` comme le `Recall`, la `Precision` et l'`accuracy` pour évaluer le modèle afin comparer leurs performances.

<a id="import_data"></a>
## 2. Importation des packages nécessaires et acquisition de données

<a id="import"></a>
## 2.1 Importation des packages nécessaires au travail

In [1]:
# Packages de manipulation des tableaux et DataFrames
import numpy as np
import pandas as pd
from skimpy import skim

# Package pour la réprésentation graphique
import plotly.express as px

# Packages pour l'analyse statistique
import scipy.stats as ss

# Pour gérer les expressions régulières
import re

# Package xgboost
from xgboost import XGBClassifier

# Packages scikit-learn pour la modélisation
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.feature_selection import RFECV
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder, RobustScaler
from sklearn.pipeline import Pipeline, make_pipeline
from sklearn.compose import make_column_transformer
from sklearn.linear_model import LogisticRegression
from sklearn import svm
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import f1_score, accuracy_score, recall_score, precision_score

# Package pour interpréter les modèles
import shap

<a id="get_data"></a>
## 2.2 Acquisition des données

In [2]:
# Afficher toutes les colnnes de nos DataFrames
pd.set_option('display.max_columns', None)

In [3]:
# Charger les données dans le notebook
df_election = pd.read_csv("../data/elections.csv")

In [4]:
# Afficher la taille des données de train
print(f"La base fait {df_election.shape[0]} et {df_election.shape[1]} colonnes")
# Afficher les 5 premières lignes de nos données
df_election.head()

La base fait 3111 et 354 colonnes


Unnamed: 0,state_name,fips_code,county_name,votes_gop,votes_dem,total_votes,diff,per_gop,per_dem,per_point_diff,win,county,total_2008,dem_2008,gop_2008,oth_2008,total_2012,dem_2012,gop_2012,oth_2012,total_2016,dem_2016,gop_2016,oth_2016,State_x,Area_Name,Rural-urban_Continuum Code_2003,Rural-urban_Continuum Code_2013,Urban_Influence_Code_2003_x,Urban_Influence_Code_2013_x,Economic_typology_2015,CENSUS_2010_POP,ESTIMATES_BASE_2010,POP_ESTIMATE_2010,POP_ESTIMATE_2011,POP_ESTIMATE_2012,POP_ESTIMATE_2013,POP_ESTIMATE_2014,POP_ESTIMATE_2015,POP_ESTIMATE_2016,POP_ESTIMATE_2017,POP_ESTIMATE_2018,POP_ESTIMATE_2019,N_POP_CHG_2010,N_POP_CHG_2011,N_POP_CHG_2012,N_POP_CHG_2013,N_POP_CHG_2014,N_POP_CHG_2015,N_POP_CHG_2016,N_POP_CHG_2017,N_POP_CHG_2018,N_POP_CHG_2019,Births_2010,Births_2011,Births_2012,Births_2013,Births_2014,Births_2015,Births_2016,Births_2017,Births_2018,Births_2019,Deaths_2010,Deaths_2011,Deaths_2012,Deaths_2013,Deaths_2014,Deaths_2015,Deaths_2016,Deaths_2017,Deaths_2018,Deaths_2019,NATURAL_INC_2010,NATURAL_INC_2011,NATURAL_INC_2012,NATURAL_INC_2013,NATURAL_INC_2014,NATURAL_INC_2015,NATURAL_INC_2016,NATURAL_INC_2017,NATURAL_INC_2018,NATURAL_INC_2019,INTERNATIONAL_MIG_2010,INTERNATIONAL_MIG_2011,INTERNATIONAL_MIG_2012,INTERNATIONAL_MIG_2013,INTERNATIONAL_MIG_2014,INTERNATIONAL_MIG_2015,INTERNATIONAL_MIG_2016,INTERNATIONAL_MIG_2017,INTERNATIONAL_MIG_2018,INTERNATIONAL_MIG_2019,DOMESTIC_MIG_2010,DOMESTIC_MIG_2011,DOMESTIC_MIG_2012,DOMESTIC_MIG_2013,DOMESTIC_MIG_2014,DOMESTIC_MIG_2015,DOMESTIC_MIG_2016,DOMESTIC_MIG_2017,DOMESTIC_MIG_2018,DOMESTIC_MIG_2019,NET_MIG_2010,NET_MIG_2011,NET_MIG_2012,NET_MIG_2013,NET_MIG_2014,NET_MIG_2015,NET_MIG_2016,NET_MIG_2017,NET_MIG_2018,NET_MIG_2019,RESIDUAL_2010,RESIDUAL_2011,RESIDUAL_2012,RESIDUAL_2013,RESIDUAL_2014,RESIDUAL_2015,RESIDUAL_2016,RESIDUAL_2017,RESIDUAL_2018,RESIDUAL_2019,GQ_ESTIMATES_BASE_2010,GQ_ESTIMATES_2010,GQ_ESTIMATES_2011,GQ_ESTIMATES_2012,GQ_ESTIMATES_2013,GQ_ESTIMATES_2014,GQ_ESTIMATES_2015,GQ_ESTIMATES_2016,GQ_ESTIMATES_2017,GQ_ESTIMATES_2018,GQ_ESTIMATES_2019,R_birth_2011,R_birth_2012,R_birth_2013,R_birth_2014,R_birth_2015,R_birth_2016,R_birth_2017,R_birth_2018,R_birth_2019,R_death_2011,R_death_2012,R_death_2013,R_death_2014,R_death_2015,R_death_2016,R_death_2017,R_death_2018,R_death_2019,R_NATURAL_INC_2011,R_NATURAL_INC_2012,R_NATURAL_INC_2013,R_NATURAL_INC_2014,R_NATURAL_INC_2015,R_NATURAL_INC_2016,R_NATURAL_INC_2017,R_NATURAL_INC_2018,R_NATURAL_INC_2019,R_INTERNATIONAL_MIG_2011,R_INTERNATIONAL_MIG_2012,R_INTERNATIONAL_MIG_2013,R_INTERNATIONAL_MIG_2014,R_INTERNATIONAL_MIG_2015,R_INTERNATIONAL_MIG_2016,R_INTERNATIONAL_MIG_2017,R_INTERNATIONAL_MIG_2018,R_INTERNATIONAL_MIG_2019,R_DOMESTIC_MIG_2011,R_DOMESTIC_MIG_2012,R_DOMESTIC_MIG_2013,R_DOMESTIC_MIG_2014,R_DOMESTIC_MIG_2015,R_DOMESTIC_MIG_2016,R_DOMESTIC_MIG_2017,R_DOMESTIC_MIG_2018,R_DOMESTIC_MIG_2019,R_NET_MIG_2011,R_NET_MIG_2012,R_NET_MIG_2013,R_NET_MIG_2014,R_NET_MIG_2015,R_NET_MIG_2016,R_NET_MIG_2017,R_NET_MIG_2018,R_NET_MIG_2019,State_y,Area name,2003 Rural-urban Continuum Code,2003 Urban Influence Code,2013 Rural-urban Continuum Code,2013 Urban Influence Code,"Less than a high school diploma, 1970","High school diploma only, 1970","Some college (1-3 years), 1970","Four years of college or higher, 1970","Percent of adults with less than a high school diploma, 1970","Percent of adults with a high school diploma only, 1970","Percent of adults completing some college (1-3 years), 1970","Percent of adults completing four years of college or higher, 1970","Less than a high school diploma, 1980","High school diploma only, 1980","Some college (1-3 years), 1980","Four years of college or higher, 1980","Percent of adults with less than a high school diploma, 1980","Percent of adults with a high school diploma only, 1980","Percent of adults completing some college (1-3 years), 1980","Percent of adults completing four years of college or higher, 1980","Less than a high school diploma, 1990","High school diploma only, 1990","Some college or associate's degree, 1990","Bachelor's degree or higher, 1990","Percent of adults with less than a high school diploma, 1990","Percent of adults with a high school diploma only, 1990","Percent of adults completing some college or associate's degree, 1990","Percent of adults with a bachelor's degree or higher, 1990","Less than a high school diploma, 2000","High school diploma only, 2000","Some college or associate's degree, 2000","Bachelor's degree or higher, 2000","Percent of adults with less than a high school diploma, 2000","Percent of adults with a high school diploma only, 2000","Percent of adults completing some college or associate's degree, 2000","Percent of adults with a bachelor's degree or higher, 2000","Less than a high school diploma, 2015-19","High school diploma only, 2015-19","Some college or associate's degree, 2015-19","Bachelor's degree or higher, 2015-19","Percent of adults with less than a high school diploma, 2015-19","Percent of adults with a high school diploma only, 2015-19","Percent of adults completing some college or associate's degree, 2015-19","Percent of adults with a bachelor's degree or higher, 2015-19",Stabr_x,Area_name,Rural-urban_Continuum_Code_2003,Urban_Influence_Code_2003_y,Rural-urban_Continuum_Code_2013,Urban_Influence_Code_2013_y,POVALL_2019,CI90LBALL_2019,CI90UBALL_2019,PCTPOVALL_2019,CI90LBALLP_2019,CI90UBALLP_2019,POV017_2019,CI90LB017_2019,CI90UB017_2019,PCTPOV017_2019,CI90LB017P_2019,CI90UB017P_2019,POV517_2019,CI90LB517_2019,CI90UB517_2019,PCTPOV517_2019,CI90LB517P_2019,CI90UB517P_2019,MEDHHINC_2019,CI90LBINC_2019,CI90UBINC_2019,POV04_2019,CI90LB04_2019,CI90UB04_2019,PCTPOV04_2019,CI90LB04P_2019,CI90UB04P_2019,Stabr_y,area_name,Rural_urban_continuum_code_2013,Urban_influence_code_2013,Metro_2013,Civilian_labor_force_2000,Employed_2000,Unemployed_2000,Unemployment_rate_2000,Civilian_labor_force_2001,Employed_2001,Unemployed_2001,Unemployment_rate_2001,Civilian_labor_force_2002,Employed_2002,Unemployed_2002,Unemployment_rate_2002,Civilian_labor_force_2003,Employed_2003,Unemployed_2003,Unemployment_rate_2003,Civilian_labor_force_2004,Employed_2004,Unemployed_2004,Unemployment_rate_2004,Civilian_labor_force_2005,Employed_2005,Unemployed_2005,Unemployment_rate_2005,Civilian_labor_force_2006,Employed_2006,Unemployed_2006,Unemployment_rate_2006,Civilian_labor_force_2007,Employed_2007,Unemployed_2007,Unemployment_rate_2007,Civilian_labor_force_2008,Employed_2008,Unemployed_2008,Unemployment_rate_2008,Civilian_labor_force_2009,Employed_2009,Unemployed_2009,Unemployment_rate_2009,Civilian_labor_force_2010,Employed_2010,Unemployed_2010,Unemployment_rate_2010,Civilian_labor_force_2011,Employed_2011,Unemployed_2011,Unemployment_rate_2011,Civilian_labor_force_2012,Employed_2012,Unemployed_2012,Unemployment_rate_2012,Civilian_labor_force_2013,Employed_2013,Unemployed_2013,Unemployment_rate_2013,Civilian_labor_force_2014,Employed_2014,Unemployed_2014,Unemployment_rate_2014,Civilian_labor_force_2015,Employed_2015,Unemployed_2015,Unemployment_rate_2015,Civilian_labor_force_2016,Employed_2016,Unemployed_2016,Unemployment_rate_2016,Civilian_labor_force_2017,Employed_2017,Unemployed_2017,Unemployment_rate_2017,Civilian_labor_force_2018,Employed_2018,Unemployed_2018,Unemployment_rate_2018,Civilian_labor_force_2019,Employed_2019,Unemployed_2019,Unemployment_rate_2019,Median_Household_Income_2019,Med_HH_Income_Percent_of_State_Total_2019
0,Alabama,1001,Autauga County,19838,7503,27770,12335,0.714368,0.270184,0.444184,1,Autauga County,23641,6093,17403,145,23909,6354,17366,189,24661,5908,18110,643,AL,Autauga County,2.0,2.0,2.0,2.0,0.0,54571,54597,54773,55227,54954,54727,54893,54864,55243,55390,55533,55869,176.0,454.0,-273.0,-227.0,166.0,-29.0,379.0,147.0,143.0,336.0,150.0,638.0,615.0,571.0,640.0,651.0,666.0,676.0,631.0,624.0,157.0,514.0,560.0,582.0,573.0,584.0,547.0,573.0,518.0,541.0,-7.0,124.0,55.0,-11.0,67.0,67.0,119.0,103.0,113.0,83.0,25.0,4.0,-14.0,12.0,7.0,13.0,-3.0,-12.0,-7.0,-16.0,147.0,327.0,-329.0,-226.0,101.0,-107.0,266.0,59.0,37.0,270.0,172.0,331.0,-343.0,-214.0,108.0,-94.0,263.0,47.0,30.0,254.0,11.0,-1.0,15.0,-2.0,-9.0,-2.0,-3.0,-3.0,0.0,-1.0,455.0,455.0,455.0,455.0,455.0,455.0,455.0,455.0,455.0,455.0,455.0,11.6,11.163449,10.412013,11.676701,11.862569,12.097324,12.220585,11.377262,11.202671,9.345455,10.165092,10.612595,10.454297,10.64169,9.93579,10.358573,9.339812,9.712572,2.254545,0.998357,-0.200582,1.222405,1.220879,2.161534,1.862012,2.037449,1.490099,0.072727,-0.254127,0.218816,0.127714,0.236887,-0.054492,-0.216933,-0.126214,-0.287248,5.945455,-5.971992,-4.121042,1.842729,-1.949762,4.831664,1.06659,0.667129,4.84731,6.018182,-6.226119,-3.902226,1.970443,-1.712875,4.777171,0.849656,0.540916,4.560062,AL,Autauga County,2.0,2.0,2.0,2.0,6611.0,3757.0,933.0,767.0,54.8,31.1,7.7,6.4,7074.0,6145.0,2104.0,2117.0,40.6,35.2,12.1,12.1,6252.0,6671.0,4912.0,3026.0,30.0,32.0,23.5,14.5,5872.0,9332.0,7413.0,4972.0,21.3,33.8,26.9,18.0,4291.0,12551.0,10596.0,9929.0,11.483395,33.588459,28.356571,26.571573,AL,Autauga County,2.0,2.0,2.0,2.0,6723,5517,7929,12.1,9.9,14.3,2040,1472,2608,15.9,11.5,20.3,1376,902,1850,14.4,9.4,19.4,58233,52517,63949,,,,,,,AL,"Autauga County, AL",2.0,2.0,1.0,21720.0,20846.0,874.0,4.0,21955.0,21055.0,900.0,4.1,22094.0,21035.0,1059.0,4.8,22604.0,21462.0,1142.0,5.1,23218.0,22103.0,1115.0,4.8,23949.0,23037.0,912.0,3.8,24398.0,23585.0,813.0,3.3,24383.0,23577.0,806.0,3.3,24687.0,23420.0,1267.0,5.1,24703.0,22301.0,2402.0,9.7,25713.0,23431.0,2282.0,8.9,25836.0,23677.0,2159.0,8.4,25740.0,23961.0,1779.0,6.9,25810.0,24205.0,1605.0,6.2,25592.0,24097.0,1495.0,5.8,25652.0,24321.0,1331.0,5.2,26031.0,24709.0,1322.0,5.1,26075.0,25062.0,1013.0,3.9,26196.0,25261.0,935.0,3.6,26172.0,25458.0,714.0,2.7,58233.0,112.481888
1,Alabama,1003,Baldwin County,83544,24578,109679,58966,0.761714,0.22409,0.537623,1,Baldwin County,81413,19386,61271,756,84988,18329,65772,887,94090,18409,72780,2901,AL,Baldwin County,4.0,3.0,5.0,2.0,5.0,182265,182265,183112,186558,190145,194885,199183,202939,207601,212521,217855,223234,847.0,3446.0,3587.0,4740.0,4298.0,3756.0,4662.0,4920.0,5334.0,5379.0,516.0,2189.0,2093.0,2160.0,2212.0,2257.0,2300.0,2300.0,2310.0,2304.0,533.0,1829.0,1885.0,1900.0,1987.0,2098.0,2022.0,2099.0,2312.0,2326.0,-17.0,360.0,208.0,260.0,225.0,159.0,278.0,201.0,-2.0,-22.0,36.0,177.0,239.0,204.0,113.0,131.0,180.0,86.0,97.0,80.0,782.0,2899.0,3055.0,4176.0,3864.0,3433.0,4188.0,4619.0,5224.0,5297.0,818.0,3076.0,3294.0,4380.0,3977.0,3564.0,4368.0,4705.0,5321.0,5377.0,46.0,10.0,85.0,100.0,96.0,33.0,16.0,14.0,15.0,24.0,2307.0,2307.0,2263.0,2240.0,2296.0,2331.0,2337.0,2275.0,2193.0,2170.0,2170.0,11.842995,11.112202,11.219905,11.226489,11.225449,11.204755,10.9492,10.734799,10.446871,9.895312,10.007884,9.869361,10.084554,10.434644,9.850441,9.992336,10.744094,10.546624,1.947683,1.104318,1.350544,1.141935,0.790805,1.354314,0.956865,-0.009294,-0.099753,0.957611,1.268904,1.059658,0.573505,0.651544,0.876894,0.409405,0.450769,0.362739,15.684259,16.219674,21.691816,19.610829,17.07442,20.402397,21.988851,24.276447,24.017829,16.64187,17.488579,22.751474,20.184334,17.725964,21.279291,22.398256,24.727215,24.380567,AL,Baldwin County,4.0,5.0,3.0,2.0,18726.0,8426.0,2334.0,2038.0,59.4,26.7,7.4,6.5,18125.0,15380.0,6602.0,5498.0,39.7,33.7,14.5,12.1,17309.0,20544.0,15900.0,10870.0,26.8,31.8,24.6,16.8,17258.0,28428.0,28178.0,22146.0,18.0,29.6,29.3,23.1,13893.0,41797.0,47274.0,48148.0,9.193843,27.659616,31.284081,31.862459,AL,Baldwin County,4.0,5.0,3.0,2.0,22360,18541,26179,10.1,8.4,11.8,6323,4521,8125,13.5,9.6,17.4,4641,3295,5987,13.3,9.4,17.2,59871,54593,65149,,,,,,,AL,"Baldwin County, AL",3.0,2.0,1.0,69533.0,66971.0,2562.0,3.7,69161.0,66195.0,2966.0,4.3,69169.0,65691.0,3478.0,5.0,72299.0,68702.0,3597.0,5.0,74772.0,70919.0,3853.0,5.2,76804.0,73743.0,3061.0,4.0,79711.0,77147.0,2564.0,3.2,82659.0,80099.0,2560.0,3.1,83223.0,79372.0,3851.0,4.6,82451.0,74403.0,8048.0,9.8,83459.0,75120.0,8339.0,10.0,85045.0,77418.0,7627.0,9.0,84414.0,78065.0,6349.0,7.5,85280.0,79626.0,5654.0,6.6,86384.0,81083.0,5301.0,6.1,87872.0,83010.0,4862.0,5.5,90895.0,86060.0,4835.0,5.3,92456.0,88711.0,3745.0,4.1,95233.0,91809.0,3424.0,3.6,97328.0,94675.0,2653.0,2.7,59871.0,115.645828
2,Alabama,1005,Barbour County,5622,4816,10518,806,0.534512,0.457882,0.076631,1,Barbour County,11630,5697,5866,67,11459,5873,5539,47,10390,4848,5431,111,AL,Barbour County,6.0,6.0,6.0,6.0,3.0,27457,27455,27327,27341,27169,26937,26755,26283,25806,25157,24872,24686,-128.0,14.0,-172.0,-232.0,-182.0,-472.0,-477.0,-649.0,-285.0,-186.0,71.0,331.0,300.0,282.0,264.0,271.0,276.0,280.0,263.0,256.0,131.0,323.0,286.0,295.0,308.0,332.0,280.0,295.0,329.0,312.0,-60.0,8.0,14.0,-13.0,-44.0,-61.0,-4.0,-15.0,-66.0,-56.0,-1.0,-5.0,-12.0,-10.0,4.0,13.0,17.0,12.0,12.0,13.0,-69.0,13.0,-176.0,-210.0,-142.0,-430.0,-492.0,-649.0,-231.0,-141.0,-70.0,8.0,-188.0,-220.0,-138.0,-417.0,-475.0,-637.0,-219.0,-128.0,2.0,-2.0,2.0,1.0,0.0,6.0,2.0,3.0,0.0,-2.0,3193.0,3193.0,3380.0,3390.0,3388.0,3352.0,3193.0,2975.0,2817.0,2813.0,2812.0,12.109461,11.007155,10.423983,9.833867,10.219088,10.597247,10.988364,10.513902,10.331329,11.816785,10.493487,10.904521,11.472845,12.519326,10.75083,11.577026,13.152372,12.591307,0.292676,0.513667,-0.480538,-1.638978,-2.300238,-0.153583,-0.588662,-2.63847,-2.259978,-0.182922,-0.440286,-0.369645,0.148998,0.490215,0.652729,0.47093,0.479722,0.524638,0.475598,-6.457531,-7.76254,-5.289429,-16.214789,-18.890745,-25.469458,-9.234644,-5.690302,0.292676,-6.897817,-8.132185,-5.140431,-15.724575,-18.238016,-24.998528,-8.754922,-5.165664,AL,Barbour County,6.0,6.0,6.0,6.0,8120.0,2242.0,581.0,861.0,68.8,19.0,4.9,7.3,7759.0,3671.0,1362.0,1300.0,55.1,26.1,9.7,9.2,6965.0,4258.0,2622.0,1857.0,44.4,27.1,16.7,11.8,6679.0,6124.0,4025.0,2068.0,35.3,32.4,21.3,10.9,4812.0,6396.0,4676.0,2080.0,26.786907,35.604542,26.029837,11.578713,AL,Barbour County,6.0,6.0,6.0,6.0,5909,4787,7031,27.1,22.0,32.2,2050,1560,2540,41.0,31.2,50.8,1468,1114,1822,39.5,30.0,49.0,35972,31822,40122,,,,,,,AL,"Barbour County, AL",6.0,6.0,0.0,11373.0,10748.0,625.0,5.5,11250.0,10412.0,838.0,7.4,10971.0,10125.0,846.0,7.7,10977.0,10196.0,781.0,7.1,10633.0,9865.0,768.0,7.2,10760.0,10136.0,624.0,5.8,10705.0,10096.0,609.0,5.7,10334.0,9684.0,650.0,6.3,10161.0,9267.0,894.0,8.8,10003.0,8572.0,1431.0,14.3,10221.0,8959.0,1262.0,12.3,9849.0,8712.0,1137.0,11.5,9362.0,8283.0,1079.0,11.5,9099.0,8168.0,931.0,10.2,8845.0,7913.0,932.0,10.5,8625.0,7860.0,765.0,8.9,8436.0,7736.0,700.0,8.3,8349.0,7863.0,486.0,5.8,8414.0,7987.0,427.0,5.1,8537.0,8213.0,324.0,3.8,35972.0,69.482918
3,Alabama,1007,Bibb County,7525,1986,9595,5539,0.784263,0.206983,0.57728,1,Bibb County,8644,2299,6262,83,8391,2200,6131,60,8748,1874,6733,141,AL,Bibb County,1.0,1.0,1.0,1.0,0.0,22915,22915,22870,22745,22667,22521,22553,22566,22586,22550,22367,22394,-45.0,-125.0,-78.0,-146.0,32.0,13.0,20.0,-36.0,-183.0,27.0,44.0,264.0,246.0,258.0,253.0,251.0,276.0,291.0,232.0,240.0,32.0,276.0,236.0,275.0,247.0,265.0,241.0,252.0,263.0,252.0,12.0,-12.0,10.0,-17.0,6.0,-14.0,35.0,39.0,-31.0,-12.0,0.0,10.0,19.0,20.0,14.0,13.0,14.0,10.0,10.0,10.0,-59.0,-124.0,-105.0,-151.0,16.0,17.0,-30.0,-83.0,-164.0,31.0,-59.0,-114.0,-86.0,-131.0,30.0,30.0,-16.0,-73.0,-154.0,41.0,2.0,1.0,-2.0,2.0,-4.0,-3.0,1.0,-2.0,2.0,-2.0,2224.0,2224.0,2224.0,2228.0,2224.0,2245.0,2255.0,2204.0,2150.0,2146.0,2148.0,11.57514,10.834141,11.418961,11.225984,11.126133,12.225372,12.894364,10.330165,10.723621,12.101282,10.393729,12.171373,10.959755,11.746714,10.675053,11.166253,11.710488,11.259802,-0.526143,0.440412,-0.752412,0.266229,-0.620581,1.550319,1.728111,-1.380324,-0.536181,0.438452,0.836783,0.885191,0.621201,0.576254,0.620128,0.443105,0.445266,0.446818,-5.436808,-4.624328,-6.68319,0.709944,0.753563,-1.328845,-3.677774,-7.302358,1.385134,-4.998356,-3.787545,-5.797999,1.331144,1.329817,-0.708717,-3.234669,-6.857092,1.831952,AL,Bibb County,1.0,1.0,1.0,1.0,5272.0,1402.0,238.0,302.0,73.1,19.4,3.3,4.2,5254.0,2611.0,536.0,433.0,59.5,29.6,6.1,4.9,4850.0,3407.0,1332.0,476.0,48.2,33.8,13.2,4.7,4984.0,4838.0,2756.0,962.0,36.8,35.7,20.4,7.1,3386.0,7256.0,3848.0,1678.0,20.942602,44.878773,23.800098,10.378526,AL,Bibb County,1.0,1.0,1.0,1.0,4101,3225,4977,20.3,16.0,24.6,1147,827,1467,25.9,18.7,33.1,808,566,1050,25.2,17.7,32.7,47918,42291,53545,,,,,,,AL,"Bibb County, AL",1.0,1.0,1.0,8565.0,8111.0,454.0,5.3,9081.0,8468.0,613.0,6.8,8933.0,8309.0,624.0,7.0,8836.0,8309.0,527.0,6.0,8843.0,8359.0,484.0,5.5,8861.0,8463.0,398.0,4.5,8850.0,8477.0,373.0,4.2,8791.0,8432.0,359.0,4.1,8749.0,8241.0,508.0,5.8,8742.0,7581.0,1161.0,13.3,8934.0,7914.0,1020.0,11.4,8933.0,7996.0,937.0,10.5,8798.0,8047.0,751.0,8.5,8705.0,8016.0,689.0,7.9,8559.0,7942.0,617.0,7.2,8589.0,8021.0,568.0,6.6,8644.0,8088.0,556.0,6.4,8583.0,8208.0,375.0,4.4,8605.0,8268.0,337.0,3.9,8685.0,8419.0,266.0,3.1,47918.0,92.55761
4,Alabama,1009,Blount County,24711,2640,27588,22071,0.895716,0.095694,0.800022,1,Blount County,24267,3522,20389,356,23980,2961,20741,278,25384,2150,22808,426,AL,Blount County,1.0,1.0,1.0,1.0,0.0,57322,57322,57376,57560,57580,57619,57526,57526,57494,57787,57771,57826,54.0,184.0,20.0,39.0,-93.0,0.0,-32.0,293.0,-16.0,55.0,184.0,744.0,712.0,647.0,619.0,716.0,700.0,660.0,679.0,651.0,131.0,569.0,587.0,583.0,587.0,633.0,650.0,721.0,688.0,657.0,53.0,175.0,125.0,64.0,32.0,83.0,50.0,-61.0,-9.0,-6.0,-2.0,-16.0,5.0,45.0,40.0,13.0,22.0,-1.0,5.0,6.0,9.0,28.0,-100.0,-65.0,-158.0,-90.0,-102.0,358.0,-9.0,59.0,7.0,12.0,-95.0,-20.0,-118.0,-77.0,-80.0,357.0,-4.0,65.0,-6.0,-3.0,-10.0,-5.0,-7.0,-6.0,-2.0,-3.0,-3.0,-4.0,489.0,489.0,489.0,489.0,489.0,489.0,489.0,489.0,489.0,489.0,489.0,12.946335,12.367553,11.232736,10.751661,12.446546,12.171796,11.450282,11.751674,11.263268,9.901162,10.196283,10.121616,10.19584,11.00372,11.302382,12.508566,11.90744,11.367077,3.045173,2.17127,1.111121,0.555821,1.442826,0.869414,-1.058284,-0.155766,-0.103809,-0.278416,0.086851,0.781257,0.694776,0.225985,0.382542,-0.017349,0.086537,0.103809,0.487228,-1.737016,-1.128482,-2.744366,-1.56451,-1.773605,6.210911,-0.155766,1.020788,0.208812,-1.650165,-0.347225,-2.04959,-1.338525,-1.391062,6.193562,-0.069229,1.124597,AL,Blount County,1.0,1.0,1.0,1.0,10677.0,3440.0,626.0,404.0,70.5,22.7,4.1,2.7,11666.0,7011.0,1819.0,1144.0,53.9,32.4,8.4,5.3,9960.0,8763.0,4745.0,1773.0,39.5,34.7,18.8,7.0,9960.0,12136.0,8371.0,3235.0,29.6,36.0,24.8,9.6,7763.0,13299.0,13519.0,5210.0,19.509438,33.422131,33.975021,13.093413,AL,Blount County,1.0,1.0,1.0,1.0,9324,8037,10611,16.3,14.1,18.5,2750,2192,3308,21.0,16.7,25.3,2067,1641,2493,21.4,17.0,25.8,52902,46777,59027,,,,,,,AL,"Blount County, AL",1.0,1.0,1.0,25106.0,24231.0,875.0,3.5,25305.0,24393.0,912.0,3.6,25757.0,24366.0,1391.0,5.4,25900.0,24702.0,1198.0,4.6,26208.0,25101.0,1107.0,4.2,26446.0,25491.0,955.0,3.6,26770.0,25902.0,868.0,3.2,26629.0,25780.0,849.0,3.2,26698.0,25453.0,1245.0,4.7,26480.0,23832.0,2648.0,10.0,24906.0,22460.0,2446.0,9.8,25123.0,22939.0,2184.0,8.7,24960.0,23244.0,1716.0,6.9,24887.0,23325.0,1562.0,6.3,24527.0,23023.0,1504.0,6.1,24521.0,23198.0,1323.0,5.4,24684.0,23358.0,1326.0,5.4,24822.0,23824.0,998.0,4.0,25069.0,24201.0,868.0,3.5,25331.0,24655.0,676.0,2.7,52902.0,102.184624


- **Affichage de la distribution de la target avant de stratifier les données**

In [5]:
# Afficher répartition distributive de la target
df_election["win"].value_counts(normalize=True)

1    0.827387
0    0.172613
Name: win, dtype: float64

In [6]:
# Créer la matrice de variables explicatives
X = df_election.drop(columns=["win"])
# Créer la liste des colonnes numériques
num_cols = X.select_dtypes(include=np.number).columns.tolist()

- **Création de la target à partir des données sans outliers**

In [7]:
# Créer la target
X["win"] = np.where(X["votes_gop"] > X["votes_dem"],
                                 1, 0).astype(np.int64)

- **Sélection des variables des dernières années et celles jugées pertinentes vue métier**

In [8]:
cols_to_keep = ["county", "Economic_typology_2015", "POP_ESTIMATE_2019", "gop_2012", "dem_2012",
                "N_POP_CHG_2019", "Deaths_2019", "R_NATURAL_INC_2019", "PCTPOVALL_2019", "dem_2016",
                "gop_2016", "GQ_ESTIMATES_2019", "2013 Urban Influence Code", 
                "Unemployment_rate_2019", "R_DOMESTIC_MIG_2019", "Percent of adults with a bachelor's degree or higher, 2015-19",
                "Med_HH_Income_Percent_of_State_Total_2019", "Metro_2013", "win"]

In [9]:
# Sélectionner un sous-ensemble de colonnes sur lesquelles travailler
df_final = X[cols_to_keep].copy()

In [10]:
# Vérifier les modifications apportées
print(f"La nouvelle base fait {df_final.shape[0]} lignes et {df_final.shape[1]} colonnes")
# Afficher les 5 premières lignes des données sélectionnées
df_final.head()

La nouvelle base fait 3111 lignes et 19 colonnes


Unnamed: 0,county,Economic_typology_2015,POP_ESTIMATE_2019,gop_2012,dem_2012,N_POP_CHG_2019,Deaths_2019,R_NATURAL_INC_2019,PCTPOVALL_2019,dem_2016,gop_2016,GQ_ESTIMATES_2019,2013 Urban Influence Code,Unemployment_rate_2019,R_DOMESTIC_MIG_2019,"Percent of adults with a bachelor's degree or higher, 2015-19",Med_HH_Income_Percent_of_State_Total_2019,Metro_2013,win
0,Autauga County,0.0,55869,17366,6354,336.0,541.0,1.490099,12.1,5908,18110,455.0,2.0,2.7,4.84731,26.571573,112.481888,1.0,1
1,Baldwin County,5.0,223234,65772,18329,5379.0,2326.0,-0.099753,10.1,18409,72780,2170.0,2.0,2.7,24.017829,31.862459,115.645828,1.0,1
2,Barbour County,3.0,24686,5539,5873,-186.0,312.0,-2.259978,27.1,4848,5431,2812.0,6.0,3.8,-5.690302,11.578713,69.482918,0.0,1
3,Bibb County,0.0,22394,6131,2200,27.0,252.0,-0.536181,20.3,1874,6733,2148.0,1.0,3.1,1.385134,10.378526,92.55761,1.0,1
4,Blount County,0.0,57826,20741,2961,55.0,657.0,-0.103809,16.3,2150,22808,489.0,1.0,2.7,1.020788,13.093413,102.184624,1.0,1


<a id="feat_engin"></a>
## 4. Feature Engineering

- **Création du parti gagnant de chaque année entre 2012 et 2016**

In [11]:
# Afficher la description des données
skim(df_final)

In [12]:
# Créer le parti gagnant de 2012
df_final["win_12"] = np.where(df_final["gop_2012"] > df_final["dem_2012"],
                                 1, 0).astype(np.int64)
# Créer parti gagnant de 2016
df_final["win_16"] = np.where(df_final["gop_2016"] > df_final["dem_2016"],
                                 1, 0).astype(np.int64)

- **Suppression des variables servi à la création de chaque parti gagnant**

In [13]:
# Supprimer quelques variables
df_final.drop(columns=["gop_2012", "gop_2016",
                       "dem_2012", "dem_2016"], 
              inplace=True)

- **Division des données en jeu d'entrainement et de test**

In [14]:
# Définir la valeur de la seed
SEED = 42
# Stratifier les données sur a la target
df_train, df_test = train_test_split(df_final, test_size=0.20,
                                     random_state=SEED, stratify=df_final["win"]
                                     )

- **Affichage de la distribution de la target après la stratification de données**

In [15]:
# Distribution des données de train set
df_train["win"].value_counts(normalize=True)

1    0.827572
0    0.172428
Name: win, dtype: float64

In [16]:
# Distribution des données de test set
df_test["win"].value_counts(normalize=True)

1    0.826645
0    0.173355
Name: win, dtype: float64

<a id="model"></a>
## 5. Construction du modèle

Dans cette partie de construction du 1er modèle de machine learning, nous allons entrainer quatre différents modèles et retenir celui qui généralise le mieux afin de construire le modèle final sur celui retenu en terme de bonnes performances.

- **Division des jeux de train et test en matrices vecteurs**

In [17]:
# Créer la matrice de train set
X_train = df_train.drop(columns=["win", "win_12", "win_16", 
                                 "POP_ESTIMATE_2019"])
# Créer le vecteur de train set
y_train = df_train["win"]

# Créer la matrice de test et le vecteur de test
X_test = df_test.drop(columns=["win", "win_12", "win_16",
                               "POP_ESTIMATE_2019"])
y_test = df_test["win"]

- **Création des listes de variables par catégorie**

In [18]:
# Créer la liste des variables numériques
num_cols = X_train.select_dtypes(include=np.number).columns.tolist()
# Créer la liste des variables catégorielles
cat_cols = X_train.select_dtypes(exclude=np.number).columns.tolist()
# Créer la liste de toutes les variables
all_cols = X_train.columns.tolist()

<a id="pipeline"></a>
## 5.1 Pipeline pour entrainer les modèles sélectionnés

Pour construire nos modèles nous avons choisis d'utiliser des **`Pipelines`** pour faire ces différents traitements :

- **`Imputation` de valeurs manquantes** numériques par la médiane et catégorielles par la modalité "`missing`".
- **`Encodage` de variables catégorielles** avec le **`One-Hot Encoder`**.
- **`Normalisation` des variables** avec le **`RobustScaler`**.

***Pour rapel, le `Data Preprocessing` (Pré-Traitement de données) :***

C'est une opération ou une étape *`très capitale`* qui consiste à transofomer les données pour les mettre dans un format propice au développement d'un **`modèle`** de ***`Machine Learning`***

Ensuite, nous entraînerons plusieurs modèles afin de retenir celui qui présentes des meilleurs performance en terme du **`Score de F1`**.

- **Définition de la fonction d'entraînement des modèles**

In [19]:
# Définir la fonction pour entrainer les modèles
def fit_model(estimator, X_train, y_train, **kwargs):
    """Cette fonction permet d'entrainer un modèle de Machine Learning en fonction
       de l'estimateur, les données d'entrainement  et renvoi un modèle entrainé

    Args:
        estimator (Classifieur): C'est l'estimateur qu'il faut utiliser 
        X (DataFrame): Les données d'explicatives d'entrainement
        y (Vecteur): Le vecteur explicatif d'entrainement

    Returns:
        Classifieur: Le modèle entrainé
    """

    # Séparer les colonnes numériques et catégorielles
    num_cols = X_train.select_dtypes(include=np.number).columns
    cat_cols = X_train.select_dtypes(exclude=np.number).columns
    
    # Traiter les variables numériques
    num_pipeline = make_pipeline(
        SimpleImputer(strategy='median'),
        RobustScaler()
    )
    # Traiter les variables catégorielles
    cat_pipeline = make_pipeline(
        SimpleImputer(strategy='constant', fill_value='missing'),
        OneHotEncoder(handle_unknown='ignore')
    )
    # Combiner les deux pipelines 
    preprocessor = make_column_transformer(
        (num_pipeline, num_cols),
        (cat_pipeline, cat_cols)
    )
    # Construire le modèle
    model = Pipeline(
        steps=[
            ("preprocessor", preprocessor),
            ("estimator", estimator)
        ]
    )
    # Renvoyer un modèle construit et entrainé
    return model.fit(X_train, y_train, **kwargs)

- **Définition de la fonction d'évaluation des modèles**

In [20]:
# Définir la fonction d'évaluation des modèles
def model_evaluation(model, X_train, y_train, X_test, y_test):
    """Cette fonction permet d'évaluer la performance d'un modèle

    Args:
        model (Classifieur): L'estimateur à utiliser pour évaluer le modèle
        X_train (DataFrame): Les données explicative d'entrainement
        y_train (Vecteur): Le vecteur target d'entrainement
        X_test (DataFrame): Les données explicatives de test
        y_test (Vecteur): Le vecteur target de test

    Returns:
        float: Ce sont les scores f1 de train et de test qui sont renvoyés
    """

    # Prédir sur les jeux de données de train et de test
    y_train_pred = model.predict(X_train)
    y_test_pred = model.predict(X_test)

    # Calculer le Score F1 sur les deux jeux de données
    f1_train = f1_score(y_train, y_train_pred)
    f1_test = f1_score(y_test, y_test_pred)

    # Renvoyer le Score F1 de chaque jeu
    return f1_train, f1_test

- **Définir le dictionnaire des modèles a entrainer**

In [21]:
# Dictionnaire des modèles à entraîner
models = {
    "LogisticRegression":
    LogisticRegression(
        max_iter=1000,
        random_state=SEED
    ),
    "SVM":
    svm.SVC(
        kernel="linear"
    ),
    "XGBClassifier":
    XGBClassifier(
        n_estimators=80,
        eval_metric='logloss',
        random_state=SEED
    ),
    "RandomForestClassifier":
    RandomForestClassifier(
        n_estimators=400,
        max_depth=3,
        random_state=SEED
    )
}

- **Parcourir le dictionnaire des modèles**

In [22]:
# Boucler sur chacun des modèles
for model_name, model in models.items():

    # Entrainer le model
    fit_m = fit_model(model, X_train, y_train)

    # Calculer les scores f1 du train et de test
    evaluation = model_evaluation(fit_m, X_train, y_train, X_test, y_test)

    # Afficher pour chaque modèle les scores f1 de train et de test
    print(f"Score F1 {model_name :-<30} : {round(evaluation[0], 4)} (train)",
          f"{round(evaluation[1], 4)} (test)"
          )

Score F1 LogisticRegression------------ : 0.9533 (train) 0.938 (test)
Score F1 SVM--------------------------- : 0.978 (train) 0.9379 (test)
Score F1 XGBClassifier----------------- : 1.0 (train) 0.9488 (test)
Score F1 RandomForestClassifier-------- : 0.9057 (train) 0.9051 (test)


- **Challenger le 1er modèle en ajoutant les partis gagnants**

In [23]:
# Créer la matrice de train set
X_train = df_train.drop(columns=["win", "POP_ESTIMATE_2019"])
# Créer le vecteur de train set
y_train = df_train["win"]

# Créer la matrice de test et le vecteur de test
X_test = df_test.drop(columns=["win", "POP_ESTIMATE_2019"])
y_test = df_test["win"]

In [24]:
# Créer la liste des variables numériques
num_cols = X_train.select_dtypes(include=np.number).columns.tolist()
# Créer la liste des variables catégorielles
cat_cols = X_train.select_dtypes(exclude=np.number).columns.tolist()

In [25]:
# Boucler sur chacun des modèles
for model_name, model in models.items():

    # Entrainer le model
    fit_m = fit_model(model, X_train, y_train)

    # Calculer les scores f1 du train et de test
    evaluation = model_evaluation(fit_m, X_train, y_train, X_test, y_test)

    # Afficher pour chaque modèle les scores f1 de train et de test
    print(f"Score F1 {model_name :-<30} : {round(evaluation[0], 4)} (train)",
          f"{round(evaluation[1], 4)} (test)"
          )

Score F1 LogisticRegression------------ : 0.9889 (train) 0.9913 (test)
Score F1 SVM--------------------------- : 0.9944 (train) 0.9903 (test)
Score F1 XGBClassifier----------------- : 1.0 (train) 0.9884 (test)
Score F1 RandomForestClassifier-------- : 0.9057 (train) 0.9051 (test)


On se rend vite compte que les données sur les partis gagnants contribuent énormement à l'amélioration des scores et ce, quelque soit le modèle mais il y a quelque chose de très intéressant avec le **`RandomForest`**, en effet, les scores de ce modèle ne changent pas que l'on ajoute ou non les partis gagnants.

Le **`XGBoost`** et la **`Forêt Aléatoire`** présentent de très bonnes performances en terme du `score f1` sur le jeu de `test`.

La **`Régression Logistique`** performe également bien en apparence mais présente un sous-apprentissage.

La **`Forêt Aléatoire`** apparaît plus robuste car l'écart de performance entre le `score f1` `train` et `score f1` `test` est très faible. Ce qui signifie que le modèle est facilement généralisable sur de nouveaux jeux de données par rapport aux autres modèles qui ont des performances qui chutent entre le train et le test. 

Donc, nous poursuivrons avec le modèle **[RandomForest](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html)** afin de mettre en oeuvre les techniques de sélection d'hyperparamètres.

<a id="hyperparams"></a>
## 5.2 Optmisation des hyperparamètres et évaluation du modèle final

In [26]:
# Définir la dictionnaire d'hyperparamètres
params_grid = {"n_estimators" : [300, 700, 1000],
               "max_depth" : [3, 5, 6],
              }
              
# Instancier l'estimateur
rfc = RandomForestClassifier(
    max_features="sqrt", 
    random_state=SEED
    )

# Rechercher les meilleurs hyperparamètres
grid_search_cv = GridSearchCV(
    estimator=rfc,
    param_grid=params_grid,
    scoring="f1",
    n_jobs=-1,
    cv=5,
    verbose=2
)

In [27]:
%%time
# Entrainer le modèle
random_model = fit_model(grid_search_cv, X_train, y_train)

# Evaluer le modèle
evaluation = model_evaluation(random_model, X_train, y_train, X_test, y_test)

Fitting 5 folds for each of 9 candidates, totalling 45 fits
Wall time: 44.2 s


In [28]:
# Afficher les résultats des performances
print(f"Nous obtenons : {round(evaluation[0], 4)} (train)",
      f"{round(evaluation[1], 4)} (test)")

Nous obtenons : 0.9315 (train) 0.9254 (test)


<a id="expli"></a>
## 6. Explicabilité de modèle

<a id="globale"></a>
## 6.1 Analyse de l'importance des variables globales

L'importance `globale` des variables permet de répresenter les varibles selon leur contribution à la participation de construction du modèle.

In [29]:
# Récupérer le meilleur classifieur
best_random_model = random_model.named_steps.estimator.best_estimator_

# Récupérer l'importance des variables
importance = best_random_model.feature_importances_

In [30]:
one_hot_features = (
    random_model
    .named_steps
    .preprocessor
    .named_transformers_['pipeline-2']
    .named_steps['onehotencoder']
    .get_feature_names_out(cat_cols)
).tolist()

# Créer la liste des colonnes
features_cols = num_cols + one_hot_features

# Créer le dataframe qui contient l'importance des variables
feature_importance = (
    pd.DataFrame(
        {"features_cols": features_cols, "importance": 100 * importance}
    )
    .sort_values(["importance"], ascending=False)
    .reset_index(drop=True)
)

# Afficher les 5 premières lignes du DataFrame
feature_importance.head()

Unnamed: 0,features_cols,importance
0,win_16,15.784618
1,win_12,13.926483
2,GQ_ESTIMATES_2019,10.582846
3,Deaths_2019,7.092296
4,Percent of adults with a bachelor's degree or ...,6.920625


In [31]:
# Représenter les 15 variables les plus importantes
fig = px.bar(feature_importance[0:15],
             y="features_cols", x="importance",
             hover_data={'importance': ':.2f'}
             )

fig.update_layout(
    title="Importance des variables : Random Forest",
    xaxis_title="Importance",
    yaxis_title="variables",
    margin=dict(l=0, r=0, t=30, b=50),
    width=900, height=600
)

# Afficher le graphique
fig.show()

> Pour des raisons de non exécution du code, je n'ai pas pu mettre le code d'analyse de l'importance de variables locales, car je n'ai pas non seulement été capable de résoudre cette erreur que j'ai renconté mais aussi, il faut souligner que cela fait partie du jeu.
>
>Il faut être honête et savoir dire que l'on ne peut afin d'avoir l'aide.
Donc, je n'ai pas été capable de faire cette analyse et donc j'ai jugé bon de ne pas présenter le code qui n'exécutait pas.
C'est dans cette dynamique que je me remets entièrement à vous, pour que vous me donnez des pistes nécessaires afin d'avancer, merci !