# M2 TIDE : Application des connaissances

In [None]:
import os
import sys
from pathlib import Path
import pandas as pd
from sklearn.preprocessing import StandardScaler
sys.path.insert(0, str(Path(os.getcwd()).resolve().parent.parent))
path = Path(f"../../data/processed").resolve()
from src.utils.class_modeling import ModelComparator

list_var_num: list = ['Duree_credit', 'Montant_credit', 'Age']
list_var_cat: list = ['Objet_credit', 'Historique_credit', 'Epargne', 'Anciennete_emploi', 
           'Situation_familiale', 'Anciennete_domicile', 'Nb_credits', 'Biens', 
           'Type_emploi', 'Comptes', 'Taux_effort', 'Autres_credits', 'Statut_domicile', 
           'Garanties', 'Telephone', 'Nb_pers_charge', 'Etranger']
target: str = "Cible"

X_train = pd.read_parquet(f"{path}/X_train.parquet")
X_test = pd.read_parquet(f"{path}/X_test.parquet")
y_train = pd.read_parquet(f"{path}/y_train.parquet").squeeze()
y_test = pd.read_parquet(f"{path}/y_test.parquet").squeeze()
random_state = 0

### 6. R√©gressions logistiques


<div class="alert alert-block alert-info">
<b>üîî Rappel sur la r√©gression logistique :</b></p>
  <table>
    <thead>
      <tr>
        <th>Avantages</th>
        <th>Inconv√©nients</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td>
          <ul>
            <li><code>interpr√©tabilit√© des r√©sultats</code> (signe des coefficients, rapports de cotes, etc‚Ä¶). Ces avantages rendent la RL particuli√®rement int√©ressante dans le monde professionnel. Par exemple, pour un score d'octroi de cr√©dit, on a pour obligation l√©gale d'expliquer les facteurs qui ont entrain√© le refus.</li>
            <li><code>robustesse des r√©sultats</code> (√©vite le sur-apprentissage) contrairement √† un mod√®le Boosting (ex : XGBoost) ou R√©seau de neurones.</li>
            <li><code>temps de calculs</code> (√† l'apprentissage et √† l'utilisation en production) plus faible qu'un XGBoost par exemple.</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Elle n√©cessite une <code>phase de pr√©paration des donn√©es plus exigeante</code> que les mod√®les √† base d'arbres et les r√©seaux de neurones (pr√©s√©lection des variables pour √©viter les colin√©arit√©s, normalisation des variables explicatives continues pour √©viter les effets d'√©chelle). N√©anmoins, pour r√©duire la multicolin√©arit√© et l'effet d'√©chelle, il est possible de p√©naliser (L2:Ridge, L1:Lasso, L1+L2:Elastic net).</li>
            <li><code>moins performante</code></li>
          </ul>
        </td>
      </tr>
    </tbody>
  </table>
<div>

#### 6.1 Identifier les variables explicatives non pertinentes pour la r√©gression logistique (cf parties pr√©c√©dentes sur l'√©tude des liens)

In [3]:
list_var_cat_to_drop: list = ['Statut_domicile', 'Taux_effort', 'Nb_credits', 'Type_emploi', 'Telephone', 'Anciennete_domicile', 'Nb_pers_charge'] # cf "Data_exploration.ipynb"
print(f'Rappel des variables √† supprimer pour la r√©gression logistique : {list_var_cat_to_drop}')
# => pas de variable cat√©gorielle √† supprimer

Rappel des variables √† supprimer pour la r√©gression logistique : ['Statut_domicile', 'Taux_effort', 'Nb_credits', 'Type_emploi', 'Telephone', 'Anciennete_domicile', 'Nb_pers_charge']


<div class="alert alert-block alert-info">
<b>Note :</b> On a supprim√© les variables cat√©gorielles d'origine de notre dataframe. Il va falloir trouver un moyen d'identifier les 
dummy variables associ√©es
</div>

In [4]:
dummy_var = [i for i in X_train.columns if i.startswith('DUMMY_')]
dummy_to_drop = []
for i in list_var_cat_to_drop:
    for j in dummy_var:
        if i in j:dummy_to_drop.append(j)
dummy_to_drop_for_RL = list(set(dummy_to_drop))
print(dummy_to_drop_for_RL)

['DUMMY_Telephone_Oui__enregistr√©_sous_le_nom_du_client', 'DUMMY_Taux_effort_4', 'DUMMY_Anciennete_domicile_2', 'DUMMY_Nb_pers_charge_2', 'DUMMY_Statut_domicile_Locataire', 'DUMMY_Type_emploi_Cadre___Ind√©pendant___Employ√©_hautement_qualifi√©___Dirigeant', 'DUMMY_Statut_domicile_Propri√©taire', 'DUMMY_Nb_credits_2', 'DUMMY_Anciennete_domicile_3', 'DUMMY_Taux_effort_3', 'DUMMY_Nb_credits_3', 'DUMMY_Anciennete_domicile_4', 'DUMMY_Type_emploi_Employ√©_qualifi√©___Fonctionnaire', 'DUMMY_Nb_credits_4', 'DUMMY_Anciennete_domicile_1', 'DUMMY_Type_emploi_Ch√¥meur___Non_qualifi√©___Non_r√©sident', 'DUMMY_Statut_domicile_H√©bergement_gratuit', 'DUMMY_Telephone_N√©ant', 'DUMMY_Taux_effort_1', 'DUMMY_Taux_effort_2', 'DUMMY_Type_emploi_Non_qualifi√©___r√©sident', 'DUMMY_Nb_credits_1', 'DUMMY_Nb_pers_charge_1']


#### 6.2 Normaliser les variables explicatives continues

<div class="alert alert-block alert-info">
<b>üîî Rappel : int√©r√™ts de la normalisation des variables explicatives continues</b></p>
  <table>
    <thead>
      <tr>
        <th>Avantage</th>
        <th>Description</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td>√âchelle homog√®ne</td>
        <td>Mettre toutes les variables sur une √©chelle comparable pour √©viter qu'une variable ne domine l'apprentissage en raison de valeurs plus grandes.</td>
      </tr>
      <tr>
        <td>Am√©lioration de la convergence</td>
        <td>Acc√©l√®re la convergence et facilite l'optimisation des algorithmes comme la descente de gradient, la r√©gression lin√©aire ou les r√©seaux de neurones.</td>
      </tr>
      <tr>
        <td>Performance des algorithmes</td>
        <td>√âvite que des variables √† grande √©chelle biaisent les calculs, notamment pour les algorithmes sensibles aux distances (kNN, SVM, etc.).</td>
      </tr>
      <tr>
        <td>Interpr√©tabilit√©</td>
        <td>Facilite l'interpr√©tation de l'importance relative de chaque variable dans le mod√®le.</td>
      </tr>
    </tbody>
  </table>
</div>


<div class="alert alert-block alert-info">
  <b>‚ö†Ô∏è Remarque tr√®s importante :</b>
  il est primordial de normaliser en prenant pour base la table d'apprentissage. Puis, appliquer la normalisation sur
le jeu de donn√©es test
</div>


In [5]:
scaler = StandardScaler()

X_train_with_norm = X_train.copy()
X_test_with_norm = X_test.copy()

# Apprentissage pour normaliser sur le jeu d'apprentissage
scaler.fit(X_train[list_var_num]) # calcule la moyenne et l'√©cart-type des variables de la liste "list_var_num"

# Application de la normalisation sur les jeux de donn√©es (train et test)
X_train_with_norm[list_var_num]= scaler.transform(X_train[list_var_num]) # train
X_test_with_norm[list_var_num] = scaler.transform(X_test[list_var_num]) # test

#### 6.3 Recherche du meilleur mod√®le 

In [6]:
list_models = ["Logistic Regression (L1)", "Logistic Regression (L2)", "Logistic Regression (ElasticNet)"] # liste des mod√©lisations √† tester
logistic_models = ModelComparator(y_train= y_train, X_train= X_train_with_norm, y_test= y_test, X_test= X_test_with_norm, list_models= list_models, random_state= random_state) # initier la class permettant la mod√©lisation

<div class="alert alert-block alert-info">
<b>üîî Rappel : plusieurs approches pour optimiser les hyperparam√®tres d'un mod√®le :</b></p>
  <table>
    <thead>
      <tr>
        <th>M√©thode</th>
        <th>Description</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td>Grid Search</td>
        <td>Exploration exhaustive d'une grille pr√©-d√©finie de valeurs d'hyperparam√®tres pour trouver la meilleure combinaison.</td>
      </tr>
      <tr>
      <tr>
        <td>M√©thode al√©atoire</td>
        <td>Exploration de l'espace des hyperparam√®tres en √©chantillonnant al√©atoirement des combinaisons, souvent plus efficace que Grid Search dans de grands espaces.</td>
      </tr>
        <td>Optimisation Bay√©sienne</td>
        <td> mod√®le probabiliste (souvent un processus gaussien) qui s√©lectionne intelligemment les prochaines combinaisons d'hyperparam√®tres √† tester. Cela permet d'√©quilibrer exploration (essayer de nouvelles zones) et exploitation (affiner les zones prometteuses), r√©duisant ainsi le nombre d'√©valuations n√©cessaires pour trouver des hyperparam√®tres optimaux.</td>
      </tr>
    </tbody>
  </table>
</div>


Nous allons utiliser `l'Optimisation Bay√©sienne` car c'est souvent celle qui permet les meilleurs r√©sultats (mais elle peut √™tre co√ªteuse en temps de calculs)

<div class="alert alert-block alert-info">
<b>üîî Rappel : m√©triques candidates pour optimiser les performances du mod√®le :</b></p>
  <table>
    <thead>
      <tr>
        <th>M√©trique</th>
        <th>Avantages</th>
        <th>Inconv√©nients</th>
        <th>Contexte d'utilisation</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td>Accuracy</td>
        <td>
          <ul>
            <li>Simple √† interpr√©ter</li>
            <li>Fournit une vue d'ensemble de la performance du mod√®le</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Peut √™tre trompeuse en cas de classes tr√®s d√©s√©quilibr√©es (cas fr√©quent en scoring de cr√©dit)</li>
            <li>Ne distingue pas le co√ªt entre octroi de cr√©dit √† risque et refus injustifi√©</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Peut √™tre utilis√©e comme indicateur global lorsque les d√©fauts sont suffisamment repr√©sentatifs</li>
          </ul>
        </td>
      </tr>
      <tr>
        <td>Precision</td>
        <td>
          <ul>
            <li>R√©duit le risque d'octroyer un cr√©dit √† un client √† risque</li>
            <li>Aide √† limiter les faux positifs, c'est-√†-dire les cas o√π un client est class√© comme bon payeur √† tort</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Peut n√©gliger les faux n√©gatifs (clients bons payeurs √† qui on refuse le cr√©dit √† tort)</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Privil√©gi√©e lorsque le co√ªt d'un cr√©dit accord√© √† un mauvais payeur est tr√®s √©lev√©</li>
          </ul>
        </td>
      </tr>
      <tr>
        <td>Recall (Sensibilit√©)</td>
        <td>
          <ul>
            <li>Maximise la d√©tection des clients √† risque</li>
            <li>Diminue le nombre de d√©fauts non identifi√©s</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Peut augmenter le nombre de faux positifs, entra√Ænant le refus de bons clients</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Essentielle quand il est primordial d'identifier tous les cas √† risque, m√™me au prix d'un taux de refus plus √©lev√©</li>
          </ul>
        </td>
      </tr>
      <tr>
        <td>F1-score</td>
        <td>
          <ul>
            <li>Fournit un √©quilibre entre la pr√©cision et le recall</li>
            <li>Utile pour mesurer la performance globale quand il faut minimiser √† la fois les erreurs de cr√©dit risqu√© accord√© et les refus injustifi√©s</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Moins intuitif √† interpr√©ter pour les √©quipes non techniques</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Recommand√© quand il faut trouver un compromis entre les faux positifs et faux n√©gatifs</li>
          </ul>
        </td>
      </tr>
      <tr>
        <td>ROC AUC</td>
        <td>
          <ul>
            <li>Mesure la capacit√© du mod√®le √† distinguer les bons payeurs des mauvais payeurs sur l'ensemble des seuils</li>
            <li>Ind√©pendante du seuil de d√©cision, ce qui est utile pour comparer plusieurs mod√®les</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Quand cible tr√®s d√©s√©quibr√©e, surestimation de la performance : un mod√®le peut obtenir une AUC √©lev√©e en se focalisant principalement sur la classe majoritaire, m√™me s'il d√©tecte mal la classe minoritaire. Ainsi, le mod√®le risque de mal d√©tecter les mauvais payeurs</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Id√©al pour la s√©lection et l'√©valuation globale des mod√®les de scoring de cr√©dit</li>
          </ul>
        </td>
      </tr>
      <tr>
        <td>Log Loss</td>
        <td>
          <ul>
            <li>Utilise la probabilit√© pr√©dite pour chaque client, ce qui aide √† calibrer le risque</li>
            <li>P√©nalise s√©v√®rement les pr√©dictions erron√©es avec haute confiance</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Peut √™tre moins intuitif pour les √©quipes op√©rationnelles</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Utile lors de la calibration du mod√®le pour obtenir des probabilit√©s bien calibr√©es et refl√©tant le risque r√©el</li>
          </ul>
        </td>
      </tr>
    </tbody>
  </table>
</div>


Nous allons privil√©gier le `F1-score` comme crit√®re.

<div class="alert alert-block alert-info">
<b>üîî Rappels sur les p√©nalisations</b></p>
  <table>
    <thead>
      <tr>
        <th>Type de R√©gression</th>
        <th>Principe</th>
        <th>Avantages</th>
        <th>Inconv√©nients</th>
        <th>Quand l'utiliser ?</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td>Ridge (L2)</td>
        <td>P√©nalise la somme des <b>carr√©s</b> des coefficients (L2)</td>
        <td>
          <ul>
            <li>R√©duit la variance du mod√®le</li>
            <li>G√®re bien la multicolin√©arit√©</li>
            <li>Convient aux mod√®les avec beaucoup de variables peu pertinentes</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Ne r√©alise pas de s√©lection de variables</li>
            <li>Les coefficients sont r√©duits mais jamais annul√©s</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Quand toutes les variables peuvent √™tre informatives</li>
            <li>Quand la stabilit√© est prioritaire √† l‚Äôinterpr√©tation</li>
          </ul>
        </td>
      </tr>
      <tr>
        <td>Lasso (L1)</td>
        <td>P√©nalise la somme des <b>valeurs absolues</b> des coefficients (L1)</td>
        <td>
          <ul>
            <li>Effectue une s√©lection automatique des variables</li>
            <li>Donne des mod√®les plus interpr√©tables</li>
            <li>Peut annuler certains coefficients ‚Üí simplification du mod√®le</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Moins stable quand les variables sont fortement corr√©l√©es</li>
            <li>Peut s√©lectionner arbitrairement parmi des variables similaires</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Quand on cherche un mod√®le simple avec peu de variables</li>
            <li>Utile en phase exploratoire pour rep√©rer les variables importantes</li>
          </ul>
        </td>
      </tr>
      <tr>
        <td>Elastic Net (L1 + L2)</td>
        <td>Combine les p√©nalit√©s L1 et L2</td>
        <td>
          <ul>
            <li>Compromis entre s√©lection de variables (L1) et stabilit√© (L2)</li>
            <li>G√®re bien les variables corr√©l√©es</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Ajoute un hyperparam√®tre suppl√©mentaire (`l1_ratio`)</li>
            <li>Plus complexe √† ajuster</li>
          </ul>
        </td>
        <td>
          <ul>
            <li>Quand il y a beaucoup de variables, certaines corr√©l√©es, d'autres inutiles</li>
            <li>Bon choix par d√©faut si on h√©site entre Lasso et Ridge</li>
          </ul>
        </td>
      </tr>
    </tbody>
  </table>
  <p><b>En r√©sum√© :</b></p>
    <ul>
      <li><b>Ridge (L2)</b> : Tous les coefficients restent, mais sont "r√©tr√©cis". Aucun n'est supprim√©. Mod√®le plus stable.</li>
      <li><b>Lasso (L1)</b> : Fait une s√©lection de variables en mettant certains coefficients √† z√©ro. Mod√®le plus simple.</li>
      <li><b>Elastic Net</b> : √âquilibre entre L1 et L2, utile quand les variables sont nombreuses et corr√©l√©es.</li>
    </ul>
</div>


In [7]:
logistic_models.bayes_optimize_models(n_iter= 20, cv_folds= 5, scoring= "f1")

üîç Optimisation en cours : Logistic Regression (L1)
üîç Optimisation en cours : Logistic Regression (L2)
üîç Optimisation en cours : Logistic Regression (ElasticNet)


Unnamed: 0,Mod√®le,Score F1 (CV),Dur√©e (s)
1,Logistic Regression (L2),0.517581,9.57
0,Logistic Regression (L1),0.511215,19.3
2,Logistic Regression (ElasticNet),0.509199,10.03


In [8]:
# It√©rations de l'optimisation bay√©sienne
logistic_models.plot_all_bayes_convergences()

In [9]:
# Courbes ROC
logistic_models.plot_roc_curve_interactive()

In [10]:
# Courbes Recall/Pr√©cision
logistic_models.plot_precision_recall_curve_interactive()

In [11]:
# Evolution du F1-score
dict_models = logistic_models.best_f1_by_model()

<div class="alert alert-block alert-info">
<b>üîî Rappels sur le F1-score : interpr√©tation selon sa valeur</b></p>

  <table border="1" style="border-collapse:collapse; width:100%; text-align:left;">
    <thead style="background-color:#f2f2f2;">
      <tr>
        <th style="padding:8px;">üî¢Valeur du F1-score</th>
        <th style="padding:8px;">Interpr√©tation Mod√®le</th>
        <th style="padding:8px;">Lecture M√©tier</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td style="padding:8px;"><b>‚âà 1.00</b></td>
        <td style="padding:8px;">Mod√®le quasi-parfait : haute pr√©cision et haut rappel.</td>
        <td style="padding:8px;">Tr√®s bon mod√®le : d√©tecte presque tous les d√©fauts sans refuser inutilement.</td>
      </tr>
      <tr>
        <td style="padding:8px;"><b>0.80 ‚Äì 0.99</b></td>
        <td style="padding:8px;">Excellent compromis entre d√©tection et justesse des refus.</td>
        <td style="padding:8px;">Robuste en production si les donn√©es sont stables et bien pr√©par√©es.</td>
      </tr>
      <tr>
        <td style="padding:8px;"><b>0.65 ‚Äì 0.79</b></td>
        <td style="padding:8px;">Bon niveau, utilisable avec confiance.</td>
        <td style="padding:8px;">Mod√®le solide, peut √™tre d√©ploy√© avec suivi r√©gulier.</td>
      </tr>
      <tr>
        <td style="padding:8px;"><b>0.50 ‚Äì 0.64</b></td>
        <td style="padding:8px;">Compromis mod√©r√©, encore perfectible.</td>
        <td style="padding:8px;">Le mod√®le laisse passer trop de d√©fauts ou refuse trop de bons clients.</td>
      </tr>
      <tr>
        <td style="padding:8px;"><b>0.30 ‚Äì 0.49</b></td>
        <td style="padding:8px;">Mod√®le d√©s√©quilibr√©, mauvaise performance globale.</td>
        <td style="padding:8px;">Ni fiable pour la d√©tection du risque, ni pour √©viter la g√™ne client.</td>
      </tr>
      <tr>
        <td style="padding:8px;"><b>&lt; 0.30</b></td>
        <td style="padding:8px;">Mod√®le inefficace, proche d‚Äôun mod√®le al√©atoire.</td>
        <td style="padding:8px;">Mod√®le non utilisable pour l‚Äôoctroi de cr√©dit.</td>
      </tr>
    </tbody>
  </table>
</div>


#### 6.3 Focus sur le meilleur mod√®le (au sens du F1-score)

#### 6.4 Evaluer le mod√®le (s√©lectionner le mod√®le qui maximise le F1-score)

  <div class="alert alert-block alert-info">
  <h4><b>Recall et Pr√©cision dans un mod√®le de score d‚Äôoctroi de cr√©dit</b></h4>

  <h5><u>Recall</u></h5>
  <p>
    <b>Formule :</b><br>
    Recall = VP / (VP + FN) = Part des d√©fauts correctement d√©tect√©s par le mod√®le parmi tous les d√©fauts r√©els.
  </p>
  <p>
    <b>Interpr√©tation :</b><br>
    Parmi les clients qui auraient r√©ellement fait d√©faut, combien ont √©t√© correctement pr√©dits comme risqu√©s ?
  </p>
  <p>
    <b>Exemple :</b><br>
    Un recall de 10% signifie que le mod√®le d√©tecte seulement 10% des clients risqu√©s. Il laisse passer 90% des d√©fauts potentiels.
  </p>
  <p>
    <b>Enjeu m√©tier :</b><br>
    Maximiser le recall, c‚Äôest minimiser le nombre de cr√©dits accord√©s √† des clients qui ne rembourseront pas.<br>
    <i>üëâ La banque cherche ici √† limiter au maximum les pertes financi√®res li√©es aux impay√©s, quitte √† refuser certains bons clients.</i>
  </p>

  <h5><u>Pr√©cision</u></h5>
  <p>
    <b>Formule :</b><br>
    Pr√©cision = VP / (VP + FP) = Part des clients correctement identifi√©s comme risqu√©s parmi ceux pr√©dits comme tels.
  </p>
  <p>
    <b>Interpr√©tation :</b><br>
    Parmi tous les clients pr√©dits comme risqu√©s, combien sont effectivement de vrais clients √† risque ?
  </p>
  <p>
    <b>Exemple :</b><br>
    Une pr√©cision de 70% signifie que 30% des refus concernent des clients qui auraient bien rembours√© (faux positifs).
  </p>
  <p>
    <b>Enjeu m√©tier :</b><br>
    Maximiser la pr√©cision, c‚Äôest √©viter de refuser un cr√©dit √† un bon client.<br>
    <i>üëâ La banque veut ici pr√©server sa relation client et son image de marque.</i>
  </p>

  <h5><u>Trade-off entre Recall et Pr√©cision</u></h5>
  <table border="1" style="border-collapse:collapse; width:100%; text-align:left;">
    <thead>
      <tr style="background-color:#f2f2f2;">
        <th style="padding:8px;">üéØ Objectif m√©tier</th>
        <th style="padding:8px;">üìà Priorit√© m√©trique</th>
        <th style="padding:8px;">üí¨ Cons√©quences</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td style="padding:8px;">Limiter au maximum les d√©fauts de paiement</td>
        <td style="padding:8px;">Recall √©lev√©</td>
        <td style="padding:8px;">Risque de refuser des clients solvables (g√™ne client)</td>
      </tr>
      <tr>
        <td style="padding:8px;">√âviter les refus injustifi√©s / pr√©server l'image</td>
        <td style="padding:8px;">Pr√©cision √©lev√©e</td>
        <td style="padding:8px;">Risque d‚Äôaccorder un cr√©dit √† un client risqu√©</td>
      </tr>
      <tr>
        <td style="padding:8px;">Trouver un √©quilibre entre risque et opportunit√©</td>
        <td style="padding:8px;">F1-score (compromis)</td>
        <td style="padding:8px;">√âquilibre entre d√©tection du risque et satisfaction client</td>
      </tr>
    </tbody>
  </table>

  <p style="margin-top:15px;">
    ‚úÖ <b>Conclusion :</b> Le choix de la m√©trique d√©pend des priorit√©s strat√©giques de la banque : <br>
    - <i>Plut√¥t risk-averse ?</i> ‚Üí Maximiser le recall.<br>
    - <i>Plut√¥t orient√©e exp√©rience client ?</i> ‚Üí Maximiser la pr√©cision.<br>
    - <i>Besoin d‚Äôun bon compromis ?</i> ‚Üí Suivre le F1-score.
  </p>


In [12]:
dict_best_model = logistic_models.get_best_model() # mod√®le qui maximise le crit√®re
best_model_name = dict_best_model["model_name"]

Meilleur mod√®le : Logistic Regression (L2)
Score (F1 CV) : 0.5176


In [13]:
logistic_models.evaluate_model(best_model_name)

M√©trique,Valeur
Accuracy,0.8
ROC AUC,0.81

Classe,Pr√©cision,Rappel,F1-score
Non d√©faut,0.812,0.929,0.867
D√©faut,0.75,0.5,0.6


<div class="alert alert-block alert-success">
  <h4>üìä Interpr√©tation des performances du mod√®le de scoring</h4>

  <p><b>üìå R√©partition de la variable cible :</b> 70% de <i>non d√©faut</i> (clients fiables) et 30% de <i>d√©faut</i> (clients √† risque).</p>
  <p>Ce d√©s√©quilibre implique qu‚Äôun bon mod√®le ne peut pas se contenter d‚Äôune forte accuracy : il doit surtout bien d√©tecter les d√©fauts tout en limitant les faux refus.</p>

  <h5>‚öôÔ∏è M√©triques globales</h5>
  <table border="1" style="border-collapse: collapse; width: 100%; text-align: left;">
    <thead style="background-color:#f2f2f2;">
      <tr>
        <th style="padding:8px;">M√©trique</th>
        <th style="padding:8px;">Valeur</th>
        <th style="padding:8px;">Interpr√©tation</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td style="padding:8px;">Accuracy</td>
        <td style="padding:8px;">0.77</td>
        <td style="padding:8px;">
          77% des pr√©dictions sont correctes. √Ä interpr√©ter avec prudence car un mod√®le na√Øf qui pr√©dirait toujours "non d√©faut" atteindrait d√©j√† 70%.
        </td>
      </tr>
      <tr>
        <td style="padding:8px;">ROC AUC</td>
        <td style="padding:8px;">0.7452</td>
        <td style="padding:8px;">
          Bonne capacit√© √† discriminer les bons des mauvais payeurs. Score satisfaisant dans un contexte de d√©s√©quilibre.
        </td>
      </tr>
    </tbody>
  </table>

  <h5 style="margin-top:20px;">üè∑Ô∏è M√©triques par classe</h5>
  <table border="1" style="border-collapse: collapse; width: 100%; text-align: left;">
    <thead style="background-color:#f2f2f2;">
      <tr>
        <th style="padding:8px;">Classe</th>
        <th style="padding:8px;">üéØ Pr√©cision</th>
        <th style="padding:8px;">üîç Recall</th>
        <th style="padding:8px;">‚öñÔ∏è F1-score</th>
      </tr>
    </thead>
    <tbody>
      <tr>
        <td style="padding:8px;"><b>Non d√©faut (classe 0)</b></td>
        <td style="padding:8px;">
          <b>0.856</b><br>
          ‚Üí 86% des clients pr√©dits comme fiables le sont r√©ellement. Le mod√®le √©vite efficacement les faux refus.
        </td>
        <td style="padding:8px;">
          <b>0.807</b><br>
          ‚Üí Le mod√®le capte 81% des clients qui remboursent. Il maintient la satisfaction des clients solvables.
        </td>
        <td style="padding:8px;">
          <b>0.831</b><br>
          ‚Üí Tr√®s bon √©quilibre sur cette classe majoritaire. Peu d‚Äôerreurs, bon confort m√©tier.
        </td>
      </tr>
      <tr>
        <td style="padding:8px;"><b>D√©faut (classe 1)</b></td>
        <td style="padding:8px;">
          <b>0.603</b><br>
          ‚Üí Sur 100 clients consid√©r√©s comme risqu√©s, 60 le sont r√©ellement. Taux de refus injustifi√©s √† surveiller.
        </td>
        <td style="padding:8px;">
          <b>0.683</b><br>
          ‚Üí 68% des vrais d√©fauts sont d√©tect√©s. Bon score dans un contexte d√©s√©quilibr√©, mais perfectible.
        </td>
        <td style="padding:8px;">
          <b>0.641</b><br>
          ‚Üí Compromis raisonnable entre d√©tection et justesse. Des d√©fauts √©chappent encore au mod√®le.
        </td>
      </tr>
    </tbody>
  </table>

  <h4 style="margin-top: 20px;">üöÄ Axes pour am√©liorer la performance</h4>
  <ul>
    <li><b>Ajuster le seuil de d√©cision</b> pour privil√©gier le rappel (ex : seuil &lt; 0.5).</li>
    <li><b>Enrichir les variables explicatives</b> (demander d'autres informations au m√©tier, faire des croisements entre variables, appliquer des transformations aux variables).</li>
    <li><b>Tester d‚Äôautres mod√®les</b> plus performants : Random Forest, XGBoost, LightGBM.</li>
    <li><b>Travailler avec les m√©tiers</b> pour ajuster le compromis recall / pr√©cision selon la strat√©gie risque / image client.</li>
  </ul>
</div>


#### 6.4.2 D√©terminer un seuil manuellement (avec une approche m√©tier)

In [14]:
logistic_models.plot_metrics_by_threshold(best_model_name)
df_metrics = logistic_models.get_metrics_by_threshold(best_model_name)

<div class="alert alert-block alert-warning">
<b>Question 30:</b> Nous souhaitons refuser moins de 30% de cr√©dits √† tort,  quel seuil choisir ?
</div>

<div class="alert alert-block alert-warning">
<b>Question 31:</b> Nous souhaitons d√©tecter au moins 75% des d√©fauts de paiement , quel seuil choisir ?
</div>

### 7. Mod√®les √† base d'arbres

In [17]:
list_models = ["Random Forest", "Gradient Boosting", "LightGBM"] # liste des mod√©lisations √† tester
trees_models = ModelComparator(y_train= y_train, X_train= X_train_with_norm, y_test= y_test, X_test= X_test_with_norm, list_models= list_models, random_state= random_state) # initier la class permettant la mod√©lisation
trees_models.bayes_optimize_models(n_iter= 20, cv_folds= 5, scoring= "f1")

üîç Optimisation en cours : Random Forest
üîç Optimisation en cours : Gradient Boosting
üîç Optimisation en cours : LightGBM


Unnamed: 0,Mod√®le,Score F1 (CV),Dur√©e (s)
1,Gradient Boosting,0.564765,20.15
2,LightGBM,0.556053,28.2
0,Random Forest,0.473399,14.7


In [18]:
# It√©rations de l'optimisation bay√©sienne
trees_models.plot_all_bayes_convergences()

In [19]:
# Courbes ROC
trees_models.plot_roc_curve_interactive()

In [None]:
# Courbes Recall/Pr√©cision
trees_models.plot_precision_recall_curve_interactive()

In [21]:
# Evolution du F1-score
dict_models = trees_models.best_f1_by_model()

In [22]:
dict_best_model_trees = trees_models.get_best_model() # mod√®le qui maximise le crit√®re
best_model_name_trees = dict_best_model_trees["model_name"]

Meilleur mod√®le : Gradient Boosting
Score (F1 CV) : 0.5648


In [23]:
trees_models.evaluate_model(best_model_name_trees)

M√©trique,Valeur
Accuracy,0.76
ROC AUC,0.792

Classe,Pr√©cision,Rappel,F1-score
Non d√©faut,0.78,0.914,0.842
D√©faut,0.667,0.4,0.5


**Aide √† la s√©lection "m√©tier" du seuil de score**

In [24]:
trees_models.plot_metrics_by_threshold(best_model_name_trees)
df_metrics_trees = trees_models.get_metrics_by_threshold(best_model_name_trees)