  # **AKADEMI EDUCATION**
# **Premi√®re cohorte (2025): Science des donn√©es et intelligence artificielle**
#### *Phase 5: PROJET DE SCIENCE DES DONN√âES*

**Noms des √©tudiants du groupe: Rich√© FLEURINORD et Micka LOUIS**   
**Rythme d‚Äôapprentissage: Autonome**  
**Date de soutenance: 27 octobre 2025**  
**Noms des instructeurs: Wedter JEROME et Geovany Batista Polo LAGUERRE**  
**Lien de l‚Äôarticle de blog (lien du d√©p√¥t GitHub): https://github.com/richefleuriord/Bank_Customer_Churn_Prediction.git**

# *6-D√©ploiement*

# D√©ploiement du mod√®le

## Introduction
Le d√©ploiement repr√©sente la derni√®re √©tape du projet, o√π le mod√®le entra√Æn√© devient un outil op√©rationnel. Dans ce projet, le mod√®le final de pr√©diction du churn sera mis √† disposition via une **application web interactive**, permettant aux managers et analystes de la banque de visualiser facilement le risque de d√©part d‚Äôun client et de prendre des d√©cisions √©clair√©es.

L‚Äôobjectif est de transformer un mod√®le performant en un **outil pratique et accessible**, capable de g√©n√©rer des pr√©dictions en temps r√©el pour de nouveaux profils clients.

## Objectifs du d√©ploiement
- Rendre le mod√®le accessible via une interface web simple et intuitive.
- Permettre aux utilisateurs de saisir les informations d‚Äôun client et d‚Äôobtenir instantan√©ment la probabilit√© de churn.
- Faciliter les d√©cisions strat√©giques bas√©es sur les donn√©es afin d‚Äôam√©liorer les actions de fid√©lisation.
- Assurer la fiabilit√© et la s√©curit√© du mod√®le et des donn√©es manipul√©es.

## M√©thodologie
1. **Sauvegarde du mod√®le**
   - Le mod√®le XGBoost final est sauvegard√© au format `pickle` (`Best_Model_XGBoost.pkl`) pour √™tre r√©utilis√© par l‚Äôapplication web.
2. **D√©veloppement de l‚Äôapplication Streamlit**
   - Cr√©ation d‚Äôune interface web o√π l‚Äôutilisateur peut remplir le profil client.
   - Affichage de la probabilit√© de churn en temps r√©el.
3. **Visualisation et recommandations**
   - Les r√©sultats sont pr√©sent√©s sous forme de pourcentage ou graphique.
   - Possibilit√© d‚Äôajouter des recommandations ou alertes pour les clients √† risque √©lev√©.
4. **Maintenance**
   - Surveillance des performances du mod√®le et r√©entra√Ænement p√©riodique si n√©cessaire.

In [4]:
# ============================================================
# Application Streamlit : Pr√©diction du Churn Client (Pipeline Random Forest)
# ============================================================

import streamlit as st
import pandas as pd
import numpy as np
import joblib

# ------------------------------------------------------------
# Config de la page
# ------------------------------------------------------------
st.set_page_config(
    page_title="Pr√©diction du Churn Client",
    page_icon="üè¶",
    layout="centered",
    initial_sidebar_state="expanded"
)

# ------------------------------------------------------------
# Titre et description
# ------------------------------------------------------------
st.markdown("<h1 style='text-align: center; color: #2C3E50;'>üè¶ Pr√©diction du Churn Client</h1>", unsafe_allow_html=True)
st.markdown("<p style='text-align: center; color: #34495E;'>Remplissez les informations du client pour pr√©dire la probabilit√© de d√©part.</p>", unsafe_allow_html=True)

# ------------------------------------------------------------
# Chargement du pipeline
# ------------------------------------------------------------
try:
    pipeline = joblib.load("Models/Best_Model_Deployment.pkl")
    st.success("‚úÖ Pipeline charg√© avec succ√®s !")
except Exception as e:
    st.error(f"‚ùå Impossible de charger le pipeline : {e}")

# ------------------------------------------------------------
# Saisie utilisateur
# ------------------------------------------------------------
st.header("üßæ Informations du client")
with st.form("client_form"):
    col1, col2 = st.columns(2)
    with col1:
        credit_score = st.number_input("Credit Score", 300, 900, 600)
        age = st.number_input("√Çge", 18, 100, 30)
        tenure = st.number_input("Dur√©e de relation (ann√©es)", 0, 20, 3)
        balance = st.number_input("Solde du compte", 0.0, 1_000_000.0, 5000.0, step=1000.0)
        num_products = st.selectbox("Nombre de produits d√©tenus", [1, 2, 3])
        has_card = st.radio("Poss√®de une carte de cr√©dit ?", ["Oui", "Non"])
        is_active = st.radio("Client actif ?", ["Oui", "Non"])
    with col2:
        estimated_salary = st.number_input("Salaire estim√©", 0.0, 1_000_000.0, 40000.0, step=1000.0)
        satisfaction = st.slider("Satisfaction Score", 0, 10, 5)
        points = st.number_input("Points accumul√©s", 0, 5000, 300)
        active_credit = st.radio("Cr√©dit actif ?", ["Oui", "Non"])
        geography = st.selectbox("Pays", ["France", "Germany", "Spain"])
        gender = st.selectbox("Sexe", ["Homme", "Femme"])
        card_type = st.selectbox("Type de carte", ["SILVER", "GOLD", "PLATINUM"])
        age_category = st.selectbox("Cat√©gorie d'√¢ge", ["Jeune", "Moyen", "√Çg√©"])
        product_category = st.selectbox("Cat√©gorie de produits", ["1", "2", "3+"])

    submitted = st.form_submit_button("üîÆ Pr√©dire le Churn")

# ------------------------------------------------------------
# Pr√©paration des donn√©es utilisateur
# ------------------------------------------------------------
def prepare_input():
    data = {
        'CreditScore': [credit_score],
        'Tenure': [tenure],
        'Balance': [balance],
        'HasCrCard': [1 if has_card == "Oui" else 0],
        'IsActiveMember': [1 if is_active == "Oui" else 0],
        'EstimatedSalary': [estimated_salary],
        'Satisfaction Score': [satisfaction],
        'Point Earned': [points],
        'BalanceToSalaryRatio': [balance / estimated_salary if estimated_salary > 0 else 0],
        'ActiveCredit': [1 if active_credit == "Oui" else 0],
        'LowSatisfaction': [1 if satisfaction < 5 else 0],
        'Geography_Germany': [1 if geography == "Germany" else 0],
        'Geography_Spain': [1 if geography == "Spain" else 0],
        'Gender_Male': [1 if gender == "Homme" else 0],
        'Card Type_GOLD': [1 if card_type == "GOLD" else 0],
        'Card Type_PLATINUM': [1 if card_type == "PLATINUM" else 0],
        'Card Type_SILVER': [1 if card_type == "SILVER" else 0],
        'AgeCategory_Moyen': [1 if age_category == "Moyen" else 0],
        'AgeCategory_√Çg√©': [1 if age_category == "√Çg√©" else 0],
        'ProductCategory_2': [1 if product_category == "2" else 0],
        'ProductCategory_3+': [1 if product_category == "3+" else 0]
    }
    return pd.DataFrame(data)

# ------------------------------------------------------------
# Pr√©diction
# ------------------------------------------------------------
if submitted:
    try:
        input_df = prepare_input()
        prediction = pipeline.predict(input_df)[0]
        proba = pipeline.predict_proba(input_df)[0][1]

        st.subheader("üìä R√©sultat de la pr√©diction")
        if prediction == 1:
            st.warning(f"‚ö†Ô∏è Le client risque de **quitter la banque** ({proba*100:.2f}% de probabilit√©).")
        else:
            st.success(f"‚úÖ Le client est **susceptible de rester** ({(1-proba)*100:.2f}% de probabilit√©).")

        # Affichage professionnel avec metrics
        col1, col2 = st.columns(2)
        col1.metric("Probabilit√© de rester", f"{(1-proba)*100:.2f}%")
        col2.metric("Probabilit√© de quitter", f"{proba*100:.2f}%")

    except Exception as e:
        st.error(f"‚ùå Erreur lors de la pr√©diction : {e}")

# ------------------------------------------------------------
# Pied de page
# ------------------------------------------------------------
st.markdown("---")
st.markdown("üë®‚Äçüíª **R√©alis√© par Rich√© Fleurinord et Micka Louis** ‚Äî *Phase 5 : Projet Data Science & IA (Akademi)*")
st.caption("¬© 2025 - Application d√©velopp√©e avec Streamlit et Scikit-learn")



## **Quelques exemples apr√®s d√©ploiement du mod√®le**

## üßç Profil du Client #1

Ce client est un **homme √¢g√© de 30 ans**, r√©sidant en **France**, appartenant √† la **cat√©gorie des jeunes actifs**. Il entretient une **relation bancaire depuis 3 ans**, ce qui traduit une **anciennet√© mod√©r√©e** dans l‚Äôinstitution.  
Son **score de cr√©dit de 600** refl√®te une **capacit√© de remboursement moyenne**, tandis que son **solde de compte de 5 000 ‚Ç¨** et son **salaire estim√© √† 40 000 ‚Ç¨** d√©montrent une situation financi√®re **correcte et stable**.  

Il d√©tient **un seul produit bancaire**, ce qui laisse penser qu‚Äôil n‚Äôa pas encore pleinement explor√© l‚Äôensemble des offres de la banque.  
Il poss√®de **une carte de cr√©dit de type Silver**, dispose d‚Äôun **cr√©dit actif**, et est **actif dans ses op√©rations bancaires**, des √©l√©ments qui traduisent une **participation r√©guli√®re √† la vie financi√®re de la banque**.  
Avec un **score de satisfaction de 5 sur 10**, le client se situe dans une **zone moyenne de contentement**, exprimant une exp√©rience ni pleinement positive ni n√©gative.  
Enfin, il a cumul√© **300 points de fid√©lit√©**, t√©moignant d‚Äôun engagement mod√©r√© dans les activit√©s promotionnelles ou les services de la banque.

---

## üìä R√©sultat du Mod√®le

- **Probabilit√© que le client reste :** **69.50 %**  
- **Probabilit√© de d√©part (churn) :** **30.50 %**

‚úÖ **Conclusion :** Le mod√®le Random Forest pr√©dit que ce client est **susceptible de rester** au sein de la banque.

---

## üí° Analyse √âconomique et Comportementale

Ce profil r√©v√®le un **client jeune et financi√®rement stable**, pr√©sentant un comportement bancaire plut√¥t sain.  
Son **activit√© r√©guli√®re**, combin√©e √† un **revenu correct** et une **bonne utilisation de la carte de cr√©dit**, renforcent la confiance de la banque envers lui.  
Toutefois, son **niveau de satisfaction moyen** et la **faible diversification de ses produits** laissent entrevoir un risque latent : un manque d‚Äôattachement profond √† l‚Äôinstitution.

Sur le plan √©conomique, ce type de client se situe dans une **phase de consolidation de sa relation bancaire**.  
Il ne manifeste pas de signes de d√©sengagement imm√©diat, mais une **politique de fid√©lisation proactive** (offres personnalis√©es, conseils financiers, ou produits d‚Äôinvestissement) pourrait **renforcer son ancrage** et accro√Ætre la rentabilit√© √† long terme.

---

üß† *Interpr√©tation strat√©gique :*  
Le maintien de ce client d√©pendra de la capacit√© de la banque √† **accro√Ætre sa satisfaction** et √† **diversifier ses produits**.  
Des actions cibl√©es sur la **valeur per√ßue** et la **relation client** permettraient de consolider cette fid√©lit√© naissante.

---

üë®‚Äçüíª *Analyse r√©alis√©e par Rich√© Fleurinord et Micka Louis ‚Äî Phase 5 : Projet Data Science & IA (Akademi)*  
¬© 2025 ‚Äî *Pr√©diction du Churn Client avec Random Forest*


## üßç‚Äç‚ôÇÔ∏è Profil du client

Ce client est un **homme √¢g√© de 70 ans**, originaire d‚Äô**Espagne**.  
Il entretient une **relation longue de 10 ans avec la banque**, signe d‚Äôune fid√©lit√© et d‚Äôune stabilit√© relationnelle fortes.  
Son **score de cr√©dit √©lev√© (700)** traduit une excellente fiabilit√© financi√®re.  
Le client d√©tient **deux produits bancaires**, poss√®de une **carte GOLD**, et pr√©sente un **solde cons√©quent de 500 000 ‚Ç¨**, ce qui sugg√®re un haut pouvoir d‚Äô√©pargne.  
Son **salaire estim√© √† 394 000 ‚Ç¨** confirme son statut de client √† haut revenu.  
De plus, il **cumule 1 300 points de fid√©lit√©** et affiche un **niveau de satisfaction tr√®s √©lev√© (9/10)**, des indicateurs typiques d‚Äôun client satisfait et attach√© √† la banque.  
Il est **actif**, **d√©tient une carte de cr√©dit** et poss√®de un **cr√©dit en cours**, ce qui renforce la relation commerciale entre lui et l‚Äôinstitution bancaire.

---

## üìä R√©sultats statistiques

- **Probabilit√© de rester :** 67.50 %  
- **Probabilit√© de quitter :** 32.50 %  
- **Pr√©diction finale :** ‚úÖ *Le client est susceptible de rester dans la banque.*

---

## üí° Analyse √©conomique

Ce client appartient √† la **cat√©gorie des clients premium** : revenus √©lev√©s, anciennet√© importante, et satisfaction notable.  
Sa probabilit√© de fid√©lit√© (67.5 %) s‚Äôexplique par plusieurs facteurs positifs :  
- Une **longue dur√©e de relation**, qui favorise la confiance mutuelle.  
- Un **excellent score de cr√©dit** et une **situation financi√®re solide**.  
- Une **carte GOLD** et un **niveau de satisfaction √©lev√©**, indicateurs de valorisation par la banque.  

Cependant, une probabilit√© de d√©part de **32.5 %** demeure non n√©gligeable. Cela pourrait √™tre li√© √† :  
- Une **concurrence accrue sur le segment premium**, attirant les clients fortun√©s avec de meilleures offres.  
- Un **risque d‚Äôinsatisfaction future** si la qualit√© du service diminue.  

Pour s√©curiser la fid√©lit√© de ce profil, la banque devrait envisager :  
üëâ Des **programmes VIP personnalis√©s** (gestionnaire d√©di√©, avantages exclusifs).  
üëâ Des **offres sur mesure d‚Äôinvestissement ou de patrimoine**.  
üëâ Un **suivi r√©gulier** pour anticiper tout signe de d√©sengagement.

---

üë®‚Äçüíª *Analyse r√©alis√©e par Rich√© Fleurinord et Micka Louis ‚Äî Phase 5 : Projet Data Science & IA (Akademi)*  
¬© 2025 ‚Äì Application d√©velopp√©e avec **Streamlit** et **Scikit-learn**



## üßç‚Äç‚ôÇÔ∏è Profil du client #3

Ce client est un **homme √¢g√© de 65 ans**, r√©sidant en **Allemagne**.  
Il entretient une **relation r√©cente avec la banque (1 an seulement)**, ce qui sugg√®re une faible fid√©lisation.  
Son **score de cr√©dit est tr√®s faible (300)**, indiquant une solvabilit√© limit√©e et un risque de non-remboursement √©lev√©.  
Le client poss√®de **un seul produit bancaire** et d√©tient une **carte SILVER**, symbole d‚Äôun niveau d‚Äôengagement relativement bas.  
Il dispose d‚Äôun **solde modeste de 500.00 ‚Ç¨** et per√ßoit un **salaire estim√© √† 5 000.00 ‚Ç¨**, ce qui le classe parmi les clients √† faible pouvoir d‚Äô√©pargne.  
De plus, il **ne cumule aucun point de fid√©lit√©** et son **niveau de satisfaction est tr√®s faible**, un facteur d√©terminant du d√©sengagement.  
Bien qu‚Äôil soit **client actif et d√©tenteur d‚Äôune carte de cr√©dit**, ces atouts ne suffisent pas √† compenser ses indicateurs financiers faibles.

---

## üìä R√©sultats statistiques

- **Probabilit√© de rester :** 27.50 %  
- **Probabilit√© de quitter :** 72.50 %  
- **Pr√©diction finale :** ‚ö†Ô∏è *Le client risque fortement de quitter la banque.*

---

## üí° Analyse √©conomique

Ce profil pr√©sente un **risque de churn √©lev√© (72.5%)**, justifi√© par plusieurs facteurs :  
- Une **relation r√©cente** et donc peu de fid√©lisation historique.  
- Un **faible score de cr√©dit**, traduisant un manque de confiance potentielle de la banque.  
- Une **satisfaction quasi nulle** et **aucun point de fid√©lit√©**, ce qui r√©v√®le un client insatisfait et peu engag√©.  
- Une **capacit√© financi√®re limit√©e**, rendant la banque moins incit√©e √† investir dans la relation.

D‚Äôun point de vue √©conomique, ce type de client repr√©sente un **segment vuln√©rable et instable**, souvent attir√© par les offres concurrentes.  
Pour √©viter sa perte, la banque devrait envisager des **strat√©gies de r√©tention personnalis√©es** :  
üëâ Offrir des produits adapt√©s √† son √¢ge (retraite, assurance-vie, √©pargne senior).  
üëâ Am√©liorer son exp√©rience client par un suivi plus humain et des incitations cibl√©es.  
üëâ Revaloriser la confiance √† travers une √©ducation financi√®re et une meilleure communication.

---
