  # **AKADEMI EDUCATION**
# **Première cohorte (2025): Science des données et intelligence artificielle**
#### *Phase 5: PROJET DE SCIENCE DES DONNÉES*

**Noms des étudiants du groupe: Riché FLEURINORD et Micka LOUIS**   
**Rythme d’apprentissage: Autonome**  
**Date de soutenance: 27 octobre 2025**  
**Noms des instructeurs: Wedter JEROME et Geovany Batista Polo LAGUERRE**  
**Lien de l’article de blog (lien du dépôt GitHub): https://github.com/richefleuriord/Bank_Customer_Churn_Prediction.git**

# *6-Déploiement*

# Déploiement du modèle

## Introduction
Le déploiement représente la dernière étape du projet, où le modèle entraîné devient un outil opérationnel. Dans ce projet, le modèle final de prédiction du churn sera mis à disposition via une **application web interactive**, permettant aux managers et analystes de la banque de visualiser facilement le risque de départ d’un client et de prendre des décisions éclairées.

L’objectif est de transformer un modèle performant en un **outil pratique et accessible**, capable de générer des prédictions en temps réel pour de nouveaux profils clients.

## Objectifs du déploiement
- Rendre le modèle accessible via une interface web simple et intuitive.
- Permettre aux utilisateurs de saisir les informations d’un client et d’obtenir instantanément la probabilité de churn.
- Faciliter les décisions stratégiques basées sur les données afin d’améliorer les actions de fidélisation.
- Assurer la fiabilité et la sécurité du modèle et des données manipulées.

## Méthodologie
1. **Sauvegarde du modèle**
   - Le modèle XGBoost final est sauvegardé au format `pickle` (`Best_Model_XGBoost.pkl`) pour être réutilisé par l’application web.
2. **Développement de l’application Streamlit**
   - Création d’une interface web où l’utilisateur peut remplir le profil client.
   - Affichage de la probabilité de churn en temps réel.
3. **Visualisation et recommandations**
   - Les résultats sont présentés sous forme de pourcentage ou graphique.
   - Possibilité d’ajouter des recommandations ou alertes pour les clients à risque élevé.
4. **Maintenance**
   - Surveillance des performances du modèle et réentraînement périodique si nécessaire.

In [4]:
# ============================================================
# Application Streamlit : Prédiction du Churn Client (Pipeline Random Forest)
# ============================================================

import streamlit as st
import pandas as pd
import numpy as np
import joblib

# ------------------------------------------------------------
# Config de la page
# ------------------------------------------------------------
st.set_page_config(
    page_title="Prédiction du Churn Client",
    page_icon="🏦",
    layout="centered",
    initial_sidebar_state="expanded"
)

# ------------------------------------------------------------
# Titre et description
# ------------------------------------------------------------
st.markdown("<h1 style='text-align: center; color: #2C3E50;'>🏦 Prédiction du Churn Client</h1>", unsafe_allow_html=True)
st.markdown("<p style='text-align: center; color: #34495E;'>Remplissez les informations du client pour prédire la probabilité de départ.</p>", unsafe_allow_html=True)

# ------------------------------------------------------------
# Chargement du pipeline
# ------------------------------------------------------------
try:
    pipeline = joblib.load("Models/Best_Model_Deployment.pkl")
    st.success("✅ Pipeline chargé avec succès !")
except Exception as e:
    st.error(f"❌ Impossible de charger le pipeline : {e}")

# ------------------------------------------------------------
# Saisie utilisateur
# ------------------------------------------------------------
st.header("🧾 Informations du client")
with st.form("client_form"):
    col1, col2 = st.columns(2)
    with col1:
        credit_score = st.number_input("Credit Score", 300, 900, 600)
        age = st.number_input("Âge", 18, 100, 30)
        tenure = st.number_input("Durée de relation (années)", 0, 20, 3)
        balance = st.number_input("Solde du compte", 0.0, 1_000_000.0, 5000.0, step=1000.0)
        num_products = st.selectbox("Nombre de produits détenus", [1, 2, 3])
        has_card = st.radio("Possède une carte de crédit ?", ["Oui", "Non"])
        is_active = st.radio("Client actif ?", ["Oui", "Non"])
    with col2:
        estimated_salary = st.number_input("Salaire estimé", 0.0, 1_000_000.0, 40000.0, step=1000.0)
        satisfaction = st.slider("Satisfaction Score", 0, 10, 5)
        points = st.number_input("Points accumulés", 0, 5000, 300)
        active_credit = st.radio("Crédit actif ?", ["Oui", "Non"])
        geography = st.selectbox("Pays", ["France", "Germany", "Spain"])
        gender = st.selectbox("Sexe", ["Homme", "Femme"])
        card_type = st.selectbox("Type de carte", ["SILVER", "GOLD", "PLATINUM"])
        age_category = st.selectbox("Catégorie d'âge", ["Jeune", "Moyen", "Âgé"])
        product_category = st.selectbox("Catégorie de produits", ["1", "2", "3+"])

    submitted = st.form_submit_button("🔮 Prédire le Churn")

# ------------------------------------------------------------
# Préparation des données utilisateur
# ------------------------------------------------------------
def prepare_input():
    data = {
        'CreditScore': [credit_score],
        'Tenure': [tenure],
        'Balance': [balance],
        'HasCrCard': [1 if has_card == "Oui" else 0],
        'IsActiveMember': [1 if is_active == "Oui" else 0],
        'EstimatedSalary': [estimated_salary],
        'Satisfaction Score': [satisfaction],
        'Point Earned': [points],
        'BalanceToSalaryRatio': [balance / estimated_salary if estimated_salary > 0 else 0],
        'ActiveCredit': [1 if active_credit == "Oui" else 0],
        'LowSatisfaction': [1 if satisfaction < 5 else 0],
        'Geography_Germany': [1 if geography == "Germany" else 0],
        'Geography_Spain': [1 if geography == "Spain" else 0],
        'Gender_Male': [1 if gender == "Homme" else 0],
        'Card Type_GOLD': [1 if card_type == "GOLD" else 0],
        'Card Type_PLATINUM': [1 if card_type == "PLATINUM" else 0],
        'Card Type_SILVER': [1 if card_type == "SILVER" else 0],
        'AgeCategory_Moyen': [1 if age_category == "Moyen" else 0],
        'AgeCategory_Âgé': [1 if age_category == "Âgé" else 0],
        'ProductCategory_2': [1 if product_category == "2" else 0],
        'ProductCategory_3+': [1 if product_category == "3+" else 0]
    }
    return pd.DataFrame(data)

# ------------------------------------------------------------
# Prédiction
# ------------------------------------------------------------
if submitted:
    try:
        input_df = prepare_input()
        prediction = pipeline.predict(input_df)[0]
        proba = pipeline.predict_proba(input_df)[0][1]

        st.subheader("📊 Résultat de la prédiction")
        if prediction == 1:
            st.warning(f"⚠️ Le client risque de **quitter la banque** ({proba*100:.2f}% de probabilité).")
        else:
            st.success(f"✅ Le client est **susceptible de rester** ({(1-proba)*100:.2f}% de probabilité).")

        # Affichage professionnel avec metrics
        col1, col2 = st.columns(2)
        col1.metric("Probabilité de rester", f"{(1-proba)*100:.2f}%")
        col2.metric("Probabilité de quitter", f"{proba*100:.2f}%")

    except Exception as e:
        st.error(f"❌ Erreur lors de la prédiction : {e}")

# ------------------------------------------------------------
# Pied de page
# ------------------------------------------------------------
st.markdown("---")
st.markdown("👨‍💻 **Réalisé par Riché Fleurinord et Micka Louis** — *Phase 5 : Projet Data Science & IA (Akademi)*")
st.caption("© 2025 - Application développée avec Streamlit et Scikit-learn")



## **Quelques exemples après déploiement du modèle**

## 🧍 Profil du Client #1

Ce client est un **homme âgé de 30 ans**, résidant en **France**, appartenant à la **catégorie des jeunes actifs**. Il entretient une **relation bancaire depuis 3 ans**, ce qui traduit une **ancienneté modérée** dans l’institution.  
Son **score de crédit de 600** reflète une **capacité de remboursement moyenne**, tandis que son **solde de compte de 5 000 €** et son **salaire estimé à 40 000 €** démontrent une situation financière **correcte et stable**.  

Il détient **un seul produit bancaire**, ce qui laisse penser qu’il n’a pas encore pleinement exploré l’ensemble des offres de la banque.  
Il possède **une carte de crédit de type Silver**, dispose d’un **crédit actif**, et est **actif dans ses opérations bancaires**, des éléments qui traduisent une **participation régulière à la vie financière de la banque**.  
Avec un **score de satisfaction de 5 sur 10**, le client se situe dans une **zone moyenne de contentement**, exprimant une expérience ni pleinement positive ni négative.  
Enfin, il a cumulé **300 points de fidélité**, témoignant d’un engagement modéré dans les activités promotionnelles ou les services de la banque.

---

## 📊 Résultat du Modèle

- **Probabilité que le client reste :** **69.50 %**  
- **Probabilité de départ (churn) :** **30.50 %**

✅ **Conclusion :** Le modèle Random Forest prédit que ce client est **susceptible de rester** au sein de la banque.

---

## 💡 Analyse Économique et Comportementale

Ce profil révèle un **client jeune et financièrement stable**, présentant un comportement bancaire plutôt sain.  
Son **activité régulière**, combinée à un **revenu correct** et une **bonne utilisation de la carte de crédit**, renforcent la confiance de la banque envers lui.  
Toutefois, son **niveau de satisfaction moyen** et la **faible diversification de ses produits** laissent entrevoir un risque latent : un manque d’attachement profond à l’institution.

Sur le plan économique, ce type de client se situe dans une **phase de consolidation de sa relation bancaire**.  
Il ne manifeste pas de signes de désengagement immédiat, mais une **politique de fidélisation proactive** (offres personnalisées, conseils financiers, ou produits d’investissement) pourrait **renforcer son ancrage** et accroître la rentabilité à long terme.

---

🧠 *Interprétation stratégique :*  
Le maintien de ce client dépendra de la capacité de la banque à **accroître sa satisfaction** et à **diversifier ses produits**.  
Des actions ciblées sur la **valeur perçue** et la **relation client** permettraient de consolider cette fidélité naissante.

---

👨‍💻 *Analyse réalisée par Riché Fleurinord et Micka Louis — Phase 5 : Projet Data Science & IA (Akademi)*  
© 2025 — *Prédiction du Churn Client avec Random Forest*


## 🧍‍♂️ Profil du client

Ce client est un **homme âgé de 70 ans**, originaire d’**Espagne**.  
Il entretient une **relation longue de 10 ans avec la banque**, signe d’une fidélité et d’une stabilité relationnelle fortes.  
Son **score de crédit élevé (700)** traduit une excellente fiabilité financière.  
Le client détient **deux produits bancaires**, possède une **carte GOLD**, et présente un **solde conséquent de 500 000 €**, ce qui suggère un haut pouvoir d’épargne.  
Son **salaire estimé à 394 000 €** confirme son statut de client à haut revenu.  
De plus, il **cumule 1 300 points de fidélité** et affiche un **niveau de satisfaction très élevé (9/10)**, des indicateurs typiques d’un client satisfait et attaché à la banque.  
Il est **actif**, **détient une carte de crédit** et possède un **crédit en cours**, ce qui renforce la relation commerciale entre lui et l’institution bancaire.

---

## 📊 Résultats statistiques

- **Probabilité de rester :** 67.50 %  
- **Probabilité de quitter :** 32.50 %  
- **Prédiction finale :** ✅ *Le client est susceptible de rester dans la banque.*

---

## 💡 Analyse économique

Ce client appartient à la **catégorie des clients premium** : revenus élevés, ancienneté importante, et satisfaction notable.  
Sa probabilité de fidélité (67.5 %) s’explique par plusieurs facteurs positifs :  
- Une **longue durée de relation**, qui favorise la confiance mutuelle.  
- Un **excellent score de crédit** et une **situation financière solide**.  
- Une **carte GOLD** et un **niveau de satisfaction élevé**, indicateurs de valorisation par la banque.  

Cependant, une probabilité de départ de **32.5 %** demeure non négligeable. Cela pourrait être lié à :  
- Une **concurrence accrue sur le segment premium**, attirant les clients fortunés avec de meilleures offres.  
- Un **risque d’insatisfaction future** si la qualité du service diminue.  

Pour sécuriser la fidélité de ce profil, la banque devrait envisager :  
👉 Des **programmes VIP personnalisés** (gestionnaire dédié, avantages exclusifs).  
👉 Des **offres sur mesure d’investissement ou de patrimoine**.  
👉 Un **suivi régulier** pour anticiper tout signe de désengagement.

---

👨‍💻 *Analyse réalisée par Riché Fleurinord et Micka Louis — Phase 5 : Projet Data Science & IA (Akademi)*  
© 2025 – Application développée avec **Streamlit** et **Scikit-learn**



## 🧍‍♂️ Profil du client #3

Ce client est un **homme âgé de 65 ans**, résidant en **Allemagne**.  
Il entretient une **relation récente avec la banque (1 an seulement)**, ce qui suggère une faible fidélisation.  
Son **score de crédit est très faible (300)**, indiquant une solvabilité limitée et un risque de non-remboursement élevé.  
Le client possède **un seul produit bancaire** et détient une **carte SILVER**, symbole d’un niveau d’engagement relativement bas.  
Il dispose d’un **solde modeste de 500.00 €** et perçoit un **salaire estimé à 5 000.00 €**, ce qui le classe parmi les clients à faible pouvoir d’épargne.  
De plus, il **ne cumule aucun point de fidélité** et son **niveau de satisfaction est très faible**, un facteur déterminant du désengagement.  
Bien qu’il soit **client actif et détenteur d’une carte de crédit**, ces atouts ne suffisent pas à compenser ses indicateurs financiers faibles.

---

## 📊 Résultats statistiques

- **Probabilité de rester :** 27.50 %  
- **Probabilité de quitter :** 72.50 %  
- **Prédiction finale :** ⚠️ *Le client risque fortement de quitter la banque.*

---

## 💡 Analyse économique

Ce profil présente un **risque de churn élevé (72.5%)**, justifié par plusieurs facteurs :  
- Une **relation récente** et donc peu de fidélisation historique.  
- Un **faible score de crédit**, traduisant un manque de confiance potentielle de la banque.  
- Une **satisfaction quasi nulle** et **aucun point de fidélité**, ce qui révèle un client insatisfait et peu engagé.  
- Une **capacité financière limitée**, rendant la banque moins incitée à investir dans la relation.

D’un point de vue économique, ce type de client représente un **segment vulnérable et instable**, souvent attiré par les offres concurrentes.  
Pour éviter sa perte, la banque devrait envisager des **stratégies de rétention personnalisées** :  
👉 Offrir des produits adaptés à son âge (retraite, assurance-vie, épargne senior).  
👉 Améliorer son expérience client par un suivi plus humain et des incitations ciblées.  
👉 Revaloriser la confiance à travers une éducation financière et une meilleure communication.

---
