# 03_exploitation.ipynb

## üéØ Interface utilisateur Gradio avec variables explicites

In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import joblib
import os
from sklearn.metrics import classification_report, ConfusionMatrixDisplay
from fpdf import FPDF
import gradio as gr

  from .autonotebook import tqdm as notebook_tqdm


In [3]:
# üîπ Charger le mod√®le, le preprocessor et les noms des colonnes originales
MODEL_PATH = "../models/churn_xgb_model.pkl"
PREPROCESSOR_PATH = "../models/churn_preprocessor.pkl"
ORIGINAL_COLUMNS_PATH = "../models/X_original_columns.pkl" # Chemin vers les noms de colonnes sauvegard√©s

try:
    model = joblib.load(MODEL_PATH)
    preprocessor = joblib.load(PREPROCESSOR_PATH)
    X_original_columns = joblib.load(ORIGINAL_COLUMNS_PATH)
    print("‚úÖ Mod√®le, preprocessor et noms des colonnes originales charg√©s avec succ√®s.")
except FileNotFoundError as e:
    print(f"Erreur de chargement de fichier : {e}. Assurez-vous que les fichiers .pkl existent dans ../models/")
    exit()
except Exception as e:
    print(f"Erreur lors du chargement des artefacts : {e}")
    exit()

# üßæ Valeurs possibles pour les inputs Gradio
# Ces listes doivent correspondre aux valeurs APR√àS le nettoyage manuel des cat√©gories (cat_fix)
login_device_options = ["Computer", "Mobile"]
payment_mode_options = ["Credit Card", "Debit Card", "E-Wallet", "UPI", "Cash on Delivery"]
gender_options = ["Male", "Female"]
order_cat_options = ["Laptop & Accessory", "Mobile", "Fashion", "Grocery", "Others"] # Ordre/valeurs apr√®s nettoyage
marital_status_options = ["Single", "Married", "Divorced"]
city_tier_options_gradio = ["1", "2", "3"] # Les inputs Gradio seront des strings, convertis en int puis en category
complain_options_gradio = ["0 (Non)", "1 (Oui)"] # Entr√©e descriptive, on extraira 0 ou 1


‚úÖ Mod√®le, preprocessor et noms des colonnes originales charg√©s avec succ√®s.


In [4]:
# üîÆ Fonction principale de pr√©diction
def predict_churn(device, payment, gender_val, category, status, tier_str, complain_str,
                  tenure, distance, time_app, devices, satisfaction, addresses,
                  hike, coupons, orders, days, cashback):

    # 1. Extraire les valeurs num√©riques de complain_str
    complain_val = int(complain_str.split(" ")[0])
    tier_val = int(tier_str)

    # 2. Construction du dictionnaire avec les noms de colonnes originaux
    input_dict = {
        'PreferredLoginDevice': device,
        'PreferredPaymentMode': payment,
        'Gender': gender_val,
        'PreferedOrderCat': category, # Attention √† l'orthographe ici ('Prefered' vs 'Preferred') - doit correspondre √† X_original_columns
        'MaritalStatus': status,
        'CityTier': tier_val, # Sera trait√© comme cat√©goriel par le preprocessor
        'Complain': complain_val, # Sera trait√© comme cat√©goriel par le preprocessor
        'Tenure': float(tenure) if tenure is not None else np.nan, # G√©rer les inputs vides/None de Gradio
        'WarehouseToHome': float(distance) if distance is not None else np.nan,
        'HourSpendOnApp': float(time_app) if time_app is not None else np.nan,
        'NumberOfDeviceRegistered': int(devices) if devices is not None else np.nan,
        'SatisfactionScore': int(satisfaction) if satisfaction is not None else np.nan,
        'NumberOfAddress': int(addresses) if addresses is not None else np.nan,
        'OrderAmountHikeFromlastYear': float(hike) if hike is not None else np.nan,
        'CouponUsed': int(coupons) if coupons is not None else np.nan,
        'OrderCount': int(orders) if orders is not None else np.nan,
        'DaySinceLastOrder': int(days) if days is not None else np.nan,
        'CashbackAmount': float(cashback) if cashback is not None else np.nan
    }

    # 3. Cr√©er un DataFrame Pandas en utilisant X_original_columns pour assurer l'ordre correct
    df = pd.DataFrame([input_dict], columns=X_original_columns)

    # 4. Appliquer les √©tapes de nettoyage des cat√©gories (avant le preprocessor)
    # Doit √™tre identique √† 01_preparation.ipynb
    cat_fix = {
        'PreferredLoginDevice': {'Phone': 'Mobile', 'Mobile Phone': 'Mobile'},
        'PreferredPaymentMode': {'CC': 'Credit Card', 'COD': 'Cash on Delivery', 'E wallet': 'E-Wallet'},
        'PreferedOrderCat': {'Mobile Phone': 'Mobile'}
    }
    for col, mapping in cat_fix.items():
        if col in df.columns:
            df[col] = df[col].replace(mapping)

    # 5. Imputation des valeurs manquantes (si Gradio permet des champs vides et qu'ils deviennent NaN)
    # La strat√©gie doit √™tre la m√™me que pour l'entra√Ænement.
    # Le preprocessor sauvegard√© devrait id√©alement g√©rer cela s'il a √©t√© fitt√© sur des donn√©es apr√®s imputation
    # ou si SimpleImputer fait partie du pipeline pour chaque type de colonne.
    # Si l'imputation a √©t√© faite manuellement avant de fitter le preprocessor dans 01_preparation,
    # il faut la r√©pliquer ici AVANT preprocessor.transform().
    # Pour cet exemple, on suppose que le preprocessor g√®re l'imputation si n√©cessaire
    # ou que les champs Gradio sont tous requis. Si ce n'est pas le cas :
    cat_cols_for_preprocessor = ['PreferredLoginDevice', 'PreferredPaymentMode', 'Gender',
                                 'PreferedOrderCat', 'MaritalStatus', 'CityTier', 'Complain']
    num_cols_for_preprocessor = [col for col in X_original_columns if col not in cat_cols_for_preprocessor]

    for col in df.columns:
        if df[col].isnull().any():
            if col in num_cols_for_preprocessor:
                # Ici, il faudrait id√©alement utiliser les m√©dianes/modes sauvegard√©s de l'entra√Ænement.
                # Pour simplifier ici, si une valeur est manquante pour une num√©rique, on met 0
                # ATTENTION: CE N'EST PAS ID√âAL, utilisez les valeurs d'imputation de l'entra√Ænement
                df[col].fillna(0, inplace=True)
            elif col in cat_cols_for_preprocessor:
                # Pour les cat√©gorielles, utiliser le mode (ou une cat√©gorie par d√©faut)
                df[col].fillna(df[col].mode()[0] if not df[col].mode().empty else "Unknown", inplace=True)


    # 6. Assurer les types corrects pour les colonnes cat√©gorielles avant le preprocessor
    for col in cat_cols_for_preprocessor:
        if col in df.columns:
            df[col] = df[col].astype('category')
            # S'assurer que les cat√©gories sont celles attendues par le OneHotEncoder
            # (handle_unknown='ignore' devrait aider, mais c'est une source d'erreur potentielle)
            # Par exemple, si le preprocessor a √©t√© entra√Æn√© avec certaines cat√©gories pour CityTier:
            # if col == 'CityTier' and hasattr(preprocessor.named_transformers_['cat'].named_steps['encoder'], 'categories_'):
            #     known_categories = preprocessor.named_transformers_['cat'].named_steps['encoder'].categories_[cat_cols_for_preprocessor.index(col)]
            #     df[col] = pd.Categorical(df[col], categories=known_categories)


    # 7. Appliquer le preprocessor charg√©
    try:
        df_processed = preprocessor.transform(df)
    except Exception as e:
        return f"Erreur lors du pr√©traitement : {e}. V√©rifiez les types et valeurs des inputs."

    # 8. Pr√©diction
    try:
        proba = model.predict_proba(df_processed)[0][1]
        prediction_val = model.predict(df_processed)[0]
        prediction_label = "‚ö†Ô∏è Le client risque de churner" if prediction_val == 1 else "‚úÖ Le client semble fid√®le"
        return f"{prediction_label}\nProbabilit√© de churn : {round(proba * 100, 2)}%"
    except Exception as e:
        return f"Erreur lors de la pr√©diction : {e}."

# üéõÔ∏è Interface Gradio
inputs = [
    gr.Dropdown(login_device_options, label="Appareil de Connexion Pr√©f√©r√©"),
    gr.Dropdown(payment_mode_options, label="Mode de Paiement Pr√©f√©r√©"),
    gr.Radio(gender_options, label="Genre"),
    gr.Dropdown(order_cat_options, label="Cat√©gorie de Commande Pr√©f√©r√©e"),
    gr.Dropdown(marital_status_options, label="Statut marital"),
    gr.Radio(city_tier_options_gradio, label="Niveau de la Ville (Tier)"),
    gr.Radio(complain_options_gradio, label="A-t-il d√©pos√© une plainte ?"),
    gr.Number(label="Anciennet√© (mois)", value=10), # Ajout de valeurs par d√©faut pour test
    gr.Number(label="Distance entre entrep√¥t et domicile (km)", value=15),
    gr.Number(label="Heures pass√©es sur l'app (par mois en moyenne)", value=3),
    gr.Number(label="Nb d'appareils enregistr√©s", value=3),
    gr.Slider(1, 5, step=1, label="Score de satisfaction", value=3),
    gr.Number(label="Nb d'adresses enregistr√©es", value=2),
    gr.Number(label="Augmentation du montant des commandes depuis l'an dernier (%)", value=15),
    gr.Number(label="Nb de coupons utilis√©s (le mois dernier)", value=1),
    gr.Number(label="Nb de commandes (le mois dernier)", value=2),
    gr.Number(label="Nb de jours depuis derni√®re commande", value=5),
    gr.Number(label="Montant moyen de cashback (‚Ç¨)", value=150)
]

interface = gr.Interface(
    fn=predict_churn,
    inputs=inputs,
    outputs=gr.Textbox(label="R√©sultat de la pr√©diction"),
    title="üß† Pr√©diction de Churn Client",
    description="Entrez les caract√©ristiques du client pour pr√©dire la probabilit√© de churn."
)

# üöÄ Lancement
if __name__ == '__main__':
    interface.launch()

* Running on local URL:  http://127.0.0.1:7862
* To create a public link, set `share=True` in `launch()`.
