# Brief Métier : Prédiction de Churn Clients avec le Deep Learning

## 1. Contexte professionnel
Vous êtes Data Scientists dans une ESN (Entreprise de Services Numériques) qui accompagne les opérateurs télécoms dans la réduction de la perte d’abonnés.
Votre nouveau client, TelcoNova, souhaite anticiper les départs de ses clients (churn) afin d’orienter ses campagnes de rétention.
Il met à votre disposition un extrait anonymisé de sa base CRM (le jeu Telco Customer Churn, déjà pré-nettoyé en grande partie) et vous laisse 3 jours pour livrer un premier prototype de modèle de prédiction exploitable en production.
TelcoNova exige un livrable reproductible et facilement intégrable par ses équipes MLOps ; vous travaillerez en binôme, en suivant les bonnes pratiques Git / GitHub.



## 2. Votre mission
Explorer & préparer les données :


audit qualité, gestion des valeurs manquantes, etc.


encodage des variables / normalisation / standardisation des variables


Élaborer un pipeline d’entraînement sous TensorFlow Keras ou PyTorch (au choix) :


architecture MLP pensée pour la tabulaire : ≥ 2 couches cachées,


fonction de perte adaptée à une classification binaire + gestion éventuelle du déséquilibre de classes.


callbacks (EarlyStopping, ModelCheckpoint, TensorBoard ou équivalent) pour suivre l’entraînement,


suivi des métriques : ROC-AUC, F1-score, Recall sur la classe Churn = Yes.


Évaluer, comparer, justifier :


fixer un baseline simple (régression logistique ou arbre de décision) pour mesurer le gain du réseau,


analyser les courbes d’apprentissage, la matrice de confusion, le ROC, les distributions des scores,


expliquer (au moins qualitativement) les variables les plus influentes.


Exporter le modèle + artefacts :


binaire du modèle (SavedModel ↔ TensorFlow / fichier .pt ↔ PyTorch),


scaler / encoder,


script ou notebook d’inférence qui charge les artefacts et prédit le churn sur de nouvelles données.


## 3. Fonctionnalités obligatoires (MVP)


<table style="width:75%">
  <tr>
    <th>Bloc</th>
    <th>Exigences clés</th>
  </tr>
  <tr>
    <td>Data Prep</td>
    <td>
        <ul>
            <li>Nettoyage & typage correct de toutes les colonnes</li>
            <li>Encodage systématique des catégorielle</li>
            <li>Split train / val / test (stratifié)</li>
        </ul>
    </td>
  </tr>
  <tr>
    <td>Modélisation</td>
    <td>
        <ul>
            <li>MLP implémenté from scratch sous TF /Keras ou PyTorch (pas d’API AutoML)</li>
            <li>Backprop + optimiseur (Adam ou SGD)</li>
            <li>Gestion du déséquilibre (pondération ou autre)</li>
        </ul>
    </td>
  </tr>
  <tr>
    <td>Suivi & répétabilité</td>
    <td>
      <ul>
        <li>TensorBoard ou PyTorch Lightning logger </li>
        <li>Seeds fixés + README détaillant la reproduction</li>
        <li>ModelCheckpoint pour restaurer le meilleur modèle</li>
      </ul>
    </td>
  </tr>
  <tr>
    <td>Évaluation</td>
    <td>
      <ul>
        <li>ROC-AUC ≥ 0 .80 OU F1 ≥ 0 .60</li>
        <li>Rapport comparant le réseau au baseline</li>
      </ul>
    </td>
  </tr>
  <tr>
    <td>Collaboration Git</td>
    <td>
      <ul>
        <li>1 branch = 1 feature</li>
        <li> Pull request systématique avec description</li>
      </ul> 
    </td>
  </tr>
</table>





## 4. Détails techniques & considérations
Imbalance : la classe Churn = Yes ≈ 26 %.


Pré-processing dans le même pipeline que l’inférence (pas de données “fuites” entre train et test).


Hyperparamètres : batch_size, learning_rate, nb_neurones par couche ; explorez‐les rapidement (Random Search / KerasTuner / Ray Tune) mais documentez votre stratégie.


Éthique & RGPD : aucune donnée personnellement identifiable ne doit sortir du cadre du projet.


## 5. Ressources utiles

Docs officielles :
 

TensorFlow /Keras : https://www.tensorflow.org/api_docs


PyTorch : https://pytorch.org/docs/


scikit-learn preprocessing : https://scikit-learn.org/stable/modules/preprocessing.html


Outils :


KerasTuner, Optuna (hyper-tuning)


Imbalanced-learn (rééchantillonnage)


Cours/vidéos :


DeepLearning.AI TensorFlow Developer (Coursera) – chapitres 2 & 3


PyTorch Lightning Crash Course (YouTube)


## 6. Livrables
Code source python propre et documenté


ROC-AUC ≥ 0 .80 ou F1 ≥ 0 .60


README clair, pas de données personnelles commitées


Présentation prête (10 min max et tous les membres du groupes doivent parler)



Groupe pour le brief

