<a href="https://colab.research.google.com/github/RMoulla/MLW_novembre/blob/main/Copie_de_CI_Churn_Prediction.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# TP : Automatisation des tests d'intégration avec une CI

## Objectif du TP

L'objectif de ce TP est de créer une API Flask capable de prédire le churn à partir de données clients. Cette API recevra des requêtes HTTP et, grâce à un modèle de machine learning, retournera une prédiction indiquant si un client est susceptible de se désabonner ou non. Vous mettrez également en place une pipeline CI/CD pour automatiser l'entraînement du modèle et les tests de l'API.

Le TP est divisé en deux grandes parties : la création et la sérialisation du modèle, suivie de la création de l'API et de la mise en place de tests automatisés avec une pipeline CI/CD.

## Structure du répertoire

```
churn-app/
│
├── data/
│   └── customer_churn.csv      # Le fichier CSV contenant les données des clients
│
├── churn-model.pkl             # Le modèle de machine learning sérialisé
│
├── app.py                      # Le script principal de l'application Flask
│
├── train.py                    # Le script d'entraînement du modèle
│
├── requirements.txt            # Les dépendances Python à installer
│
├── test_app.py                 # Les tests d'intégration pour l'API Flask
│
└── .github/
    └── workflows/
        └── ci.yml   
```

---

## Partie I : création de l'API Flask pour la prédiction du churn

### Étape 1 : entraînement et sérialisation du modèle

1. **Chargement des données** :
   - Utilisez `pandas` pour charger les données du fichier `customer_churn.csv`.
   - Les variables que vous utiliserez pour entraîner le modèle sont : `Age`, `Total_Purchase`, `Account_Manager`, `Years`, et `Num_Sites`.

2. **Entraînement du modèle** :
   - Utilisez un modèle de machine learning de la bibliothèque `scikit-learn`, comme `RandomForestClassifier`, pour entraîner un modèle de prédiction du churn.
   - Entraînez le modèle sur l'ensemble de données complet.

3. **Sérialisation du modèle** :
   - Sauvegardez le modèle entraîné sous forme de fichier `pickle` (`churn-model.pkl`) à l'aide de `joblib`, afin de pouvoir le charger ultérieurement dans l'API Flask.

---

### Étape 2 : création de l'API Flask

1. **Initialisation de l'application Flask** :
   - Créez un fichier `app.py` et initialisez une application Flask.

2. **Chargement du modèle** :
   - Dans `app.py`, chargez le modèle sérialisé (`churn-model.pkl`) à l'aide de `joblib.load()`.

3. **Création de l'endpoint de prédiction** :
   - Créez un endpoint `POST /predict` qui recevra des données JSON représentant un client avec les variables : `Age`, `Total_Purchase`, `Account_Manager`, `Years`, et `Num_Sites`.
   - Utilisez le modèle chargé pour faire une prédiction sur les données du client et retournez la réponse sous forme de JSON.

---

### Étape 3 : test de l'API Flask

1. **Test local de l'API** :
   - Utilisez un outil comme `curl` pour envoyer des requêtes POST à l'API avec des données JSON.
   - Vérifiez que l'API renvoie une prédiction correcte (0 ou 1) indiquant si un client va churner.

2. **Création de tests automatisés** :
   - Créez un fichier `test_app.py` en utilisant `unittest` ou `pytest` pour écrire des tests d'intégration de l'API Flask.
   - Testez les endpoints `GET /` et `POST /predict` pour vous assurer que l'API fonctionne comme prévu.

---

## Partie II : mise en place de la pipeline CI/CD

### Étape 1 : mise en place de la pipeline CI/CD avec GitHub Actions

1. **Création du fichier `ci.yml` pour GitHub Actions** :
   - Créez un fichier `.github/workflows/ci.yml` pour configurer une pipeline CI/CD avec GitHub Actions.
   - Dans ce fichier, ajoutez les étapes suivantes :
     - Installer les dépendances (`pip install -r requirements.txt`).
     - Exécuter le script `train.py` pour entraîner le modèle.
     - Exécuter les tests avec `pytest` pour vérifier que l'API fonctionne correctement.

2. **Automatisation des tests** :
   - Configurez la pipeline pour qu'elle s'exécute automatiquement à chaque `push` ou `pull request` sur le dépôt.
   - Vérifiez que les tests passent et que l'entraînement du modèle se fait correctement à chaque modification du code ou des données.

---

### Étape 2 : ajout de tests unitaires

1. **Création de tests unitaires pour les fonctions internes** :
   - Si votre application contient des fonctions utilitaires (par exemple, pour traiter ou formater les données), écrivez des tests unitaires pour ces fonctions avec `unittest` ou `pytest`.
   - Ces tests doivent vérifier que les fonctions fonctionnent indépendamment du reste du système.

2. **Exécution des tests unitaires** :
   - Ajoutez ces tests unitaires dans votre pipeline CI/CD pour qu'ils soient exécutés automatiquement à chaque modification du projet.

---
