# Notebook `05_app.ipynb`

---

# üñ•Ô∏è D√©ploiement de l'application interactive

Ce notebook final permet de **mettre en application les mod√®les de pr√©diction d√©velopp√©s** dans les notebooks pr√©c√©dents.  
Il propose une **interface interactive Gradio** qui permet d'estimer :
- le **prix probable** d‚Äôun service Fiverr,
- ainsi que sa **tranche de prix** (Basse, Moyenne ou Haute).

Cette application s‚Äôappuie sur un **pipeline hybride** combinant embeddings de texte et variables num√©riques pour fournir des pr√©dictions accessibles et rapides.

## üéØ Objectifs

- Int√©grer les **fonctions de pr√©diction** bas√©es sur les mod√®les enregistr√©s (`predict_price`, `predict_tranche`)
- Concevoir une **interface utilisateur intuitive** avec `gradio.Blocks`
- Ajouter une fonction de **log** permettant d‚Äôenregistrer les pr√©dictions pour analyse
- Proposer une interface flexible :
  - S√©lection de la fiabilit√© par niveau pr√©d√©fini (`Acceptable`, `Bonne`, etc.)
  - Ou r√©glage manuel via un `slider` num√©rique
- D√©ployer l'application en local ou sur un serveur

## üß† Fonctionnalit√©s cl√©s

- **Entr√©e utilisateur** :
  - Titre du service (texte libre)
  - Niveau du vendeur (option d√©sactiv√©e ici)
  - Fiabilit√© (par choix pr√©d√©fini ou valeur personnalis√©e)

- **Pr√©traitement transparent** :
  - Embedding de la description via `sentence-transformers`
  - Normalisation de la fiabilit√©
  - Alignement des colonnes avec les mod√®les entra√Æn√©s

- **Sorties affich√©es** :
  - Pr√©diction du **prix** (`predict_price`)
  - Pr√©diction de la **tranche de prix** (`predict_tranche`)

- **Fonction de signalement** :
  - Ajout des pr√©dictions dans un fichier `log.csv` pour audit ou analyse ult√©rieure

## Comp√©tences mobilis√©es

- **Bloc 3 ‚Äî C2** : Appliquer un pipeline de transformation coh√©rent entre entra√Ænement et usage r√©el.
- **Bloc 5 ‚Äî C4** : D√©ployer une application d‚ÄôIA accessible et interactive (Gradio).

*Ce notebook constitue la version d√©ployable de l‚Äôoutil de pr√©diction, √† pr√©senter au jury ou √† tester par les utilisateurs finaux.*

---

## üß≠ Sommaire

1. [Importation des biblioth√®ques](#-1-importation-des-biblioth√®ques)
2. [Pr√©paration du fichier de log](#-2-pr√©paration-du-fichier-de-log)
3. [D√©finition des niveaux de fiabilit√© pr√©d√©finis](#-3-d√©finition-des-niveaux-de-fiabilit√©-pr√©d√©finis)
4. [Fonction de pr√©diction principale](#-4-fonction-de-pr√©diction-principale)
5. [Fonction d‚Äôenregistrement des pr√©dictions dans le log](#-5-fonction-denregistrement-des-pr√©dictions-dans-le-log)
6. [Interface utilisateur Gradio](#-6-interface-utilisateur-gradio)
7. [Analyse de sensibilit√© √† la fiabilit√©](#-7-analyse-de-sensibilit√©-√†-la-fiabilit√©)
8. [Analyse exploratoire : corr√©lation Fiabilit√© / Prix](#-8-analyse-exploratoire--corr√©lation-fiabilit√©--prix)

---

## üóÉÔ∏è 2. D√©finition des constantes et du mod√®le d'embedding

### üß© 2.1. Pourquoi cette √©tape ?

Avant de mettre en place la logique d‚Äôinf√©rence, nous d√©finissons plusieurs **param√®tres globaux** :

- Le chemin du fichier de log
- L‚ÄôURL d‚Äôappel de l‚ÄôAPI REST (si FastAPI est utilis√©)
- Les valeurs de fiabilit√© pr√©d√©finies, plus simples √† s√©lectionner pour l‚Äôutilisateur
- La liste des niveaux de vendeur, utile pour le deep learning

Nous chargeons √©galement d√®s cette √©tape le **mod√®le d‚Äôembedding** SentenceTransformer, qui convertira les descriptions en vecteurs num√©riques dans les cas ML et DL.

### üìå 2.2. D√©tail des √©l√©ments d√©finis

| √âl√©ment | Description |
|--------|-------------|
| `LOG_PATH` | Chemin du fichier o√π seront enregistr√©es les pr√©dictions signal√©es |
| `API_URL`  | URL du point de terminaison de l‚ÄôAPI FastAPI |
| `choices`  | Dictionnaire de correspondance entre labels de fiabilit√© et pourcentages |
| `niveau_mapping` | Liste des niveaux de vendeurs utilis√©s dans le mod√®le DL |
| `embedding_model` | Mod√®le SentenceTransformer charg√© une seule fois pour √©viter les rechargements |

---

### üêç 2.3. Script de d√©finition

In [39]:
import gradio as gr
import pandas as pd
import numpy as np
import os
import joblib
import requests
import sys
from tensorflow.keras.models import load_model
from sentence_transformers import SentenceTransformer

sys.path.append('../code')  # si on est dans notebooks/
from ml_predict import predict_price, predict_tranche

---

## üåê 2. Initialisation des chemins API et fichiers

### üîå 2.1. Pourquoi cette √©tape ?

Avant toute interaction avec l‚ÄôAPI ou enregistrement dans un fichier, il est indispensable de **d√©finir les chemins de travail** :
- l‚Äôadresse de l‚Äô**API REST** d√©ploy√©e localement (ou √† distance),
- le chemin du **fichier de log** dans lequel seront stock√©es les pr√©dictions signal√©es.

Ces variables serviront tout au long de l'application, aussi bien pour effectuer les requ√™tes que pour consigner les r√©sultats.

### üß≠ 2.2. R√©sultat attendu

- Une variable `API_URL` contenant l‚Äôadresse de l‚ÄôAPI de pr√©diction.
- Une variable `LOG_PATH` pointant vers le fichier CSV de log (`flagged/log.csv`).

---

### üêç 2.3. Script de configuration initiale

Le script ci-dessous initialise :
- `LOG_PATH` : le chemin relatif vers le fichier de journalisation des pr√©dictions signal√©es,
- `API_URL` : l‚ÄôURL de l‚ÄôAPI FastAPI utilis√©e pour interroger le mod√®le de pr√©diction.

In [40]:
# Chemin d‚Äôenregistrement des pr√©dictions signal√©es
LOG_PATH = "flagged/log.csv"

API_DL_URL = "http://127.0.0.1:8000/predict"
API_ML_URL_PRICE = "http://127.0.0.1:8001/predict_price"
API_ML_URL_TRANCHE = "http://127.0.0.1:8001/predict_tranche"

---

## üéöÔ∏è 3. D√©finition des niveaux de fiabilit√© pr√©d√©finis

### üßÆ 3.1. Pourquoi proposer des niveaux ?

L'utilisateur peut indiquer la **fiabilit√© du vendeur** soit :
- en **valeur libre** via un curseur (`Slider`),
- soit en s√©lectionnant un **niveau pr√©d√©fini**, plus intuitif et guid√©.

Ces niveaux permettent :
- une **exp√©rience utilisateur simplifi√©e**,
- une **standardisation** des entr√©es dans le cadre de tests ou d‚Äô√©valuations.

### üìä 3.2. Correspondance des niveaux

| Niveau choisi    | Valeur num√©rique (%) |
|------------------|----------------------|
| Acceptable       | 80                   |
| Moyenne          | 85                   |
| Bonne            | 90                   |
| Tr√®s Bonne       | 96                   |
| Excellente       | 99                   |

---

### üêç 3.3. Script de d√©finition des niveaux de fiabilit√©

Le dictionnaire `choices` associe des niveaux de fiabilit√© verbaux √† des valeurs num√©riques.  
Cela permet une conversion directe entre une s√©lection utilisateur et un pourcentage exploitable par le mod√®le.

In [41]:
# Dictionnaire des niveaux de fiabilit√© pr√©d√©finis
choices = {
    "Acceptable": 80,     # Fiabilit√© de base, suffisante pour un d√©butant ou un profil r√©cent
    "Moyenne": 85,        # L√©g√®rement sup√©rieure √† la moyenne, indique un certain s√©rieux
    "Bonne": 90,          # Bon niveau de confiance dans les avis et les √©valuations
    "Tr√®s Bonne": 96,     # Profil tr√®s fiable, prestations r√©guli√®rement bien not√©es
    "Excellente": 99      # Niveau maximal de fiabilit√©, presque sans reproche
}

niveau_mapping = {
    "D√©butant": 1,
    "Interm√©diaire": 2,
    "Expert": 3
}

---

## üß† 4. Initialisation du mod√®le de deep learning

### ü§î 4.1. Pourquoi ce mod√®le ?

Dans le cadre de la soutenance, il est n√©cessaire de d√©montrer l'utilisation d'un **mod√®le de deep learning** (comp√©tence C3).  
Ce mod√®le prend en entr√©e :
- des **embeddings** issus de descriptions textuelles,
- ainsi que des variables num√©riques standardis√©es (fiabilit√©, niveau du vendeur...).

Il est entra√Æn√© s√©par√©ment puis int√©gr√© dans l‚Äôapplication via un **chargement diff√©r√©** pour optimiser les ressources.

### üßæ 4.2. Informations charg√©es

- `niveau_mapping` : liste des niveaux normalis√©s pour le mod√®le (`Beginner`, `Intermediate`, `Expert`).
- `embedding_model` : mod√®le `all-MiniLM-L6-v2` de SentenceTransformers pour convertir les descriptions en vecteurs.
- `deep_model` et `scaler_dl` : initialis√©s √† `None` pour permettre un **lazy loading** (chargement √† la demande).

---

### üêç 4.3. Script d‚Äôinitialisation

Ce script pr√©pare les √©l√©ments n√©cessaires √† l‚Äôex√©cution locale du mod√®le de deep learning :  
- niveaux de vendeur standardis√©s,
- transformation de texte en vecteurs,
- et initialisation diff√©r√©e du mod√®le et de son pr√©processeur.

In [42]:
# Liste des niveaux de vendeur (utilis√©e pour la pr√©diction deep learning locale)
niveau_mapping = {"D√©butant": 1, "Confirm√©": 2, "Expert": 3}
# Cette liste correspond aux niveaux de vendeur standardis√©s pour le mod√®le de deep learning local.
# Elle est utilis√©e notamment pour encoder ou d√©coder les niveaux dans l'ordre pr√©vu par le mod√®le.

# Chargement diff√©r√© (lazy loading) du mod√®le d'embedding de texte
embedding_model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
# Mod√®le de transformation des descriptions textuelles en vecteurs num√©riques (384 dimensions).
# Utilis√© pour alimenter le mod√®le deep learning.

# Initialisation diff√©r√©e du mod√®le deep learning et de son scaler
deep_model = None   # Le mod√®le sera charg√© ou d√©fini dynamiquement lors du premier appel de pr√©diction.
scaler_dl = None    # Le scaler associ√© au mod√®le DL (normalisation des donn√©es d‚Äôentr√©e) sera √©galement charg√© √† la vol√©e.

---

## üóÇÔ∏è 5. Chargement du mod√®le deep learning et du scaler

### üîÑ 5.1. Pourquoi un chargement diff√©r√© ?

Le mod√®le de deep learning et son scaler ne sont pas charg√©s d√®s le d√©marrage pour **√©conomiser la m√©moire**.  
Ils sont initialis√©s **√† la demande** gr√¢ce √† une fonction d√©di√©e, ce qui permet :
- d‚Äô√©viter de ralentir le d√©marrage de l‚Äôapplication,
- de limiter l‚Äôutilisation des ressources tant qu‚Äôune pr√©diction DL n‚Äôest pas requise.

### üì¶ 5.2. Ressources charg√©es

- `deep_model.h5` : mod√®le entra√Æn√© avec **Keras/TensorFlow**, stock√© dans le dossier `models/deep/`.
- `scaler.pkl` : objet `StandardScaler` (ou similaire) utilis√© pour **normaliser les variables num√©riques**.

---

### üêç 5.3. Script de chargement conditionnel

La fonction `load_deep_models()` utilise des variables globales pour ne charger les mod√®les qu‚Äôune seule fois.  
Elle garantit ainsi que le mod√®le et le scaler sont pr√™ts **uniquement quand n√©cessaire**, sans rechargement inutile.

In [43]:
def load_deep_models():
    """
    Charge les mod√®les n√©cessaires au deep learning si ce n‚Äôest pas d√©j√† fait.
    Utilise le mot-cl√© 'global' pour modifier les variables d√©finies √† l'ext√©rieur de la fonction.
    """
    global deep_model, scaler_dl  # On d√©clare vouloir utiliser/modifier les variables globales

    if deep_model is None:
        # Chargement du mod√®le de deep learning (r√©seau de neurones)
        deep_model = load_model("../models/deep/deep_model_notebook.h5")
        # Ce fichier contient le mod√®le entra√Æn√© avec Keras (format HDF5)

        # Chargement du scaler pour normaliser les variables num√©riques
        scaler_dl = joblib.load("../models/deep/scaler_notebook.pkl")
        # Le scaler assure la coh√©rence entre les donn√©es d'entra√Ænement et les donn√©es de pr√©diction

---

## üîÆ 6. Fonction de pr√©diction principale

### üß† 6.1. Objectif

Cette fonction est le **c≈ìur du syst√®me de pr√©diction**.  
Elle combine :
- le choix de la **source de fiabilit√©** (niveau pr√©d√©fini ou valeur libre),
- la **pr√©diction du prix exact** (mod√®le de r√©gression),
- la **pr√©diction de la tranche de prix** (mod√®le de classification).

Elle assure √©galement la **gestion des erreurs** en cas de mauvaise saisie ou de probl√®me technique.

### ‚öôÔ∏è 6.2. Param√®tres

| Param√®tre           | Type     | Description                                                                 |
|---------------------|----------|-----------------------------------------------------------------------------|
| `description`        | `str`    | Texte d√©crivant le service Fiverr                                          |
| `niveau`             | `str`    | Niveau du vendeur (`Beginner`, `Intermediate`, `Expert`)                  |
| `use_predefined`     | `bool`   | Indique si on utilise un niveau de fiabilit√© pr√©d√©fini                     |
| `fiabilite_percent`  | `float`  | Valeur manuelle de fiabilit√© (%) si `use_predefined` est `False`          |
| `fiabilite_choix`    | `str`    | Nom du niveau de fiabilit√© choisi si `use_predefined` est `True`           |
| `modele`             | `str`    | M√©thode √† utiliser : `ML - Local`, `DL - Local`, ou `API - FastAPI`        |

### üéØ 6.3. R√©sultat

Retourne deux pr√©dictions :
- le **prix estim√©** (float, arrondi √† 2 d√©cimales),
- la **tranche de prix** (`Basse`, `Moyenne`, `Haute` ou `"Non √©valu√©e"` selon le mod√®le).

En cas d'erreur, un message d'alerte est retourn√© √† la place du prix.

---

### üêç 6.4. Script de pr√©diction principale

Le script d√©tecte automatiquement le type de mod√®le √† utiliser :
- local ML avec classification (`predict_price`, `predict_tranche`),
- deep learning local (embeddings + scaler + `deep_model`),
- ou appel distant √† une API REST (`/predict`).

Chaque bloc est encapsul√© dans une structure `try/except` pour √©viter les plantages en cas d'erreur r√©seau, de chargement ou de traitement.

In [44]:
# Fonction principale de pr√©diction
def faire_une_prediction(description, niveau_label, use_predefined, fiabilite_percent, fiabilite_choix, modele):
    """
    Fonction centrale permettant de pr√©dire un prix (et une tranche si applicable) 
    selon le mod√®le s√©lectionn√© : local ML, local DL ou API distante.
    """

    # D√©termination de la fiabilit√© (soit via choix pr√©d√©fini, soit via valeur libre)
    fiabilite = (choices[fiabilite_choix] if use_predefined else fiabilite_percent) / 100
    niveau = niveau_mapping.get(niveau_label, 1)

    try:
        # Mod√®le machine learning local (ex. XGBoost + classification)
        if modele == "ML - Local":

            prix = predict_price(description, fiabilite) * 10
            tranche = predict_tranche(description, fiabilite)

        # Mod√®le deep learning local (Keras + embeddings)
        elif modele == "DL - Local":

            load_deep_models()  # Chargement du mod√®le et du scaler
            
            emb = embedding_model.encode([description]).flatten() # Embedding de la description textuelle

            niveau_ohe = [1 if niveau == n else 0 for n in [1, 2, 3]] # One-hot encoding du niveau vendeur
            
            features = np.hstack([emb, niveau_ohe, [fiabilite]]) # Assemblage des features : [embeddings] + [niveau OHE] + [fiabilit√©]
            
            features_scaled = scaler_dl.transform([features]) # Mise √† l‚Äô√©chelle des features
            
            prix = deep_model.predict(features_scaled)[0][0] * 10 # Pr√©diction avec le mod√®le DL
            
            tranche = "Non √©valu√©e"  # Le mod√®le DL ne fournit pas encore de classification

        # Pr√©diction via DL FastAPI
        elif modele == "DL - FastAPI":

            response = requests.post(
                API_DL_URL,
                json={"description": description, "niveau": niveau, "fiabilite": fiabilite},
                timeout=5
            )
            response.raise_for_status()
            data = response.json()
            prix = data.get("prix", -1) * 10
            tranche = data.get("tranche", "Non √©valu√©e")
            
        # Pr√©diction via ML FastAPI
        elif modele == "ML - FastAPI":

            prix = -1
            tranche = "Non √©valu√©e"

            # Appel API pour le prix
            response_price = requests.post(
                API_ML_URL_PRICE,
                json={"description": description, "fiabilite": fiabilite},
                timeout=5
            )
            response_price.raise_for_status()
            prix = response_price.json().get("prix", -1) * 10

            # Appel API pour la tranche
            response_tranche = requests.post(
                API_ML_URL_TRANCHE,
                json={"description": description, "fiabilite": fiabilite},
                timeout=5
            )
            response_tranche.raise_for_status()
            tranche = response_tranche.json().get("tranche", "Non √©valu√©e")

        # Cas de mod√®le inconnu
        else:
            return "Mod√®le inconnu", ""

        # R√©sultat final : prix arrondi et tranche
        return round(prix, 2), tranche

    except Exception as e:
        # Gestion des erreurs inattendues
        return f"Erreur : {str(e)}", ""


---

## üìù 7. Fonction d‚Äôenregistrement des pr√©dictions dans le log

### üß† 7.1. Objectif

Cette fonction permet de **conserver un historique des pr√©dictions** r√©alis√©es via l‚Äôapplication Gradio.  
Elle enregistre chaque estimation dans un fichier `log.csv`, avec les donn√©es d‚Äôentr√©e et les r√©sultats associ√©s.

### üóÉÔ∏è 7.2. Donn√©es enregistr√©es

| Colonne            | Description                                             |
|--------------------|---------------------------------------------------------|
| `Description`       | Texte fourni par l‚Äôutilisateur                          |
| `Fiabilit√© (%)`     | Valeur de fiabilit√© (selon s√©lection manuelle ou pr√©d√©finie) |
| `Prix pr√©dit (‚Ç¨)`   | R√©sultat de la pr√©diction de prix (r√©gression)         |
| `Tranche pr√©dite`   | R√©sultat de la classification (`Basse`, `Moyenne`, `Haute`) |
| `Mod√®le utilis√©`    | Type de mod√®le utilis√© (`ML - Local`, `DL - Local`, `API`)   |

### üßæ 7.3. Comportement

- Le fichier `log.csv` est **cr√©√© s‚Äôil n‚Äôexiste pas**, ou mis √† jour en **mode ajout** (`append`).
- Chaque pr√©diction est **enregistr√©e sur une ligne distincte**.

> ‚ÑπÔ∏è Ce fichier log peut servir de **trace d‚Äôutilisation**, ou de base pour des analyses a posteriori.

---

### üêç 7.4. Script d‚Äôenregistrement dans le fichier log

Le script ci-dessus construit dynamiquement une ligne de donn√©es √† partir des entr√©es utilisateur et du r√©sultat de pr√©diction.  
Il g√®re automatiquement la cr√©ation ou la mise √† jour du fichier `log.csv` situ√© dans le r√©pertoire `flagged/`.

In [45]:
# Fonction d'enregistrement d'une pr√©diction dans le fichier log
def enregistrer_log(description, use_predefined, fiabilite_percent, fiabilite_choix, prix, tranche, modele):
    """
    Enregistre une pr√©diction dans un fichier CSV de log.
    G√®re le formatage, la s√©lection de la fiabilit√© et la cr√©ation/extension du fichier.
    """

    # D√©termination de la fiabilit√© selon le mode s√©lectionn√©
    fiabilite = choices[fiabilite_choix] if use_predefined else fiabilite_percent

    # Construction du dictionnaire de donn√©es √† enregistrer
    log_data = {
        "Description": description,
        "Fiabilit√© (%)": fiabilite,
        "Prix pr√©dit (‚Ç¨)": prix,
        "Tranche pr√©dite": tranche,
        "Mod√®le utilis√©": modele
    }

    # Conversion en DataFrame (une seule ligne)
    df_log = pd.DataFrame([log_data])
    os.makedirs(os.path.dirname(LOG_PATH), exist_ok=True)

    # Ajout au fichier existant ou cr√©ation si n√©cessaire
    if os.path.exists(LOG_PATH):
        # Le fichier existe d√©j√† : ajout en mode append sans les en-t√™tes
        df_log.to_csv(LOG_PATH, mode="a", index=False, header=False)
    else:
        # Le fichier n‚Äôexiste pas encore : cr√©ation avec en-t√™tes
        df_log.to_csv(LOG_PATH, index=False)

    # Message de retour pour l‚Äôutilisateur
    return "Signalement enregistr√© avec succ√®s."

---

## üñ•Ô∏è 8. Interface utilisateur Gradio

### üéØ 8.1. Objectif

Proposer une **interface interactive et intuitive** pour permettre √† l‚Äôutilisateur :
- de saisir les informations d‚Äôun service Fiverr,
- d‚Äôobtenir imm√©diatement une **estimation du prix** (`R√©gression`),
- et sa **tranche de prix** (`Classification`),
- puis de **signaler** le cas au fichier `log.csv` si besoin.

### üß∞ 8.2. Composants principaux

| √âl√©ment                    | Fonction                                                                 |
|----------------------------|--------------------------------------------------------------------------|
| `Textbox` (description)    | Entr√©e textuelle d√©crivant le service                                   |
| `Dropdown` (niveau)        | Choix du niveau du vendeur (actuellement masqu√©, future √©volution)      |
| `Checkbox` / `Radio`       | S√©lection du niveau de fiabilit√© (manuelle ou pr√©d√©finie)               |
| `Button`                   | Lance la pr√©diction (`üìà Estimer le prix`)                              |
| `Textbox` (sorties)        | Affichage des r√©sultats (`Prix estim√©`, `Tranche estim√©e`)              |
| `Button`                   | Enregistrement de la pr√©diction dans le fichier log (`üö®`)              |
| `Textbox` (confirmation)   | Message de confirmation en cas de signalement r√©ussi                    |

### üîÅ 8.3. Logique d‚Äôinteraction

- **Fiabilit√© personnalis√©e ou pr√©d√©finie** :  
  L‚Äôutilisateur peut choisir d‚Äôutiliser un curseur libre (pourcentage) ou un niveau de fiabilit√© pr√©d√©fini.

- **Synchronisation dynamique** :  
  Le radio bouton met √† jour la valeur du slider et inversement si on d√©coche la case.

- **Traitement centralis√©** :  
  Les fonctions `faire_une_prediction` et `enregistrer_log` pilotent la logique m√©tier.

---

### üêç 8.4. Script Gradio (cr√©ation de l‚Äôinterface)

Le script ci-dessus cr√©e une interface structur√©e en deux colonnes :
- √† gauche : les **param√®tres d‚Äôentr√©e** utilisateur,
- √† droite : les **r√©sultats** de pr√©diction et les **actions de signalement**.

L‚Äôapplication est directement **lanc√©e avec `iface.launch()`**.

In [46]:
# Interface utilisateur Gradio
with gr.Blocks() as demo:
    with gr.Row():
        with gr.Column(scale=1):
            description = gr.Textbox(label="Description du service", value="Je d√©veloppe un site web", lines=2, placeholder="Je fais des audits qualit√©...")
            use_predefined = gr.Checkbox(label="Utiliser un niveau de fiabilit√© pr√©d√©fini", value=True, visible=False)
            fiabilite_percent = gr.Slider(label="Fiabilit√© (%)", minimum=0, maximum=100, value=80, step=5, visible=False)
            fiabilite_choix = gr.Radio(label="Niveau de fiabilit√©", choices=list(choices.keys()), value="Acceptable", visible=True)
            modele = gr.Radio(
                label="Mod√®le √† utiliser",
                choices=["ML - Local", "ML - FastAPI", "DL - Local", "DL - FastAPI"],
                value="ML - Local"
            )
            niveau = gr.Dropdown(label="Niveau du vendeur", choices=list(niveau_mapping.keys()), value="D√©butant", visible=False)
            bouton_predire = gr.Button("Estimer le prix")

        with gr.Column(scale=1):
            sortie_prix = gr.Textbox(label="Prix estim√© en ‚Ç¨/h",  value="Attente de pr√©diction", visible=False)
            sortie_tranche = gr.Textbox(label="Tendance des prix sur le march√©",  value="Attente de pr√©diction", visible=True)
            bouton_signaler = gr.Button("Ajouter au fichier log.csv")
            confirmation = gr.Textbox(label="Confirmation", visible=False)

    # === Fonctions d'interactions ===

    def sync_slider_with_radio(choix):
        return gr.update(value=choices[choix])
    
    fiabilite_choix.change(sync_slider_with_radio, inputs=fiabilite_choix, outputs=fiabilite_percent)

    def toggle_inputs(use_predef):
        return {
            fiabilite_percent: gr.update(visible=not use_predef),
            fiabilite_choix: gr.update(visible=use_predef)
        }

    use_predefined.change(toggle_inputs, inputs=use_predefined, outputs=[fiabilite_percent, fiabilite_choix])

    def toggle_niveau(model_choice):
        return gr.update(visible=model_choice in ["DL - Local", "DL - FastAPI"])

    modele.change(toggle_niveau, inputs=modele, outputs=niveau)

    def toggle_prix_visibility(model_choice):
        return gr.update(visible=model_choice in ["DL - Local", "DL - FastAPI"], value="Attente de pr√©diction")

    modele.change(toggle_prix_visibility, inputs=modele, outputs=sortie_prix)

    def toggle_tranche_visibility(model_choice):
        return gr.update(visible=model_choice in ["ML - Local", "ML - FastAPI"], value="Attente de pr√©diction")

    modele.change(toggle_tranche_visibility, inputs=modele, outputs=sortie_tranche)

    def reset_sortie_prix(model_choice):
        return gr.update(value="Attente de pr√©diction")

    modele.change(reset_sortie_prix, inputs=modele, outputs=sortie_prix)

    def faire_une_prediction(description, niveau, use_predef, fiab_percent, fiab_choix, model):
        # √Ä remplacer par ta logique r√©elle de pr√©diction
        return "12.5", "Moyenne"

    def enregistrer_log(description, use_predef, fiab_percent, fiab_choix, prix, tranche, model):
        # √Ä remplacer par ta logique r√©elle d‚Äôenregistrement
        return "‚úÖ Pr√©diction enregistr√©e dans le fichier log.csv"

    bouton_predire.click(
        fn=faire_une_prediction,
        inputs=[description, niveau, use_predefined, fiabilite_percent, fiabilite_choix, modele],
        outputs=[sortie_prix, sortie_tranche]
    )

    bouton_signaler.click(
        fn=enregistrer_log,
        inputs=[description, use_predefined, fiabilite_percent, fiabilite_choix, sortie_prix, sortie_tranche, modele],
        outputs=confirmation
    )

demo.launch()

#iface.launch()

Running on local URL:  http://127.0.0.1:7861

To create a public link, set `share=True` in `launch()`.




IMPORTANT: You are using gradio version 3.39.0, however version 4.44.1 is available, please upgrade.
--------


## üß† Justification des incoh√©rences apparentes dans les tranches pr√©dictives

### ‚ùì Probl√®me observ√©

Dans certains cas, il peut sembler incoh√©rent qu‚Äôune **tranche de prix estim√©e** soit plus √©lev√©e pour une **fiabilit√© "Acceptable"** que pour une fiabilit√© "Excellente". Par exemple :

- Pour une **fiabilit√© Acceptable (80%)**, la tranche pr√©dite est **Haute**
- Pour une **fiabilit√© Excellente (99%)**, la tranche pr√©dite est **Basse**

### üß© Explication technique

Cette situation peut √™tre expliqu√©e de fa√ßon coh√©rente par la conception du pipeline :

1. **Deux mod√®les ind√©pendants sont utilis√©s** :
   - Un mod√®le de **r√©gression** qui pr√©dit un **prix num√©rique**
   - Un mod√®le de **classification** qui pr√©dit une **tranche cat√©gorielle** (`Basse`, `Moyenne`, `Haute`)
   - Ces deux mod√®les sont **entra√Æn√©s s√©par√©ment**, sur des cibles diff√©rentes

2. **La classification ne d√©pend pas du prix pr√©dit** :
   - Le mod√®le de classification apprend √† pr√©dire une **cat√©gorie** (la tranche r√©elle observ√©e) en fonction d‚Äôun ensemble de variables, notamment :
     - L‚Äôembedding de la description
     - La fiabilit√© pond√©r√©e
   - Il ne conna√Æt **ni le prix r√©el, ni le prix pr√©dit par le mod√®le de r√©gression**

3. **La fiabilit√© pond√©r√©e n‚Äôa pas une influence lin√©aire** :
   - Une meilleure fiabilit√© (Excellente) ne garantit pas forc√©ment un prix plus √©lev√© ni une tranche plus haute
   - En pratique, **le mod√®le peut estimer qu‚Äôun service g√©n√©rique tr√®s fiable** (par exemple un intitul√© trop large ou basique) appartient aux tranches basses
   - Tandis qu‚Äôun **service plus cibl√© ou sp√©cialis√©** avec une fiabilit√© moyenne peut √™tre associ√© aux tranches hautes

### üìå Interpr√©tation m√©tier

Ce comportement n'est pas une erreur mais une **manifestation de la logique d'apprentissage supervis√©** :

> Le mod√®le de classification apprend des **r√®gles implicites** pr√©sentes dans les donn√©es d‚Äôentra√Ænement. Il peut consid√©rer certaines descriptions comme typiquement premium, ind√©pendamment du niveau de fiabilit√©, ce qui entra√Æne une tranche "Haute" m√™me avec une fiabilit√© modeste.

### ‚úÖ Conclusion

Il est important de retenir :

- Le syst√®me n‚Äôutilise **pas une simple r√®gle √† seuils** sur le prix pour classer les tranches
- Il s‚Äôagit d‚Äôun mod√®le **entra√Æn√© √† partir d‚Äôobservations r√©elles**
- Les incoh√©rences apparentes sont souvent dues √† des **corr√©lations non triviales** dans les donn√©es (nature du service, vocabulaire utilis√©, etc.)

Cette explication souligne la complexit√© du comportement des mod√®les d‚ÄôIA, et la n√©cessit√© de les √©valuer **sur l‚Äôensemble du pipeline**, pas uniquement sur un cas particulier.

---

## üîç 9. Analyse de sensibilit√© √† la fiabilit√©

### üß™ 9.1. Objectif de cette cellule

V√©rifier que la **variable `Fiabilit√©` a bien un impact** significatif sur le prix pr√©dit.  
On fait varier la valeur de fiabilit√© de 0 % √† 100 %, tout en gardant constante la description du service.

### üìä 9.2. M√©thodologie

- Le service test√© est simplement : `"Je fais le m√©nage"`
- On fait √©voluer la fiabilit√© de 0.00 √† 1.00 (i.e. de 0 % √† 100 %)
- Pour chaque niveau de fiabilit√©, on **pr√©voit le prix** avec le mod√®le de r√©gression finalis√©
- On affiche ensuite les r√©sultats dans la console

### üîç 9.3. Ce que l'on cherche √† observer

- Une **augmentation globale du prix** avec la fiabilit√© croissante (logique m√©tier)
- Une **zone d'inflexion ou palier √©ventuel** aux alentours de 0.8 (80 %) ‚Äî crit√®re de haute fiabilit√©
- Des **r√©sultats coh√©rents** avec ceux observ√©s dans l‚Äôapplication Gradio

> üí° *Cette √©tape permet de valider qualitativement la sensibilit√© du mod√®le aux variations d‚Äôun indicateur cl√© m√©tier.*

---

### üêç 9.4. Script de test d‚Äôimpact de la fiabilit√©

In [47]:
# Exemple de description et niveau √† tester
desc = "Je fais le m√©nage"

# Test de l‚Äôimpact de la fiabilit√© sur la pr√©diction du prix
for f in [0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.81, 0.82, 0.83, 0.84, 0.85, 0.9, 0.91, 0.92, 0.93, 0.94, 0.95, 0.96, 0.97, 0.98, 0.99, 1.0]:
    prix = predict_price(desc, f)
    print(f"Fiabilit√© = {f*100:.0f}% ‚Üí Prix pr√©dit = {prix} ‚Ç¨")

Fiabilit√© = 0% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 10% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 20% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 30% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 40% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 50% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 60% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 70% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 80% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 81% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 82% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 83% ‚Üí Prix pr√©dit = 1.38 ‚Ç¨
Fiabilit√© = 84% ‚Üí Prix pr√©dit = 1.42 ‚Ç¨
Fiabilit√© = 85% ‚Üí Prix pr√©dit = 1.42 ‚Ç¨
Fiabilit√© = 90% ‚Üí Prix pr√©dit = 1.49 ‚Ç¨
Fiabilit√© = 91% ‚Üí Prix pr√©dit = 1.49 ‚Ç¨
Fiabilit√© = 92% ‚Üí Prix pr√©dit = 1.49 ‚Ç¨
Fiabilit√© = 93% ‚Üí Prix pr√©dit = 1.49 ‚Ç¨
Fiabilit√© = 94% ‚Üí Prix pr√©dit = 1.54 ‚Ç¨
Fiabilit√© = 95% ‚Üí Prix pr√©dit = 1.59 ‚Ç¨
Fiabilit√© = 96% ‚Üí Prix pr√©dit = 1.61 ‚Ç¨
Fiabilit√© = 97% ‚Üí Prix pr√©dit = 1.68 ‚Ç¨
Fiabilit√© 

---

## üìä 10. Analyse exploratoire : corr√©lation Fiabilit√© / Prix

### üß™ 10.1. Objectif de cette cellule

V√©rifier empiriquement si la **fiabilit√© du vendeur est corr√©l√©e au prix propos√©**.  
Cela permet de **valider la pertinence** de cette variable comme feature dans notre mod√®le.

### üßÆ 10.2. Statistiques de la variable `Fiabilite`

- Affichage de la distribution statistique (`min`, `max`, `mean`, `std`, etc.)
- V√©rification que la variable **varie suffisamment** pour avoir un potentiel explicatif

### üîó 10.3. Corr√©lation entre `Fiabilite` et `Prix`

- Calcul du **coefficient de corr√©lation de Pearson**
- Permet de d√©tecter une **relation lin√©aire potentielle** entre la variable explicative et la cible

> üí° Une corr√©lation significative (positive ou n√©gative) soutient l'id√©e que cette variable a un **r√¥le d√©terminant** dans le mod√®le de pr√©diction.

---

### üêç 10.4. Script d‚Äôanalyse exploratoire

In [48]:
df = pd.read_csv("../data/fiverr_cleaned_dl_notebook.csv")
print(df["Fiabilite"].describe())
print(df[["Fiabilite", "Prix"]].corr())

count    1145.000000
mean        1.116113
std         0.530929
min         0.081877
25%         0.714403
50%         0.811702
75%         1.653477
max         2.620674
Name: Fiabilite, dtype: float64
           Fiabilite      Prix
Fiabilite   1.000000  0.125243
Prix        0.125243  1.000000
