# Notebook `05_app.ipynb`

---

# üñ•Ô∏è D√©ploiement de l'application interactive

Ce notebook final permet de **mettre en application les mod√®les de pr√©diction d√©velopp√©s** dans les notebooks pr√©c√©dents.  
Il propose une **interface interactive Gradio** qui permet d'estimer :
- le **prix probable** d‚Äôun service Fiverr,
- ainsi que sa **tranche de prix** (Basse, Moyenne ou Haute).

Cette application s‚Äôappuie sur un **pipeline hybride** combinant embeddings de texte et variables num√©riques pour fournir des pr√©dictions accessibles et rapides.

## üéØ Objectifs

- üß† Int√©grer les **fonctions de pr√©diction** bas√©es sur les mod√®les enregistr√©s (`predict_price`, `predict_tranche`)
- üß∞ Concevoir une **interface utilisateur intuitive** avec `gradio.Blocks`
- üìù Ajouter une fonction de **log** permettant d‚Äôenregistrer les pr√©dictions pour analyse
- ‚öôÔ∏è Proposer une interface flexible :
  - S√©lection de la fiabilit√© par niveau pr√©d√©fini (`Acceptable`, `Bonne`, etc.)
  - Ou r√©glage manuel via un `slider` num√©rique
- üöÄ D√©ployer l'application en local ou sur un serveur

## üß† Fonctionnalit√©s cl√©s

- ‚úèÔ∏è **Entr√©e utilisateur** :
  - Titre du service (texte libre)
  - Niveau du vendeur (option d√©sactiv√©e ici)
  - Fiabilit√© (par choix pr√©d√©fini ou valeur personnalis√©e)

- üîÑ **Pr√©traitement transparent** :
  - Embedding de la description via `sentence-transformers`
  - Normalisation de la fiabilit√©
  - Alignement des colonnes avec les mod√®les entra√Æn√©s

- üìà **Sorties affich√©es** :
  - Pr√©diction du **prix** (`predict_price`)
  - Pr√©diction de la **tranche de prix** (`predict_tranche`)

- üìÅ **Fonction de signalement** :
  - Ajout des pr√©dictions dans un fichier `log.csv` pour audit ou analyse ult√©rieure

## ‚úÖ Comp√©tences mobilis√©es

- **Bloc 3 ‚Äî C2** : Appliquer un pipeline de transformation coh√©rent entre entra√Ænement et usage r√©el.
- **Bloc 5 ‚Äî C4** : D√©ployer une application d‚ÄôIA accessible et interactive (Gradio).

üë®‚Äçüè´ *Ce notebook constitue la version d√©ployable de l‚Äôoutil de pr√©diction, √† pr√©senter au jury ou √† tester par les utilisateurs finaux.*

---

## üß≠ Sommaire

1. [üìò Importation des biblioth√®ques](#üìò-1-importation-des-biblioth√®ques)
2. [üìÇ Pr√©paration du fichier de log](#üìÇ-2-pr√©paration-du-fichier-de-log)
3. [üéöÔ∏è D√©finition des niveaux de fiabilit√© pr√©d√©finis](#üéöÔ∏è-3-d√©finition-des-niveaux-de-fiabilit√©-pr√©d√©finis)
4. [üîÆ Fonction de pr√©diction principale](#üîÆ-4-fonction-de-pr√©diction-principale)
5. [üìù Fonction d‚Äôenregistrement des pr√©dictions dans le log](#üìù-5-fonction-denregistrement-des-pr√©dictions-dans-le-log)
6. [üñ•Ô∏è Interface utilisateur Gradio](#üñ•Ô∏è-6-interface-utilisateur-gradio)
7. [üîç Analyse de sensibilit√© √† la fiabilit√©](#üîç-7-analyse-de-sensibilit√©-√†-la-fiabilit√©)
8. [üìä Analyse exploratoire : corr√©lation Fiabilit√© / Prix](#üìä-8-analyse-exploratoire--corr√©lation-fiabilit√©--prix)

---

## üìò 1. Importation des biblioth√®ques

### üß∞ 1.1. Pourquoi cette √©tape ?

Avant de lancer l‚Äôinterface applicative, il est essentiel de charger les **biblioth√®ques n√©cessaires** au fonctionnement de Gradio, √† la gestion des fichiers et √† l‚Äôex√©cution des fonctions de pr√©diction.

Ces fonctions (`predict_price`, `predict_tranche`) ont √©t√© d√©velopp√©es dans le fichier `predict.py` et reposent sur les mod√®les et outils enregistr√©s lors de la phase de mod√©lisation.

### üìö 1.2. Biblioth√®ques utilis√©es

| Biblioth√®que | Utilisation principale |
|--------------|------------------------|
| `gradio`     | Cr√©ation de l‚Äôinterface web interactive |
| `pandas`     | Gestion du fichier log (`log.csv`) |
| `os`         | Manipulation du syst√®me de fichiers |
| `predict`    | Import des fonctions de pr√©diction utilis√©es dans l‚Äôinterface |

---

### üêç 1.3. Script d‚Äôimportation

In [17]:
import gradio as gr
import pandas as pd
import os
from predict import predict_price, predict_tranche  # doit √™tre dans le m√™me dossier ou accessible dans PYTHONPATH

---

## üìÇ 2. Pr√©paration du fichier de log

### üßæ 2.1. Pourquoi cette √©tape ?

L‚Äôapplication permet aux utilisateurs de **signaler les pr√©dictions** effectu√©es (prix et tranche) dans un fichier CSV de log.  
Ce fichier pourra √™tre exploit√© ult√©rieurement pour :
- analyser les cas utilisateurs,
- affiner les mod√®les,
- ou justifier certaines pr√©dictions en situation r√©elle.

Il est donc n√©cessaire de :
- d√©finir un **chemin d‚Äôenregistrement** (`flagged/log.csv`),
- s‚Äôassurer que le r√©pertoire `flagged/` existe pour √©viter toute erreur d‚Äô√©criture.

### üìÅ 2.2. R√©sultat attendu

- Le chemin `flagged/log.csv` est pr√™t √† recevoir les enregistrements.
- Le dossier `flagged/` est cr√©√© s‚Äôil n‚Äôexistait pas d√©j√†.

---

### üêç 2.3. Script de pr√©paration du fichier log

In [18]:
LOG_PATH = "flagged/log.csv"
#os.makedirs(os.path.dirname(LOG_PATH), exist_ok=True)

---

## üéöÔ∏è 3. D√©finition des niveaux de fiabilit√© pr√©d√©finis

### üßÆ 3.1. Pourquoi proposer des niveaux ?

L'utilisateur peut indiquer la **fiabilit√© du vendeur** soit :
- en **valeur libre** via un curseur (`Slider`),
- soit en s√©lectionnant un **niveau pr√©d√©fini**, plus intuitif et guid√©.

Ces niveaux permettent :
- une **exp√©rience utilisateur simplifi√©e**,
- une **standardisation** des entr√©es dans le cadre de tests ou d‚Äô√©valuations.

### üìä 3.2. Correspondance des niveaux

| Niveau choisi    | Valeur num√©rique (%) |
|------------------|----------------------|
| Acceptable       | 80                   |
| Moyenne          | 85                   |
| Bonne            | 90                   |
| Tr√®s Bonne       | 96                   |
| Excellente       | 99                   |

---

### üêç 3.3. Script de d√©finition des niveaux de fiabilit√©

In [19]:
# üî∏ Niveaux pr√©d√©finis de fiabilit√© (%)
choices = {
    "Acceptable": 80,
    "Moyenne": 85,
    "Bonne": 90,
    "Tr√®s Bonne": 96,
    "Excellente": 99
}

---

## üîÆ 4. Fonction de pr√©diction principale

### üß† 4.1. Objectif

Cette fonction est le **c≈ìur du syst√®me de pr√©diction**.  
Elle combine :
- le choix de la **source de fiabilit√©** (niveau pr√©d√©fini ou valeur libre),
- la **pr√©diction du prix exact** (mod√®le de r√©gression),
- la **pr√©diction de la tranche de prix** (mod√®le de classification).

Elle assure √©galement la **gestion des erreurs** en cas de mauvaise saisie ou de probl√®me technique.

### ‚öôÔ∏è 4.2. Param√®tres

| Param√®tre           | Type     | Description                                                                 |
|---------------------|----------|-----------------------------------------------------------------------------|
| `description`        | `str`    | Texte d√©crivant le service Fiverr                                          |
| `niveau`             | `str`    | Niveau du vendeur (actuellement non utilis√© dans le mod√®le)                |
| `use_predefined`     | `bool`   | Indique si on utilise un niveau de fiabilit√© pr√©d√©fini                     |
| `fiabilite_percent`  | `float`  | Valeur manuelle de fiabilit√© (%) si `use_predefined` est `False`          |
| `fiabilite_choix`    | `str`    | Nom du niveau de fiabilit√© choisi si `use_predefined` est `True`           |

### üéØ 4.3. R√©sultat

Retourne deux pr√©dictions :
- le **prix estim√©** (float, arrondi √† 2 d√©cimales),
- la **tranche de prix** (`Basse`, `Moyenne`, `Haute`).

En cas d'erreur, un message d'alerte est retourn√© √† la place du prix.

---

### üêç 4.4. Script de pr√©diction principale

In [20]:
# üîç Fonction principale de pr√©diction
def faire_une_prediction(description, niveau, use_predefined, fiabilite_percent, fiabilite_choix):
    fiabilite = (choices[fiabilite_choix] if use_predefined else fiabilite_percent) / 100
    try:
        prix = predict_price(description, fiabilite)
        tranche = predict_tranche(description, fiabilite)
        return round(prix, 2), tranche
    except Exception as e:
        return f"Erreur : {str(e)}", ""

---

## üìù 5. Fonction d‚Äôenregistrement des pr√©dictions dans le log

### üß† 5.1. Objectif

Cette fonction permet de **conserver un historique des pr√©dictions** r√©alis√©es via l‚Äôapplication Gradio.  
Elle enregistre chaque estimation dans un fichier `log.csv`, avec les donn√©es d‚Äôentr√©e et les r√©sultats associ√©s.

### üóÉÔ∏è 5.2. Donn√©es enregistr√©es

| Colonne            | Description                                             |
|--------------------|---------------------------------------------------------|
| `Description`       | Texte fourni par l‚Äôutilisateur                          |
| `Niveau`            | Niveau du vendeur s√©lectionn√© (actuellement non utilis√©) |
| `Fiabilit√© (%)`     | Valeur de fiabilit√© (selon s√©lection manuelle ou pr√©d√©finie) |
| `Prix pr√©dit (‚Ç¨)`   | R√©sultat de la pr√©diction de prix (r√©gression)         |
| `Tranche pr√©dite`   | R√©sultat de la classification (`Basse`, `Moyenne`, `Haute`) |

### üßæ 5.3. Comportement

- Le fichier `log.csv` est **cr√©√© s‚Äôil n‚Äôexiste pas**, ou mis √† jour en **mode ajout** (`append`).
- Chaque pr√©diction est **enregistr√©e sur une ligne distincte**.

> ‚ÑπÔ∏è Ce fichier log peut servir de **trace d‚Äôutilisation**, ou de base pour des analyses a posteriori.

---

### üêç 5.4. Script d‚Äôenregistrement dans le fichier log

In [21]:
# üìù Fonction d'enregistrement dans le fichier log
def enregistrer_log(description, niveau, use_predefined, fiabilite_percent, fiabilite_choix, prix, tranche):
    fiabilite = choices[fiabilite_choix] if use_predefined else fiabilite_percent
    log_data = {
        "Description": description,
        "Niveau": niveau,
        "Fiabilit√© (%)": fiabilite,
        "Prix pr√©dit (‚Ç¨)": prix,
        "Tranche pr√©dite": tranche
    }

    df_log = pd.DataFrame([log_data])
    if os.path.exists(LOG_PATH):
        df_log.to_csv(LOG_PATH, mode="a", index=False, header=False)
    else:
        df_log.to_csv(LOG_PATH, index=False)

    return "‚úÖ Signalement enregistr√© avec succ√®s."

---

## üñ•Ô∏è 6. Interface utilisateur Gradio

### üéØ 6.1. Objectif

Proposer une **interface interactive et intuitive** pour permettre √† l‚Äôutilisateur :
- de saisir les informations d‚Äôun service Fiverr,
- d‚Äôobtenir imm√©diatement une **estimation du prix** (`R√©gression`),
- et sa **tranche de prix** (`Classification`),
- puis de **signaler** le cas au fichier `log.csv` si besoin.

### üß∞ 6.2. Composants principaux

| √âl√©ment                    | Fonction                                                                 |
|----------------------------|--------------------------------------------------------------------------|
| `Textbox` (description)    | Entr√©e textuelle d√©crivant le service                                   |
| `Dropdown` (niveau)        | Choix du niveau du vendeur (actuellement masqu√©, future √©volution)      |
| `Checkbox` / `Radio`       | S√©lection du niveau de fiabilit√© (manuelle ou pr√©d√©finie)               |
| `Button`                   | Lance la pr√©diction (`üìà Estimer le prix`)                              |
| `Textbox` (sorties)        | Affichage des r√©sultats (`Prix estim√©`, `Tranche estim√©e`)              |
| `Button`                   | Enregistrement de la pr√©diction dans le fichier log (`üö®`)              |
| `Textbox` (confirmation)   | Message de confirmation en cas de signalement r√©ussi                    |

### üîÅ 6.3. Logique d‚Äôinteraction

- **Fiabilit√© personnalis√©e ou pr√©d√©finie** :  
  L‚Äôutilisateur peut choisir d‚Äôutiliser un curseur libre (pourcentage) ou un niveau de fiabilit√© pr√©d√©fini.

- **Synchronisation dynamique** :  
  Le radio bouton met √† jour la valeur du slider et inversement si on d√©coche la case.

- **Traitement centralis√©** :  
  Les fonctions `faire_une_prediction` et `enregistrer_log` pilotent la logique m√©tier.

---

### üêç 6.4. Script Gradio (cr√©ation de l‚Äôinterface)

In [22]:

# üñ•Ô∏è Interface utilisateur Gradio
with gr.Blocks() as iface:
    gr.Markdown("""
        ## üéØ Application de pr√©diction de prix Fiverr
        Cette application permet d‚Äôestimer automatiquement :
        - üí∞ Le **prix probable** d‚Äôun service publi√© sur Fiverr,
        - üìä Sa **tranche de prix** parmi trois cat√©gories (Basse / Moyenne / Haute).
        Elle s‚Äôappuie sur un pipeline hybride combinant des embeddings de description et des variables num√©riques.
    """)

    with gr.Row():
        with gr.Column(scale=1):
            description = gr.Textbox(
                label="‚úèÔ∏è Titre du service",
                placeholder="Ex : Je fais le m√©nage",
                value="Je fais le m√©nage"  # Valeur par d√©faut
            )
            niveau =  gr.Dropdown(label="üî∞ Niveau du vendeur", choices=["Beginner", "Intermediate", "Expert"], value="Beginner", visible=False)
            use_predefined = gr.Checkbox(label="üéõÔ∏è Utiliser les niveaux pr√©d√©finis de fiabilit√©", value=True)

            fiabilite_percent = gr.Slider(label="Fiabilit√© (%)", minimum=0, maximum=100, value=80, step=5, visible=False)
            fiabilite_choix = gr.Radio(
                label="üéöÔ∏è Choisissez un niveau de fiabilit√©",
                choices=list(choices.keys()),
                value="Acceptable",
                visible=True
            )

            def sync_slider_with_radio(choix):
                return gr.update(value=choices[choix])

            fiabilite_choix.change(sync_slider_with_radio, inputs=fiabilite_choix, outputs=fiabilite_percent)

            def toggle_inputs(use_predef):
                return {
                    fiabilite_percent: gr.update(visible=not use_predef),
                    fiabilite_choix: gr.update(visible=use_predef)
                }

            use_predefined.change(toggle_inputs, inputs=use_predefined, outputs=[fiabilite_percent, fiabilite_choix])

            bouton_predire = gr.Button("üìà Estimer le prix")

        with gr.Column(scale=1):
            sortie_prix = gr.Textbox(label="üí∞ Prix estim√©")
            sortie_tranche = gr.Textbox(label="üìä Tranche estim√©e")
            bouton_signaler = gr.Button("üö® Ajouter au fichier log.csv")
            confirmation = gr.Textbox(label="‚úÖ Confirmation", visible=False)

            bouton_predire.click(
                fn=faire_une_prediction,
                inputs=[description, niveau, use_predefined, fiabilite_percent, fiabilite_choix],
                outputs=[sortie_prix, sortie_tranche]
            )

            bouton_signaler.click(
                fn=enregistrer_log,
                inputs=[description, niveau, use_predefined, fiabilite_percent, fiabilite_choix, sortie_prix, sortie_tranche],
                outputs=confirmation
            )

# üöÄ Lancement
iface.launch()

Running on local URL:  http://127.0.0.1:7862

To create a public link, set `share=True` in `launch()`.




IMPORTANT: You are using gradio version 3.39.0, however version 4.44.1 is available, please upgrade.
--------


---

## üîç 7. Analyse de sensibilit√© √† la fiabilit√©

### üß™ 7.1. Objectif de cette cellule

V√©rifier que la **variable `Fiabilit√©` a bien un impact** significatif sur le prix pr√©dit.  
On fait varier la valeur de fiabilit√© de 0 % √† 100 %, tout en gardant constante la description du service.

### üìä 7.2. M√©thodologie

- Le service test√© est simplement : `"Je fais le m√©nage"`
- On fait √©voluer la fiabilit√© de 0.00 √† 1.00 (i.e. de 0 % √† 100 %)
- Pour chaque niveau de fiabilit√©, on **pr√©voit le prix** avec le mod√®le de r√©gression finalis√©
- On affiche ensuite les r√©sultats dans la console

### üîç 7.3. Ce que l'on cherche √† observer

- Une **augmentation globale du prix** avec la fiabilit√© croissante (logique m√©tier)
- Une **zone d'inflexion ou palier √©ventuel** aux alentours de 0.8 (80 %) ‚Äî crit√®re de haute fiabilit√©
- Des **r√©sultats coh√©rents** avec ceux observ√©s dans l‚Äôapplication Gradio

> üí° *Cette √©tape permet de valider qualitativement la sensibilit√© du mod√®le aux variations d‚Äôun indicateur cl√© m√©tier.*

---

### üêç 7.4. Script de test d‚Äôimpact de la fiabilit√©

In [23]:
# Exemple de description et niveau √† tester
desc = "Je fais le m√©nage"

# Test de l‚Äôimpact de la fiabilit√© sur la pr√©diction du prix
for f in [0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.81, 0.82, 0.83, 0.84, 0.85, 0.9, 0.91, 0.92, 0.93, 0.94, 0.95, 0.96, 0.97, 0.98, 0.99, 1.0]:
    prix = predict_price(desc, f)
    print(f"Fiabilit√© = {f*100:.0f}% ‚Üí Prix pr√©dit = {prix} ‚Ç¨")

Fiabilit√© = 0% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 10% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 20% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 30% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 40% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 50% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 60% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 70% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 80% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 81% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 82% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 83% ‚Üí Prix pr√©dit = 13.8 ‚Ç¨
Fiabilit√© = 84% ‚Üí Prix pr√©dit = 14.2 ‚Ç¨
Fiabilit√© = 85% ‚Üí Prix pr√©dit = 14.2 ‚Ç¨
Fiabilit√© = 90% ‚Üí Prix pr√©dit = 14.89 ‚Ç¨
Fiabilit√© = 91% ‚Üí Prix pr√©dit = 14.89 ‚Ç¨
Fiabilit√© = 92% ‚Üí Prix pr√©dit = 14.89 ‚Ç¨
Fiabilit√© = 93% ‚Üí Prix pr√©dit = 14.89 ‚Ç¨
Fiabilit√© = 94% ‚Üí Prix pr√©dit = 15.36 ‚Ç¨
Fiabilit√© = 95% ‚Üí Prix pr√©dit = 15.89 ‚Ç¨
Fiabilit√© = 96% ‚Üí Prix pr√©dit = 16.15 ‚Ç¨
Fiabilit√© = 97% ‚Üí Prix pr√©dit = 16.76 ‚Ç¨
Fia

---

## üìä 8. Analyse exploratoire : corr√©lation Fiabilit√© / Prix

### üß™ 8.1. Objectif de cette cellule

V√©rifier empiriquement si la **fiabilit√© du vendeur est corr√©l√©e au prix propos√©**.  
Cela permet de **valider la pertinence** de cette variable comme feature dans notre mod√®le.

### üßÆ 8.2. Statistiques de la variable `Fiabilite`

- Affichage de la distribution statistique (`min`, `max`, `mean`, `std`, etc.)
- V√©rification que la variable **varie suffisamment** pour avoir un potentiel explicatif

### üîó 8.3. Corr√©lation entre `Fiabilite` et `Prix`

- Calcul du **coefficient de corr√©lation de Pearson**
- Permet de d√©tecter une **relation lin√©aire potentielle** entre la variable explicative et la cible

> üí° Une corr√©lation significative (positive ou n√©gative) soutient l'id√©e que cette variable a un **r√¥le d√©terminant** dans le mod√®le de pr√©diction.

---

### üêç 8.4. Script d‚Äôanalyse exploratoire

In [24]:
df = pd.read_csv("data/fiverr_cleaned.csv")
print(df["Fiabilite"].describe())
print(df[["Fiabilite", "Prix"]].corr())

count    1252.000000
mean        0.739307
std         0.125703
min         0.081877
25%         0.698787
50%         0.789447
75%         0.826738
max         0.873558
Name: Fiabilite, dtype: float64
           Fiabilite      Prix
Fiabilite   1.000000 -0.018182
Prix       -0.018182  1.000000
