In [1]:
import gradio as gr
import pandas as pd
import numpy as np
import os
import joblib
import requests
from predict import predict_price, predict_tranche  # ML local
from tensorflow.keras.models import load_model
from sentence_transformers import SentenceTransformer




In [2]:

# üìÇ Chemins
LOG_PATH = "flagged/log.csv"
API_URL = "http://127.0.0.1:8000/predict"
choices = {
    "Acceptable": 80,
    "Moyenne": 85,
    "Bonne": 90,
    "Tr√®s Bonne": 96,
    "Excellente": 99
}
niveau_mapping = ["Beginner", "Intermediate", "Expert"]  # pour DL local

# üß† Chargement lazy des mod√®les DL
embedding_model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
deep_model = None
scaler_dl = None

def load_deep_models():
    global deep_model, scaler_dl
    if deep_model is None:
        deep_model = load_model("models/deep/deep_model.h5")
        scaler_dl = joblib.load("models/deep/scaler.pkl")

def faire_une_prediction(description, niveau, use_predefined, fiabilite_percent, fiabilite_choix, modele):
    fiabilite = (choices[fiabilite_choix] if use_predefined else fiabilite_percent) / 100

    try:
        if modele == "ML - Local":
            prix = predict_price(description, fiabilite)
            tranche = predict_tranche(description, fiabilite)

        elif modele == "DL - Local":
            load_deep_models()
            emb = embedding_model.encode([description]).flatten()
            niveau_ohe = [1 if niveau == n else 0 for n in niveau_mapping]
            features = np.hstack([emb, niveau_ohe, [fiabilite]])
            features_scaled = scaler_dl.transform([features])
            prix = deep_model.predict(features_scaled)[0][0]
            tranche = "Non √©valu√©e"

        elif modele == "API - FastAPI":
            response = requests.post(API_URL, json={
                "Description": description,
                "Niveau": niveau,
                "Fiabilite": fiabilite
            }, timeout=5)
            response.raise_for_status()
            prix = response.json().get("prix_predit", -1)
            tranche = "Non √©valu√©e"

        else:
            return "‚ùå Mod√®le inconnu", ""

        return round(prix, 2), tranche

    except Exception as e:
        return f"Erreur : {str(e)}", ""

def enregistrer_log(description, use_predefined, fiabilite_percent, fiabilite_choix, prix, tranche, modele):
    fiabilite = choices[fiabilite_choix] if use_predefined else fiabilite_percent
    log_data = {
        "Description": description,
        "Fiabilit√© (%)": fiabilite,
        "Prix pr√©dit (‚Ç¨)": prix,
        "Tranche pr√©dite": tranche,
        "Mod√®le utilis√©": modele
    }

    df_log = pd.DataFrame([log_data])
    if os.path.exists(LOG_PATH):
        df_log.to_csv(LOG_PATH, mode="a", index=False, header=False)
    else:
        df_log.to_csv(LOG_PATH, index=False)

    return "‚úÖ Signalement enregistr√© avec succ√®s."

with gr.Blocks() as iface:
    gr.Markdown("""
        ## üéØ Application de pr√©diction de prix Fiverr
        Cette application permet d‚Äôestimer automatiquement :
        - üí∞ Le **prix probable** d‚Äôun service publi√© sur Fiverr,
        - üìä Sa **tranche de prix** parmi trois cat√©gories (Basse / Moyenne / Haute).
        Elle s‚Äôappuie sur un pipeline hybride combinant des embeddings de description et des variables num√©riques.
        üîÅ Vous pouvez maintenant choisir entre trois mod√®les : ML, Deep Learning, ou appel API REST FastAPI.
    """)

    with gr.Row():
        with gr.Column(scale=1):
            description = gr.Textbox(label="‚úèÔ∏è Titre du service", value="Je fais le m√©nage")
            niveau = gr.Dropdown(label="üî∞ Niveau du vendeur", choices=niveau_mapping, value="Beginner", visible=False)
            use_predefined = gr.Checkbox(label="üéõÔ∏è Utiliser les niveaux pr√©d√©finis de fiabilit√©", value=True)

            fiabilite_percent = gr.Slider(label="Fiabilit√© (%)", minimum=0, maximum=100, value=80, step=5, visible=False)
            fiabilite_choix = gr.Radio(label="üéöÔ∏è Choisissez un niveau de fiabilit√©", choices=list(choices.keys()), value="Acceptable", visible=True)

            modele = gr.Radio(label="üß† Choix du mod√®le", choices=["ML - Local", "DL - Local", "API - FastAPI"], value="ML - Local")

            def sync_slider_with_radio(choix):
                return gr.update(value=choices[choix])

            fiabilite_choix.change(sync_slider_with_radio, inputs=fiabilite_choix, outputs=fiabilite_percent)

            def toggle_inputs(use_predef):
                return {
                    fiabilite_percent: gr.update(visible=not use_predef),
                    fiabilite_choix: gr.update(visible=use_predef)
                }

            use_predefined.change(toggle_inputs, inputs=use_predefined, outputs=[fiabilite_percent, fiabilite_choix])
            bouton_predire = gr.Button("üìà Estimer le prix")

        with gr.Column(scale=1):
            sortie_prix = gr.Textbox(label="üí∞ Prix estim√©")
            sortie_tranche = gr.Textbox(label="üìä Tranche estim√©e")
            bouton_signaler = gr.Button("üö® Ajouter au fichier log.csv")
            confirmation = gr.Textbox(label="‚úÖ Confirmation", visible=False)

            bouton_predire.click(
                fn=faire_une_prediction,
                inputs=[description, niveau, use_predefined, fiabilite_percent, fiabilite_choix, modele],
                outputs=[sortie_prix, sortie_tranche]
            )

            bouton_signaler.click(
                fn=enregistrer_log,
                inputs=[description, use_predefined, fiabilite_percent, fiabilite_choix, sortie_prix, sortie_tranche, modele],
                outputs=confirmation
            )


# üöÄ Lancement
iface.launch()

Running on local URL:  http://127.0.0.1:7863

To create a public link, set `share=True` in `launch()`.




IMPORTANT: You are using gradio version 3.39.0, however version 4.44.1 is available, please upgrade.
--------


## üß† Justification des incoh√©rences apparentes dans les tranches pr√©dictives

### ‚ùì Probl√®me observ√©

Dans certains cas, il peut sembler incoh√©rent qu‚Äôune **tranche de prix estim√©e** soit plus √©lev√©e pour une **fiabilit√© "Acceptable"** que pour une fiabilit√© "Excellente". Par exemple :

- Pour une **fiabilit√© Acceptable (80%)**, la tranche pr√©dite est **Haute**
- Pour une **fiabilit√© Excellente (99%)**, la tranche pr√©dite est **Basse**

### üß© Explication technique

Cette situation peut √™tre expliqu√©e de fa√ßon coh√©rente par la conception du pipeline :

1. **Deux mod√®les ind√©pendants sont utilis√©s** :
   - Un mod√®le de **r√©gression** qui pr√©dit un **prix num√©rique**
   - Un mod√®le de **classification** qui pr√©dit une **tranche cat√©gorielle** (`Basse`, `Moyenne`, `Haute`)
   - Ces deux mod√®les sont **entra√Æn√©s s√©par√©ment**, sur des cibles diff√©rentes

2. **La classification ne d√©pend pas du prix pr√©dit** :
   - Le mod√®le de classification apprend √† pr√©dire une **cat√©gorie** (la tranche r√©elle observ√©e) en fonction d‚Äôun ensemble de variables, notamment :
     - L‚Äôembedding de la description
     - La fiabilit√© pond√©r√©e
   - Il ne conna√Æt **ni le prix r√©el, ni le prix pr√©dit par le mod√®le de r√©gression**

3. **La fiabilit√© pond√©r√©e n‚Äôa pas une influence lin√©aire** :
   - Une meilleure fiabilit√© (Excellente) ne garantit pas forc√©ment un prix plus √©lev√© ni une tranche plus haute
   - En pratique, **le mod√®le peut estimer qu‚Äôun service g√©n√©rique tr√®s fiable** (par exemple un intitul√© trop large ou basique) appartient aux tranches basses
   - Tandis qu‚Äôun **service plus cibl√© ou sp√©cialis√©** avec une fiabilit√© moyenne peut √™tre associ√© aux tranches hautes

### üìå Interpr√©tation m√©tier

Ce comportement n'est pas une erreur mais une **manifestation de la logique d'apprentissage supervis√©** :

> Le mod√®le de classification apprend des **r√®gles implicites** pr√©sentes dans les donn√©es d‚Äôentra√Ænement. Il peut consid√©rer certaines descriptions comme typiquement premium, ind√©pendamment du niveau de fiabilit√©, ce qui entra√Æne une tranche "Haute" m√™me avec une fiabilit√© modeste.

### ‚úÖ Conclusion

Il est important de retenir :

- Le syst√®me n‚Äôutilise **pas une simple r√®gle √† seuils** sur le prix pour classer les tranches
- Il s‚Äôagit d‚Äôun mod√®le **entra√Æn√© √† partir d‚Äôobservations r√©elles**
- Les incoh√©rences apparentes sont souvent dues √† des **corr√©lations non triviales** dans les donn√©es (nature du service, vocabulaire utilis√©, etc.)

Cette explication souligne la complexit√© du comportement des mod√®les d‚ÄôIA, et la n√©cessit√© de les √©valuer **sur l‚Äôensemble du pipeline**, pas uniquement sur un cas particulier.

In [3]:
# Exemple de description et niveau √† tester
desc = "Je fais le m√©nage"

# Test de l‚Äôimpact de la fiabilit√© sur la pr√©diction du prix
for f in [0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.85, 0.9, 0.91, 0.92, 0.93, 0.94, 0.95, 0.96, 0.97, 0.98, 0.99, 1.0]:
    prix = predict_price(desc, f)
    print(f"Fiabilit√© = {f*100:.0f}% ‚Üí Prix pr√©dit = {prix} ‚Ç¨")

Fiabilit√© = 0% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 10% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 20% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 30% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 40% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 50% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 60% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 70% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 80% ‚Üí Prix pr√©dit = 3.45 ‚Ç¨
Fiabilit√© = 85% ‚Üí Prix pr√©dit = 3.55 ‚Ç¨
Fiabilit√© = 90% ‚Üí Prix pr√©dit = 3.72 ‚Ç¨
Fiabilit√© = 91% ‚Üí Prix pr√©dit = 3.72 ‚Ç¨
Fiabilit√© = 92% ‚Üí Prix pr√©dit = 3.72 ‚Ç¨
Fiabilit√© = 93% ‚Üí Prix pr√©dit = 3.72 ‚Ç¨
Fiabilit√© = 94% ‚Üí Prix pr√©dit = 3.84 ‚Ç¨
Fiabilit√© = 95% ‚Üí Prix pr√©dit = 3.97 ‚Ç¨
Fiabilit√© = 96% ‚Üí Prix pr√©dit = 4.04 ‚Ç¨
Fiabilit√© = 97% ‚Üí Prix pr√©dit = 4.19 ‚Ç¨
Fiabilit√© = 98% ‚Üí Prix pr√©dit = 4.33 ‚Ç¨
Fiabilit√© = 99% ‚Üí Prix pr√©dit = 4.33 ‚Ç¨
Fiabilit√© = 100% ‚Üí Prix pr√©dit = 4.3 ‚Ç¨
