In [15]:
import os
import pandas as pd
from openai import OpenAI
from dotenv import load_dotenv

# üîê Chargement des variables d'environnement
load_dotenv()
api_key = os.getenv("OPENAI_API_KEY")
client = OpenAI(api_key=api_key)

# ‚úÖ Chemin robuste pour compatibilit√© Jupyter + Streamlit
try:
    BASE_DIR = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
except NameError:
    BASE_DIR = os.path.abspath(os.path.join(os.getcwd(), "../.."))

CSV_PATH = os.path.join(BASE_DIR, "data", "donnees_nettoyees.csv")

def charger_donnees():
    return pd.read_csv(CSV_PATH)

def extraire_contexte(question: str, df: pd.DataFrame) -> str:
    question_lower = question.lower()

    # üîç Filtrage par flux
    if "export" in question_lower:
        df = df[df["Flux"].str.contains("export", case=False)]
    elif "import" in question_lower:
        df = df[df["Flux"].str.contains("import", case=False)]

    # üîç Filtrage par ann√©e
    for annee in df["Ann√©e"].dropna().unique():
        if str(int(annee)) in question_lower:
            df = df[df["Ann√©e"] == int(annee)]

    # üßÆ R√©sum√© des montants par produit
    resume = (
        df.groupby("Produit")["Montant"]
        .sum()
        .sort_values(ascending=False)
        .head(10)
        .reset_index()
    )

    # üìú Formatage du contexte pour GPT
    texte = "Produit\tMontant total (FCFA)\n"
    texte += "\n".join([f"{row['Produit']}\t{row['Montant']:.0f}" for _, row in resume.iterrows()])
    return texte

def generer_reponse_llm(question: str, contexte: str) -> str:
    prompt = f"""
    Tu es un expert √©conomique du S√©n√©gal. R√©ponds √† la question suivante
    en te basant uniquement sur le CONTEXTE fourni :

    CONTEXTE :
    {contexte}

    QUESTION :
    {question}
    """

    try:
        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "system", "content": "Tu es un analyste √©conomique du S√©n√©gal."},
                {"role": "user", "content": prompt}
            ],
            temperature=0.3
        )
        return response.choices[0].message.content.strip()
    except Exception as e:
        return f"‚ùå Erreur lors de la g√©n√©ration : {e}"

def poser_question_llm(question: str) -> str:
    df = charger_donnees()
    contexte = extraire_contexte(question, df)
    return generer_reponse_llm(question, contexte)


In [16]:
import os
import pandas as pd
from openai import OpenAI
from dotenv import load_dotenv

# üîê Chargement des variables d'environnement
load_dotenv()
api_key = os.getenv("OPENAI_API_KEY")
client = OpenAI(api_key=api_key)

# ‚úÖ Chemin robuste compatible Jupyter + Streamlit
try:
    BASE_DIR = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
except NameError:
    BASE_DIR = os.path.abspath(os.path.join(os.getcwd(), "../.."))

CSV_PATH = os.path.join(BASE_DIR, "data", "donnees_nettoyees.csv")

def charger_donnees():
    return pd.read_csv(CSV_PATH)

def extraire_contexte(question: str, df: pd.DataFrame) -> str:
    question_lower = question.lower()
    df_filtre = df.copy()

    # üîç Filtrage flux
    if "export" in question_lower:
        df_filtre = df_filtre[df_filtre["Flux"].str.contains("export", case=False)]
    elif "import" in question_lower:
        df_filtre = df_filtre[df_filtre["Flux"].str.contains("import", case=False)]

    # üîç Filtrage ann√©es multiples
    annees = [int(mot) for mot in question_lower.split() if mot.isdigit() and 2000 <= int(mot) <= 2100]
    if annees:
        df_filtre = df_filtre[df_filtre["Ann√©e"].isin(annees)]

    # üßÆ R√©sum√©
    resume = (
        df_filtre.groupby("Produit")["Montant"]
        .sum()
        .sort_values(ascending=False)
        .head(10)
        .reset_index()
    )

    if resume.empty:
        return "Aucune donn√©e trouv√©e pour cette question."

    texte = "Produit\tMontant total (FCFA)\n"
    texte += "\n".join([f"{row['Produit']}\t{row['Montant']:.0f}" for _, row in resume.iterrows()])
    return texte

def generer_reponse_llm(question: str, contexte: str) -> str:
    prompt = f"""
    Tu es un assistant √©conomique du S√©n√©gal. R√©ponds √† la question ci-dessous en te basant uniquement sur le CONTEXTE fourni.

    CONTEXTE :
    {contexte}

    QUESTION :
    {question}
    """

    try:
        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "system", "content": "Tu es un expert en commerce international du S√©n√©gal."},
                {"role": "user", "content": prompt}
            ],
            temperature=0.3
        )
        return response.choices[0].message.content.strip()
    except Exception as e:
        return f"‚ùå Erreur lors de la g√©n√©ration : {e}"

def poser_question_llm(question: str) -> str:
    df = charger_donnees()
    contexte = extraire_contexte(question, df)
    return generer_reponse_llm(question, contexte)

# üîÅ Test local CLI
if __name__ == "__main__":
    print("üß™ Test du chatbot √©conomique du S√©n√©gal\n")
    while True:
        question = input("‚ùì Pose ta question (ou 'exit') : ")
        if question.lower() in ["exit", "quit", "q"]:
            break
        reponse = poser_question_llm(question)
        print("\nü§ñ R√©ponse :\n")
        print(reponse)
        print("\n" + "="*60 + "\n")


üß™ Test du chatbot √©conomique du S√©n√©gal



‚ùì Pose ta question (ou 'exit') :  quels sont les produits les plus importes en 2014,2015 et 2016



ü§ñ R√©ponse :

Les produits les plus import√©s au S√©n√©gal en 2014, 2015 et 2016 sont les suivants, class√©s par ordre d√©croissant de montant total en FCFA :

1. Combustibles min√©raux; huiles, cires min√©rales; mati√®res bitumineuses
2. R√©acteurs nucl√©aires; chaudi√®res, machines, appareils, engins m√©caniques
3. C√©r√©ales
4. Voitures automobiles et autres v√©hicules terrestres; parties, accessoires
5. Machines √©lectriques; appareils d'√©mission-r√©ception radio/TV

Ces produits repr√©sentent les importations les plus importantes pour ces ann√©es donn√©es.




‚ùì Pose ta question (ou 'exit') :  la moyenne des produits importes en 2014 



ü§ñ R√©ponse :

Pour calculer la moyenne des produits import√©s en 2014, il faut d'abord additionner tous les montants des diff√©rents produits import√©s, puis diviser cette somme par le nombre total de produits. 

En se basant sur les montants fournis dans le contexte, la somme totale des montants des produits import√©s en 2014 est de :

956199283809 + 317445186814 + 265001872578 + 194894071158 + 166901969303 + 98389681548 + 96735387984 + 90573616601 + 86053487063 + 75783022037 = 2103946015315 FCFA

Il y a un total de 10 produits import√©s en 2014.

En divisant la somme totale par le nombre de produits, on obtient la moyenne des produits import√©s en 2014 :

2103946015315 / 10 = 210394601531,5 FCFA

Donc, la moyenne des produits import√©s en 2014 est de 210 394 601 531,5 FCFA.




‚ùì Pose ta question (ou 'exit') :  exit
