# LAB : Prompt Engineering pour les LLMs

### Installation des d√©pendances

In [None]:
# Commandes bash √† ex√©cuter dans un terminal:
# # Cr√©er un environnement virtuel (recommand√©)
# python -m venv llm_lab_env
# source llm_lab_env/bin/activate  # Linux/Mac
# # llm_lab_env\Scripts\activate  # Windows
#
# # Installer les packages n√©cessaires
# pip install openai huggingface_hub tiktoken deepeval python-dotenv requests

In [1]:
!pip install openai huggingface_hub tiktoken deepeval python-dotenv requests

### Configuration des cl√©s API

Cr√©ez un fichier `.env` √† la racine de votre projet :

**Configuration `.env`:**
```
# ============================================
# CONFIGURATION DES CL√âS API
# ============================================

# Cl√© API OpenAI (obligatoire pour certains exercices)
OPENAI_API_KEY=sk-votre-cle-api-openai

# Cl√© API Hugging Face (gratuit - cr√©er un compte sur huggingface.co)
HF_TOKEN=hf_votre-token-huggingface

# ============================================
# PARAM√àTRES PERSONNALISABLES
# ============================================

# Mod√®le OpenAI par d√©faut
DEFAULT_OPENAI_MODEL=gpt-4o-mini

# Mod√®le Hugging Face gratuit par d√©faut
DEFAULT_HF_MODEL=meta-llama/Meta-Llama-3-8B-Instruct
```

### Script d'initialisation

In [2]:
# config.py
import os
from dotenv import load_dotenv

load_dotenv()

class Config:
    OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
    HF_TOKEN = os.getenv("HF_TOKEN")
    DEFAULT_OPENAI_MODEL = os.getenv("DEFAULT_OPENAI_MODEL", "gpt-5-nano")
    DEFAULT_HF_MODEL = os.getenv("DEFAULT_HF_MODEL", "meta-llama/Meta-Llama-3-8B-Instruct")

config = Config()

---

## Partie 1 : Comprendre les Tokens et la Tokenisation


In [6]:
"""
Exercice 1 : Comprendre la tokenisation
Objectif : Visualiser comment le texte est d√©coup√© en tokens
"""

import tiktoken

def analyser_tokens(texte: str, modele: str = "gpt-5-nano"):
    """
    Analyse la tokenisation d'un texte pour un mod√®le donn√©.

    Args:
        texte: Le texte √† analyser
        modele: Le mod√®le pour lequel tokeniser (gpt-4, gpt-3.5-turbo, etc.)
    """
    # Obtenir l'encodeur pour le mod√®le
    encodeur = tiktoken.encoding_for_model(modele)

    # Tokeniser le texte
    tokens = encodeur.encode(texte)

    # Afficher les r√©sultats
    print(f"Texte original : '{texte}'")
    print(f"Nombre de tokens : {len(tokens)}")
    print(f"Ratio caract√®res/tokens : {len(texte)/len(tokens):.2f}")
    print(f"\n D√©tail des tokens :")

    for i, token_id in enumerate(tokens):
        token_texte = encodeur.decode([token_id])
        print(f"  Token {i+1}: ID={token_id:6d} ‚Üí '{token_texte}'")

    return tokens

In [7]:
# Exercice 1.1 : Comparez la tokenisation de ces textes
textes_test = [
    "Hello, world!",
    "Bonjour le monde !",
    "L'intelligence artificielle transforme notre quotidien.",
    "The quick brown fox jumps over the lazy dog.",
    "12345 + 67890 = 80235",
    "üöÄ Les √©mojis sont-ils bien tokenis√©s ? ü§ñ",
]

print("=" * 60)
print("ANALYSE DE TOKENISATION")
print("=" * 60)

for texte in textes_test:
    analyser_tokens(texte)
    print("-" * 60)

ANALYSE DE TOKENISATION
Texte original : 'Hello, world!'
Nombre de tokens : 4
Ratio caract√®res/tokens : 3.25

 D√©tail des tokens :
  Token 1: ID= 13225 ‚Üí 'Hello'
  Token 2: ID=    11 ‚Üí ','
  Token 3: ID=  2375 ‚Üí ' world'
  Token 4: ID=     0 ‚Üí '!'
------------------------------------------------------------
Texte original : 'Bonjour le monde !'
Nombre de tokens : 4
Ratio caract√®res/tokens : 4.50

 D√©tail des tokens :
  Token 1: ID= 45751 ‚Üí 'Bonjour'
  Token 2: ID=   505 ‚Üí ' le'
  Token 3: ID= 15807 ‚Üí ' monde'
  Token 4: ID=  1073 ‚Üí ' !'
------------------------------------------------------------
Texte original : 'L'intelligence artificielle transforme notre quotidien.'
Nombre de tokens : 9
Ratio caract√®res/tokens : 6.11

 D√©tail des tokens :
  Token 1: ID=    43 ‚Üí 'L'
  Token 2: ID= 37062 ‚Üí ''int'
  Token 3: ID= 33465 ‚Üí 'elligence'
  Token 4: ID=105453 ‚Üí ' artific'
  Token 5: ID= 22380 ‚Üí 'ielle'
  Token 6: ID=184109 ‚Üí ' transforme'
  Token 7: ID= 1209

In [10]:
# Exercice 1.2 : Calculez le co√ªt approximatif
# Prix GPT-4o-mini : ~$0.15 / 1M tokens input, ~$0.60 / 1M tokens output
def calculer_cout(nb_tokens_input: int, nb_tokens_output: int, modele: str = "gpt-5-nano"):
    """
    Calcule le co√ªt approximatif d'une requ√™te.

    TODO: Compl√©tez cette fonction en utilisant les tarifs actuels
    R√©f√©rence : https://platform.openai.com/docs/pricing
    """
    # üí° Personnalisez les tarifs selon votre mod√®le
    tarifs = {
        "gpt-4o-mini": {"input": 0.15/1000000, "output": 0.60/1000000},
        "gpt-5-nano": {"input": 0.05/1000000, "output": 0.4/1000000},
        "gpt-4o": {"input": 2.50/1000000, "output": 10.00/1000000},
        # Ajoutez d'autres mod√®les ici
    }

    if modele not in tarifs:
        print(f"‚ö†Ô∏è Mod√®le {modele} non trouv√©, utilisation de gpt-4o-mini")
        modele = "gpt-4o-mini"

    cout_input = nb_tokens_input * tarifs[modele]["input"]
    cout_output = nb_tokens_output * tarifs[modele]["output"]

    return {
        "input": cout_input,
        "output": cout_output,
        "total": cout_input + cout_output
    }

# Test du calcul de co√ªt
print("\nüí∞ Estimation des co√ªts pour 1000 requ√™tes avec 500 tokens input et 200 tokens output:")
cout = calculer_cout(500 * 1000, 200 * 1000)
print(f"  Co√ªt total estim√© : ${cout['total']:.4f}")


üí∞ Estimation des co√ªts pour 1000 requ√™tes avec 500 tokens input et 200 tokens output:
  Co√ªt total estim√© : $0.1050


---

## Partie 2 : Configuration des Param√®tres LLM

Les LLMs g√©n√®rent du texte en pr√©disant le token suivant bas√© sur une **distribution de probabilit√©s**. Chaque token possible a une probabilit√© associ√©e.

**Param√®tres cl√©s :**

| Param√®tre | Plage | Effet |
|-----------|-------|-------|
| **Temperature** | 0.0 - 2.0 | Contr√¥le la "cr√©ativit√©" (randomness) |
| **Top-p** | 0.0 - 1.0 | Nucleus sampling - cumul des probabilit√©s |
| **Top-k** | 1 - ‚àû | Limite le nombre de tokens candidats |

### Pratique : Exp√©rimenter avec les Param√®tres

In [11]:
"""
Exercice 2 : Exp√©rimenter avec les param√®tres des LLMs
Objectif : Comprendre l'impact de temperature, top-p et top-k
"""

from openai import OpenAI
import os
from dotenv import load_dotenv

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

def generer_avec_parametres(
    prompt: str,
    temperature: float = 1.0,
    top_p: float = 1.0,
    max_tokens: int = 100,
    n_generations: int = 3,
    model: str = "gpt-4o-mini"
):
    """
    G√©n√®re plusieurs r√©ponses avec les m√™mes param√®tres pour observer la variabilit√©.

    Args:
        prompt: Le prompt √† envoyer au mod√®le
        temperature: Contr√¥le la randomness (0=d√©terministe, 2=tr√®s cr√©atif)
        top_p: Nucleus sampling (0.1=tr√®s focalis√©, 1.0=tous les tokens)
        max_tokens: Nombre maximum de tokens √† g√©n√©rer
        n_generations: Nombre de g√©n√©rations √† effectuer
        model: Mod√®le √† utiliser
    """
    print(f"\n{'='*60}")
    print(f"Param√®tres : temperature={temperature}, top_p={top_p}")
    print(f"Prompt : {prompt[:50]}...")
    print("="*60)

    reponses = []
    for i in range(n_generations):
        response = client.chat.completions.create(
            model=model,
            messages=[{"role": "user", "content": prompt}],
            temperature=temperature,
            top_p=top_p,
            max_tokens=max_tokens
        )
        reponse = response.choices[0].message.content
        reponses.append(reponse)
        print(f"\nG√©n√©ration {i+1}:\n{reponse}")

    # Analyse de la variabilit√©
    mots_uniques = set()
    for r in reponses:
        mots_uniques.update(r.lower().split())

    print(f"\nAnalyse : {len(mots_uniques)} mots uniques sur {n_generations} g√©n√©rations")

    return reponses

In [12]:
# Exercice 2.1 : Comparez les effets de diff√©rentes temp√©ratures
prompt_creatif = "√âcrivez le d√©but d'une histoire fantastique en une phrase."

print("\n" + "*" * 20)
print("EXP√âRIENCE 1 : EFFET DE LA TEMP√âRATURE")
print("*" * 20)

# TODO: Testez avec temperature = 0.0, 0.5, 1.0, 1.5
configurations_temp = [
    {"temperature": 0.0, "top_p": 1.0},  # D√©terministe
    {"temperature": 0.5, "top_p": 1.0},  # L√©g√®rement cr√©atif
    {"temperature": 1.0, "top_p": 1.0},  # √âquilibr√©
    {"temperature": 1.5, "top_p": 1.0},  # Tr√®s cr√©atif
]

for config in configurations_temp:
    generer_avec_parametres(
        prompt_creatif,
        temperature=config["temperature"],
        top_p=config["top_p"],
        n_generations=3
    )


********************
EXP√âRIENCE 1 : EFFET DE LA TEMP√âRATURE
********************

Param√®tres : temperature=0.0, top_p=1.0
Prompt : √âcrivez le d√©but d'une histoire fantastique en une...

G√©n√©ration 1:
Dans un royaume oubli√© o√π les √©toiles murmuraient des secrets anciens, une jeune fille d√©couvrit une cl√© en argent scintillante enfouie sous les racines d'un arbre mill√©naire, promettant d'ouvrir la porte vers des mondes insoup√ßonn√©s.

G√©n√©ration 2:
Dans un royaume oubli√© o√π les √©toiles murmuraient des secrets anciens, une jeune fille d√©couvrit une cl√© en argent scintillante enfouie sous les racines d'un arbre mill√©naire, promettant d'ouvrir la porte vers des mondes insoup√ßonn√©s.

G√©n√©ration 3:
Dans un royaume oubli√© o√π les √©toiles murmuraient des secrets anciens, une jeune fille d√©couvrit une cl√© en argent scintillante enfouie sous les racines d'un arbre mill√©naire, promettant d'ouvrir la porte vers des mondes insoup√ßonn√©s.

Analyse : 32 mots uniques su

In [13]:
# Exercice 2.2 : Comparez les effets de diff√©rents top_p
print("\n" + "*" * 20)
print("EXP√âRIENCE 2 : EFFET DU TOP-P")
print("*" * 20)

# TODO: Testez avec top_p = 0.1, 0.5, 0.9, 1.0
configurations_top_p = [
    {"temperature": 1.0, "top_p": 0.1},  # Tr√®s focalis√©
    {"temperature": 1.0, "top_p": 0.5},  # Moyennement focalis√©
    {"temperature": 1.0, "top_p": 0.9},  # Diversifi√©
    {"temperature": 1.0, "top_p": 1.0},  # Maximum de diversit√©
]

for config in configurations_top_p:
    generer_avec_parametres(
        prompt_creatif,
        temperature=config["temperature"],
        top_p=config["top_p"],
        n_generations=3
    )


********************
EXP√âRIENCE 2 : EFFET DU TOP-P
********************

Param√®tres : temperature=1.0, top_p=0.1
Prompt : √âcrivez le d√©but d'une histoire fantastique en une...

G√©n√©ration 1:
Dans un royaume oubli√© o√π les √©toiles murmuraient des secrets anciens, une jeune fille d√©couvrit une cl√© en argent scintillante enfouie sous les racines d'un arbre mill√©naire, promettant d'ouvrir la porte vers des mondes insoup√ßonn√©s.

G√©n√©ration 2:
Dans un royaume oubli√© o√π les √©toiles murmuraient des secrets anciens, une jeune fille d√©couvrit une cl√© en argent scintillante enfouie sous les racines d'un arbre mill√©naire, promettant d'ouvrir la porte vers des mondes insoup√ßonn√©s.

G√©n√©ration 3:
Dans un royaume oubli√© o√π les √©toiles murmuraient des secrets anciens, une jeune fille d√©couvrit une cl√© en argent scintillante enfouie sous les racines d'un arbre mill√©naire, promettant d'ouvrir la porte vers des mondes insoup√ßonn√©s.

Analyse : 32 mots uniques sur 3 g√©n√©

In [14]:
# Exercice 2.3 : Cas d'usage pratiques
print("\n" + "*" * 20)
print("EXP√âRIENCE 3 : CAS D'USAGE PRATIQUES")
print("*" * 20)

cas_usage = {
    "extraction_donnees": {
        "prompt": "Extrayez les informations suivantes du texte : nom, date, montant.\nTexte: 'Le contrat sign√© par Jean Dupont le 15 mars 2024 porte sur un montant de 50000 euros.'",
        "temperature": 0.0,  # D√©terministe pour l'extraction
        "top_p": 1.0
    },
    "redaction_creative": {
        "prompt": "Proposez un slogan publicitaire original pour une marque de caf√© √©co-responsable.",
        "temperature": 1.2,  # Cr√©atif pour la pub
        "top_p": 0.9
    },
    "code_generation": {
        "prompt": "√âcrivez une fonction Python qui calcule la suite de Fibonacci.",
        "temperature": 0.2,  # Pr√©cis pour le code
        "top_p": 0.95
    },
    "conversation": {
        "prompt": "Que pensez-vous de l'intelligence artificielle ?",
        "temperature": 0.7,  # √âquilibr√© pour la conversation
        "top_p": 0.9
    }
}

# üí° Personnalisez les param√®tres selon vos observations
for nom, config in cas_usage.items():
    print(f"\nCas d'usage : {nom}")
    generer_avec_parametres(
        config["prompt"],
        temperature=config["temperature"],
        top_p=config["top_p"],
        n_generations=2
    )


********************
EXP√âRIENCE 3 : CAS D'USAGE PRATIQUES
********************

Cas d'usage : extraction_donnees

Param√®tres : temperature=0.0, top_p=1.0
Prompt : Extrayez les informations suivantes du texte : nom...

G√©n√©ration 1:
Nom : Jean Dupont  
Date : 15 mars 2024  
Montant : 50000 euros

G√©n√©ration 2:
Nom : Jean Dupont  
Date : 15 mars 2024  
Montant : 50000 euros

Analyse : 11 mots uniques sur 2 g√©n√©rations

Cas d'usage : redaction_creative

Param√®tres : temperature=1.2, top_p=0.9
Prompt : Proposez un slogan publicitaire original pour une ...

G√©n√©ration 1:
"R√©veillez vos sens, pr√©servez la plan√®te : Savourez l'√©thique, go√ªtez l'engagement."

G√©n√©ration 2:
"R√©veillez vos sens, pr√©servez la plan√®te : chaque tasse compte !"

Analyse : 15 mots uniques sur 2 g√©n√©rations

Cas d'usage : code_generation

Param√®tres : temperature=0.2, top_p=0.95
Prompt : √âcrivez une fonction Python qui calcule la suite d...

G√©n√©ration 1:
Voici une fonction Python qui calcu

---

## Partie 3 : Les Composantes d'un Prompt Efficace

### Structure d'un Prompt

Un prompt efficace contient g√©n√©ralement √† minima :

```
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ  1. CONTEXTE / R√îLE                     ‚îÇ
‚îÇ     "Tu es un expert en..."             ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ  2. INSTRUCTION                         ‚îÇ
‚îÇ     "Analyse le texte suivant..."       ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ  3. DONN√âES D'ENTR√âE                    ‚îÇ
‚îÇ     [Le contenu √† traiter]              ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ  4. FORMAT DE SORTIE                    ‚îÇ
‚îÇ     "R√©ponds en JSON avec..."           ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
```

### Exercice Pratique : Construire des Prompts Structur√©s

In [18]:
"""
Exercice 3 : Construction de prompts structur√©s
Objectif : Ma√Ætriser les composantes d'un prompt efficace
"""

from openai import OpenAI
import json
import os
from dotenv import load_dotenv

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

class PromptBuilder:
    """
    Classe pour construire des prompts structur√©s de mani√®re modulaire.
    """

    def __init__(self):
        self.contexte = ""
        self.instruction = ""
        self.donnees = ""
        self.format_sortie = ""
        self.exemples = []

    def definir_contexte(self, role: str, expertise: str = "", contraintes: str = ""):
        """D√©finit le contexte et le r√¥le de l'assistant."""
        self.contexte = f"Tu es {role}."
        if expertise:
            self.contexte += f" Tu poss√®des une expertise en {expertise}."
        if contraintes:
            self.contexte += f" {contraintes}"
        return self

    def definir_instruction(self, action: str, details: str = ""):
        """D√©finit l'instruction principale."""
        self.instruction = action
        if details:
            self.instruction += f" {details}"
        return self

    def ajouter_donnees(self, donnees: str, label: str = "Donn√©es"):
        """Ajoute les donn√©es d'entr√©e."""
        self.donnees = f"\n\n### {label}\n{donnees}"
        return self

    def definir_format(self, format_type: str, structure: dict = None):
        """D√©finit le format de sortie attendu."""
        self.format_sortie = f"\n\n### Format de r√©ponse\nR√©ponds au format {format_type}."
        if structure:
            self.format_sortie += f"\nStructure attendue:\n```json\n{json.dumps(structure, indent=2, ensure_ascii=False)}\n```"
        return self

    def ajouter_exemple(self, entree: str, sortie: str):
        """Ajoute un exemple (few-shot)."""
        self.exemples.append({"entree": entree, "sortie": sortie})
        return self

    def construire(self) -> str:
        """Construit le prompt final."""
        prompt = self.contexte
        prompt += f"\n\n### Instruction\n{self.instruction}"

        if self.exemples:
            prompt += "\n\n### Exemples"
            for i, ex in enumerate(self.exemples, 1):
                prompt += f"\n\n**Exemple {i}:**\nEntr√©e: {ex['entree']}\nSortie: {ex['sortie']}"

        prompt += self.donnees
        prompt += self.format_sortie

        return prompt

def executer_prompt(prompt: str, model: str = "gpt-4.1-mini", temperature: float = 0.7):
    """Ex√©cute un prompt et retourne la r√©ponse."""
    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
        temperature=temperature
    )
    return response.choices[0].message.content

In [19]:
# Exercice 3.1 : Construire un prompt pour l'analyse de sentiment
print("\nEXERCICE 3.1 : Analyse de Sentiment")
print("="*60)

# üí° Personnalisez ce texte avec vos propres donn√©es
texte_analyse = """
Le nouveau restaurant du quartier est une vraie d√©ception.
L'attente √©tait interminable malgr√© une r√©servation,
et les plats, bien que joliment pr√©sent√©s, manquaient cruellement de saveur.
Cependant, le service √©tait impeccable et le cadre vraiment agr√©able.
"""

prompt_sentiment = (
    PromptBuilder()
    .definir_contexte(
        role="un analyste de sentiment expert",
        expertise="l'analyse des avis clients",
        contraintes="Tu dois √™tre pr√©cis et nuanc√© dans ton analyse."
    )
    .definir_instruction(
        action="Analyse le sentiment du texte suivant.",
        details="Identifie les aspects positifs et n√©gatifs mentionn√©s."
    )
    .ajouter_donnees(texte_analyse, label="Avis client")
    .definir_format(
        format_type="JSON",
        structure={
            "sentiment_global": "positif|n√©gatif|mixte",
            "score": "0-10",
            "aspects_positifs": ["liste des points positifs"],
            "aspects_negatifs": ["liste des points n√©gatifs"],
            "resume": "r√©sum√© en une phrase"
        }
    )
    .construire()
)

print("Prompt construit:")
print("-"*40)
print(prompt_sentiment)
print("-"*40)

reponse = executer_prompt(prompt_sentiment, temperature=0.3)
print("\nR√©ponse du mod√®le:")
print(reponse)


EXERCICE 3.1 : Analyse de Sentiment
Prompt construit:
----------------------------------------
Tu es un analyste de sentiment expert. Tu poss√®des une expertise en l'analyse des avis clients. Tu dois √™tre pr√©cis et nuanc√© dans ton analyse.

### Instruction
Analyse le sentiment du texte suivant. Identifie les aspects positifs et n√©gatifs mentionn√©s.

### Avis client

Le nouveau restaurant du quartier est une vraie d√©ception. 
L'attente √©tait interminable malgr√© une r√©servation, 
et les plats, bien que joliment pr√©sent√©s, manquaient cruellement de saveur.
Cependant, le service √©tait impeccable et le cadre vraiment agr√©able.


### Format de r√©ponse
R√©ponds au format JSON.
Structure attendue:
```json
{
  "sentiment_global": "positif|n√©gatif|mixte",
  "score": "0-10",
  "aspects_positifs": [
    "liste des points positifs"
  ],
  "aspects_negatifs": [
    "liste des points n√©gatifs"
  ],
  "resume": "r√©sum√© en une phrase"
}
```
----------------------------------------

R

In [20]:
# Exercice 3.2 : Extraction d'entit√©s nomm√©es
print("\n\nEXERCICE 3.2 : Extraction d'Entit√©s Nomm√©es")
print("="*60)

# üí° Personnalisez ce texte
texte_entites = """
Apple Inc., dirig√©e par Tim Cook, a annonc√© lors de la conf√©rence WWDC 2024
√† San Jos√© le lancement de nouveaux produits. L'action AAPL a gagn√© 5%
suite √† cette annonce, atteignant 195 dollars. Le d√©partement R&D,
bas√© √† Cupertino en Californie, a investi 2,5 milliards de dollars
dans le d√©veloppement de l'IA cette ann√©e.
"""

# TODO: Compl√©tez la construction du prompt
prompt_entites = (
    PromptBuilder()
    .definir_contexte(
        role="un sp√©cialiste en extraction d'information",
        # Ajoutez expertise et contraintes
    )
    .definir_instruction(
        action="Extrais toutes les entit√©s nomm√©es du texte.",
        # Ajoutez des d√©tails
    )
    .ajouter_donnees(texte_entites, label="Texte √† analyser")
    .definir_format(
        format_type="JSON",
        structure={
            "personnes": [],
            "organisations": [],
            "lieux": [],
            "dates": [],
            "montants": [],
            "pourcentages": []
        }
    )
    .construire()
)

reponse_entites = executer_prompt(prompt_entites, temperature=0.1)
print("Entit√©s extraites:")
print(reponse_entites)



EXERCICE 3.2 : Extraction d'Entit√©s Nomm√©es
Entit√©s extraites:
```json
{
  "personnes": ["Tim Cook"],
  "organisations": ["Apple Inc.", "AAPL", "R&D"],
  "lieux": ["San Jos√©", "Cupertino", "Californie"],
  "dates": ["WWDC 2024", "cette ann√©e"],
  "montants": ["195 dollars", "2,5 milliards de dollars"],
  "pourcentages": ["5%"]
}
```


## Partie 4 : Few-Shot Learning

### Zero-Shot, One-Shot et Few-Shot

| Approche | Description | Utilisation |
|----------|-------------|-------------|
| **Zero-Shot** | Aucun exemple fourni | T√¢ches simples et communes |
| **One-Shot** | Un seul exemple | T√¢ches avec format sp√©cifique |
| **Few-Shot** | Plusieurs exemples (2-5) | T√¢ches complexes ou inhabituelles |

### Pratique : Comparaison des Approches

In [21]:
"""
Exercice 4 : Few-Shot Learning
Objectif : Comprendre l'impact des exemples sur la qualit√© des r√©ponses
"""

from openai import OpenAI
import os
from dotenv import load_dotenv

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

def few_shot_classification(texte: str, exemples: list = None, model: str = "gpt-4o-mini"):
    """
    Effectue une classification de sentiment avec diff√©rents niveaux de few-shot.

    Args:
        texte: Le texte √† classifier
        exemples: Liste de tuples (texte, label) pour le few-shot
        model: Mod√®le √† utiliser
    """
    # Construction du prompt
    system_prompt = """Tu es un classificateur de sentiment.
    Classe chaque texte comme : POSITIF, N√âGATIF ou NEUTRE.
    R√©ponds UNIQUEMENT avec l'un de ces trois mots."""

    user_prompt = ""

    # Ajout des exemples few-shot
    if exemples:
        user_prompt += "Voici des exemples de classification :\n\n"
        for ex_texte, ex_label in exemples:
            user_prompt += f"Texte: \"{ex_texte}\"\nClassification: {ex_label}\n\n"
        user_prompt += "---\n\n"

    user_prompt += f"Texte √† classifier: \"{texte}\"\nClassification:"

    response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt}
        ],
        temperature=0.0,
        max_tokens=10
    )

    return response.choices[0].message.content.strip()

In [23]:
# Textes de test
textes_test = [
    "Ce produit a compl√®tement chang√© ma vie quotidienne, je suis ravi !",
    "Le colis est arriv√© √† la date pr√©vue.",
    "Franchement d√©cevant, je m'attendais √† beaucoup mieux pour ce prix.",
    "Le design est correct mais la qualit√© laisse √† d√©sirer.",
    "Je ne sais pas trop quoi penser de cet achat.",
]

# Exemples pour le few-shot
# Personnalisez ces exemples selon votre domaine
exemples_few_shot = [
    ("Excellent produit, livraison rapide, je recommande vivement !", "POSITIF"),
    ("Produit d√©fectueux, remboursement difficile, une catastrophe.", "N√âGATIF"),
    ("Le produit correspond √† la description.", "NEUTRE"),
    ("J'adore cette marque, c'est toujours de la qualit√© !", "POSITIF"),
    ("D√©√ßu par la qualit√©, ne correspond pas aux photos.", "N√âGATIF"),
]

In [24]:
# Exercice 4.1 : Comparaison Zero-Shot vs Few-Shot
print("="*70)
print("COMPARAISON : ZERO-SHOT vs ONE-SHOT vs FEW-SHOT")
print("="*70)

resultats = {
    "zero_shot": [],
    "one_shot": [],
    "three_shot": [],
    "five_shot": []
}

for texte in textes_test:
    print(f"\nTexte: \"{texte[:50]}...\"")

    # Zero-Shot
    res_zero = few_shot_classification(texte, exemples=None)
    resultats["zero_shot"].append(res_zero)
    print(f"  Zero-Shot  : {res_zero}")

    # One-Shot
    res_one = few_shot_classification(texte, exemples=exemples_few_shot[:1])
    resultats["one_shot"].append(res_one)
    print(f"  One-Shot   : {res_one}")

    # Three-Shot
    res_three = few_shot_classification(texte, exemples=exemples_few_shot[:3])
    resultats["three_shot"].append(res_three)
    print(f"  Three-Shot : {res_three}")

    # Five-Shot
    res_five = few_shot_classification(texte, exemples=exemples_few_shot)
    resultats["five_shot"].append(res_five)
    print(f"  Five-Shot  : {res_five}")

COMPARAISON : ZERO-SHOT vs ONE-SHOT vs FEW-SHOT

Texte: "Ce produit a compl√®tement chang√© ma vie quotidienn..."
  Zero-Shot  : POSITIF
  One-Shot   : POSITIF
  Three-Shot : POSITIF
  Five-Shot  : POSITIF

Texte: "Le colis est arriv√© √† la date pr√©vue...."
  Zero-Shot  : POSITIF
  One-Shot   : NEUTRE
  Three-Shot : NEUTRE
  Five-Shot  : NEUTRE

Texte: "Franchement d√©cevant, je m'attendais √† beaucoup mi..."
  Zero-Shot  : N√âGATIF
  One-Shot   : N√âGATIF
  Three-Shot : N√âGATIF
  Five-Shot  : N√âGATIF

Texte: "Le design est correct mais la qualit√© laisse √† d√©s..."
  Zero-Shot  : N√âGATIF
  One-Shot   : N√âGATIF
  Three-Shot : N√âGATIF
  Five-Shot  : N√âGATIF

Texte: "Je ne sais pas trop quoi penser de cet achat...."
  Zero-Shot  : NEUTRE
  One-Shot   : NEUTRE
  Three-Shot : NEUTRE
  Five-Shot  : NEUTRE


In [25]:


# Exercice 4.2 : Few-Shot pour la g√©n√©ration de format sp√©cifique
print("\n\n" + "="*70)
print("FEW-SHOT POUR G√âN√âRATION DE FORMAT SP√âCIFIQUE")
print("="*70)

def generer_fiche_produit(nom_produit: str, description: str, exemples: list = None):
    """
    G√©n√®re une fiche produit structur√©e en utilisant le few-shot learning.
    """
    system_prompt = "Tu es un r√©dacteur marketing expert."

    user_prompt = "G√©n√®re une fiche produit structur√©e.\n\n"

    if exemples:
        user_prompt += "Exemples de fiches produits :\n\n"
        for ex in exemples:
            user_prompt += f"---\n{ex}\n---\n\n"

    user_prompt += f"""
Produit: {nom_produit}
Description brute: {description}

G√©n√®re la fiche produit:"""

    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt}
        ],
        temperature=0.7
    )

    return response.choices[0].message.content

# Exemples de fiches produits pour le few-shot
# üí° Personnalisez selon votre secteur d'activit√©
exemples_fiches = [
    """
**Nom:** Casque Audio ProSound X1
**Tagline:** L'excellence sonore √† port√©e d'oreilles
**Points cl√©s:**
‚Ä¢ R√©duction de bruit active -40dB
‚Ä¢ Autonomie 30 heures
‚Ä¢ Bluetooth 5.3
**Prix:** 149,99‚Ç¨
**Note:** ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê (4.8/5)
""",
    """
**Nom:** Montre Connect√©e FitPulse
**Tagline:** Votre sant√© au poignet
**Points cl√©s:**
‚Ä¢ Suivi cardiaque 24/7
‚Ä¢ GPS int√©gr√©
‚Ä¢ √âtanche 50m
**Prix:** 199,99‚Ç¨
**Note:** ‚≠ê‚≠ê‚≠ê‚≠ê (4.5/5)
"""
]

# Test avec et sans exemples
produit_test = {
    "nom": "Lampe de Bureau SmartLight",
    "description": "lampe LED avec contr√¥le tactile, 5 niveaux de luminosit√©, port USB, temp√©rature de couleur ajustable 2700K-6500K, consommation 12W"
}

print("\nSans exemples (Zero-Shot):")
print(generer_fiche_produit(produit_test["nom"], produit_test["description"]))

print("\nAvec exemples (Few-Shot):")
print(generer_fiche_produit(produit_test["nom"], produit_test["description"], exemples_fiches))



FEW-SHOT POUR G√âN√âRATION DE FORMAT SP√âCIFIQUE

Sans exemples (Zero-Shot):
### Fiche Produit : Lampe de Bureau SmartLight

---

**Nom du produit :** Lampe de Bureau SmartLight

**Cat√©gorie :** √âclairage / Accessoires de Bureau

**Description :**
La Lampe de Bureau SmartLight allie modernit√© et fonctionnalit√© pour illuminer votre espace de travail. Gr√¢ce √† sa technologie LED avanc√©e, elle offre une exp√©rience d‚Äô√©clairage personnalis√©e, parfaite pour r√©pondre √† tous vos besoins.

---

#### Caract√©ristiques Principales :

- **Type d'√©clairage :** LED
- **Contr√¥le tactile :** Oui, pour un ajustement facile
- **Niveaux de luminosit√© :** 5 niveaux (de doux √† intense)
- **Temp√©rature de couleur :** Ajustable de 2700K (lumi√®re chaude) √† 6500K (lumi√®re froide)
- **Consommation d'√©nergie :** 12W
- **Port USB :** Oui, pour charger vos appareils √©lectroniques

---

#### Avantages :

- **Personnalisation de l'√©clairage :** Adaptez la lumi√®re selon vos activit√©s (lect

---

## Partie 5 : Chain of Thought (CoT)

### Raisonnement √âtape par √âtape

Le **Chain of Thought** encourage le mod√®le √† expliciter son raisonnement avant de donner une r√©ponse finale. Cette technique am√©liore significativement les performances sur les t√¢ches de raisonnement complexe.

**Variantes :**
- **Zero-Shot CoT** : Ajouter "R√©fl√©chissons √©tape par √©tape" au prompt
- **Few-Shot CoT** : Fournir des exemples avec raisonnement d√©taill√©
- **Self-Consistency** : G√©n√©rer plusieurs raisonnements et voter

### Pratique : Impl√©mentation du CoT

In [26]:
"""
Exercice 5 : Chain of Thought Prompting
Objectif : Am√©liorer les capacit√©s de raisonnement du LLM
"""

from openai import OpenAI
import os
from dotenv import load_dotenv

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

def resoudre_probleme(probleme: str, methode: str = "direct", model: str = "gpt-4o-mini"):
    """
    R√©sout un probl√®me avec diff√©rentes m√©thodes de prompting.

    Args:
        probleme: Le probl√®me √† r√©soudre
        methode: "direct", "zero_shot_cot", "few_shot_cot"
        model: Mod√®le √† utiliser
    """

    if methode == "direct":
        # R√©ponse directe sans raisonnement
        prompt = f"{probleme}\n\nR√©ponds directement avec la r√©ponse."

    elif methode == "zero_shot_cot":
        # Zero-shot Chain of Thought
        prompt = f"""{probleme}

        R√©fl√©chissons √©tape par √©tape.
        1. Identifie les informations cl√©s
        2. √âtablis les relations entre elles
        3. Effectue les calculs n√©cessaires
        4. V√©rifie ta r√©ponse

        Raisonnement:"""

    elif methode == "few_shot_cot":
        # Few-shot Chain of Thought avec exemples
        prompt = f"""Voici comment r√©soudre des probl√®mes de logique √©tape par √©tape :

        **Exemple 1:**
        Probl√®me: Marie a 3 pommes. Elle en donne la moiti√© √† Paul, puis ach√®te 4 pommes. Combien a-t-elle de pommes ?

        Raisonnement:
        1. Marie commence avec 3 pommes
        2. Elle donne la moiti√© √† Paul : 3 √∑ 2 = 1.5, mais on ne peut pas couper une pomme, donc elle donne 1 pomme (ou 2 si on arrondit au sup√©rieur). Supposons qu'elle donne 1 pomme.
        3. Apr√®s avoir donn√© : 3 - 1 = 2 pommes
        4. Elle ach√®te 4 pommes : 2 + 4 = 6 pommes

        R√©ponse: Marie a 6 pommes.

        **Exemple 2:**
        Probl√®me: Un train part de Paris √† 8h et arrive √† Lyon √† 10h. Un autre train part de Lyon √† 9h et arrive √† Paris √† 11h. √Ä quelle heure les trains se croisent-ils ?

        Raisonnement:
        1. Train 1 : Paris‚ÜíLyon, d√©part 8h, arriv√©e 10h, dur√©e = 2h
        2. Train 2 : Lyon‚ÜíParis, d√©part 9h, arriv√©e 11h, dur√©e = 2h
        3. Distance = D. Vitesse train 1 = D/2. Vitesse train 2 = D/2.
        4. √Ä 9h, train 1 a parcouru 1h, donc D/2 de distance.
        5. Train 1 est √† mi-chemin, train 2 part.
        6. Ils se rapprochent √† vitesse D/2 + D/2 = D par heure.
        7. Distance restante = D/2. Temps = (D/2) / D = 0.5h = 30 min.
        8. Croisement : 9h + 30min = 9h30

        R√©ponse: Les trains se croisent √† 9h30.

        ---

        **Nouveau probl√®me:**
        {probleme}

        Raisonnement:"""

    response = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3,
        max_tokens=1000
    )

    return response.choices[0].message.content

In [27]:
# Probl√®mes de test
# Ajoutez vos propres probl√®mes
problemes = [
    """
    Dans une entreprise de 120 employ√©s, 40% travaillent au d√©partement marketing,
    25% au d√©partement technique, et le reste au d√©partement administratif.
    Le d√©partement marketing a re√ßu une prime de 500‚Ç¨ par employ√©.
    Le d√©partement technique a re√ßu une prime de 750‚Ç¨ par employ√©.
    Le d√©partement administratif a re√ßu une prime de 400‚Ç¨ par employ√©.
    Quel est le montant total des primes distribu√©es ?
    """,
    #"""
    #Alice, Bob et Charlie participent √† une course. Alice termine avant Bob.
    #Charlie ne termine pas dernier. Bob termine apr√®s Charlie.
    #Dans quel ordre ont-ils termin√© la course ?
    #""",
    #"""
    #Un fermier a des poules et des lapins dans sa ferme.
    #Il compte 20 t√™tes et 56 pattes au total.
    #Combien a-t-il de poules et combien a-t-il de lapins ?
    #"""
]

print("="*70)
print("COMPARAISON DES M√âTHODES DE RAISONNEMENT")
print("="*70)

for i, probleme in enumerate(problemes, 1):
    print(f"\n{'='*70}")
    print(f"PROBL√àME {i}")
    print(f"{'='*70}")
    print(probleme.strip())

    print("\n" + "-"*35)
    print("M√©thode DIRECTE:")
    print("-"*35)
    print(resoudre_probleme(probleme, methode="direct"))

    print("\n" + "-"*35)
    print("M√©thode ZERO-SHOT CoT:")
    print("-"*35)
    print(resoudre_probleme(probleme, methode="zero_shot_cot"))

    print("\n" + "-"*35)
    print("M√©thode FEW-SHOT CoT:")
    print("-"*35)
    print(resoudre_probleme(probleme, methode="few_shot_cot"))

COMPARAISON DES M√âTHODES DE RAISONNEMENT

PROBL√àME 1
Dans une entreprise de 120 employ√©s, 40% travaillent au d√©partement marketing, 
    25% au d√©partement technique, et le reste au d√©partement administratif.
    Le d√©partement marketing a re√ßu une prime de 500‚Ç¨ par employ√©.
    Le d√©partement technique a re√ßu une prime de 750‚Ç¨ par employ√©.
    Le d√©partement administratif a re√ßu une prime de 400‚Ç¨ par employ√©.
    Quel est le montant total des primes distribu√©es ?

-----------------------------------
M√©thode DIRECTE:
-----------------------------------
Le montant total des primes distribu√©es est de 62 500 ‚Ç¨.

-----------------------------------
M√©thode ZERO-SHOT CoT:
-----------------------------------
Pour r√©soudre le probl√®me, suivons les √©tapes que vous avez indiqu√©es.

### 1. Identifie les informations cl√©s
- Total des employ√©s : 120
- Pourcentage d'employ√©s au d√©partement marketing : 40%
- Pourcentage d'employ√©s au d√©partement technique : 25%
-

---

## Partie 6 : ReAct Prompting

### Raisonnement et Action

**ReAct** (Reasoning + Acting) combine le raisonnement explicite avec l'ex√©cution d'actions. Le mod√®le alterne entre :
- **Thought** (Pens√©e) : R√©flexion sur la situation
- **Action** : Ex√©cution d'une action (recherche, calcul, etc.)
- **Observation** : R√©sultat de l'action

### Pratique : Impl√©mentation de ReAct

In [28]:
"""
Exercice 6 : ReAct Prompting
Objectif : Combiner raisonnement et actions pour des t√¢ches complexes
"""

from openai import OpenAI
import os
import re
import json
from dotenv import load_dotenv

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

class ReactAgent:
    """
    Agent ReAct simplifi√© avec des outils simul√©s.
    """

    def __init__(self, model: str = "gpt-4o-mini"):
        self.model = model
        self.historique = []
        self.outils = {
            "recherche": self._recherche,
            "calcul": self._calcul,
            "date": self._date,
        }

    def _recherche(self, query: str) -> str:
        """Simule une recherche (√† remplacer par une vraie API)."""
        # Personnalisez avec une vraie API de recherche
        base_connaissances = {
            "capitale france": "La capitale de la France est Paris.",
            "population paris": "Paris compte environ 2,1 millions d'habitants (ville) et 12 millions (agglom√©ration).",
            "tour eiffel hauteur": "La Tour Eiffel mesure 330 m√®tres avec son antenne.",
            "python cr√©ateur": "Python a √©t√© cr√©√© par Guido van Rossum en 1991.",
            "openai fondation": "OpenAI a √©t√© fond√©e en 2015 par Sam Altman, Elon Musk et d'autres.",
        }

        query_lower = query.lower()
        for cle, valeur in base_connaissances.items():
            if any(mot in query_lower for mot in cle.split()):
                return valeur

        return f"Aucune information trouv√©e pour: {query}"

    def _calcul(self, expression: str) -> str:
        """Effectue un calcul math√©matique."""
        try:
            # Nettoyage de l'expression
            expression_clean = expression.replace("^", "**").replace("√ó", "*").replace("√∑", "/")
            resultat = eval(expression_clean)
            return f"R√©sultat: {resultat}"
        except Exception as e:
            return f"Erreur de calcul: {e}"

    def _date(self, query: str) -> str:
        """Retourne la date actuelle."""
        from datetime import datetime
        return f"Date actuelle: {datetime.now().strftime('%d/%m/%Y %H:%M')}"

    def executer_action(self, action: str, parametre: str) -> str:
        """Ex√©cute une action et retourne l'observation."""
        action = action.lower().strip()
        if action in self.outils:
            return self.outils[action](parametre)
        return f"Action inconnue: {action}. Actions disponibles: {list(self.outils.keys())}"

    def resoudre(self, question: str, max_iterations: int = 5) -> str:
        """
        R√©sout une question en utilisant le pattern ReAct.
        """
        system_prompt = """Tu es un assistant qui r√©sout des probl√®mes en utilisant le pattern ReAct.

        √Ä chaque √©tape, tu dois:
        1. THOUGHT: R√©fl√©chir √† ce que tu sais et ce que tu dois faire
        2. ACTION: Choisir une action parmi [recherche, calcul, date]
        3. Attendre l'OBSERVATION

        Format de r√©ponse pour chaque √©tape:
        THOUGHT: [ta r√©flexion]
        ACTION: [nom_action]
        INPUT: [param√®tre de l'action]

        Quand tu as la r√©ponse finale, √©cris:
        THOUGHT: [r√©flexion finale]
        FINAL_ANSWER: [ta r√©ponse compl√®te]

        Actions disponibles:
        - recherche: Recherche d'information (INPUT: mots-cl√©s)
        - calcul: Calcul math√©matique (INPUT: expression math√©matique)
        - date: Obtenir la date actuelle (INPUT: vide)"""

        messages = [
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": f"Question: {question}"}
        ]

        print(f"\n{'='*60}")
        print(f"Question: {question}")
        print("="*60)

        for iteration in range(max_iterations):
            print(f"\n--- It√©ration {iteration + 1} ---")

            # Obtenir la prochaine √©tape du mod√®le
            response = client.chat.completions.create(
                model=self.model,
                messages=messages,
                temperature=0.3,
                max_tokens=500
            )

            reponse_texte = response.choices[0].message.content
            print(f"\nMod√®le:\n{reponse_texte}")

            # V√©rifier si on a une r√©ponse finale
            if "FINAL_ANSWER:" in reponse_texte:
                final = reponse_texte.split("FINAL_ANSWER:")[-1].strip()
                print(f"\nR√©ponse finale: {final}")
                return final

            # Parser l'action
            action_match = re.search(r"ACTION:\s*(\w+)", reponse_texte)
            input_match = re.search(r"INPUT:\s*(.+?)(?:\n|$)", reponse_texte)

            if action_match:
                action = action_match.group(1)
                parametre = input_match.group(1) if input_match else ""

                # Ex√©cuter l'action
                observation = self.executer_action(action, parametre)
                print(f"\nObservation: {observation}")

                # Ajouter au contexte
                messages.append({"role": "assistant", "content": reponse_texte})
                messages.append({"role": "user", "content": f"OBSERVATION: {observation}"})
            else:
                print("Aucune action d√©tect√©e, ajout au contexte...")
                messages.append({"role": "assistant", "content": reponse_texte})

        return "Nombre maximum d'it√©rations atteint."

In [29]:
# Cr√©ation de l'agent
agent = ReactAgent()

In [30]:
# Exercice 6.1 : Questions n√©cessitant recherche + raisonnement
print("\n" + "*"*20)
print("EXERCICE 6.1 : QUESTIONS COMPLEXES")
print("*"*20)

questions = [
    "Quelle est la population de la capitale de la France ?",
    "Si la Tour Eiffel mesurait 2 fois sa hauteur actuelle, combien mesurerait-elle ?",
    #"En quelle ann√©e Python a-t-il √©t√© cr√©√©, et quel √¢ge a ce langage aujourd'hui ?",
]

for q in questions:
    agent.resoudre(q)
    print("\n" + "-"*60)


********************
EXERCICE 6.1 : QUESTIONS COMPLEXES
********************

Question: Quelle est la population de la capitale de la France ?

--- It√©ration 1 ---

Mod√®le:
THOUGHT: Je sais que la capitale de la France est Paris, et je dois rechercher la population actuelle de cette ville. 
ACTION: recherche
INPUT: population Paris 2023

Observation: Paris compte environ 2,1 millions d'habitants (ville) et 12 millions (agglom√©ration).

--- It√©ration 2 ---

Mod√®le:
THOUGHT: J'ai trouv√© que Paris a une population d'environ 2,1 millions d'habitants pour la ville elle-m√™me, et environ 12 millions pour l'agglom√©ration. Je vais maintenant formuler ma r√©ponse finale. 
FINAL_ANSWER: La population de la capitale de la France, Paris, est d'environ 2,1 millions d'habitants, tandis que l'agglom√©ration parisienne compte environ 12 millions d'habitants.

R√©ponse finale: La population de la capitale de la France, Paris, est d'environ 2,1 millions d'habitants, tandis que l'agglom√©ration p

---

## Partie 7 : √âvaluation des LLMs

### M√©triques d'√âvaluation

| M√©trique | Description | Utilisation |
|----------|-------------|-------------|
| **Exactitude** | Correspondance exacte | Classification, QA ferm√© |
| **BLEU/ROUGE** | Similarit√© de texte | Traduction, r√©sum√© |
| **Coherence** | Logique du discours | G√©n√©ration longue |
| **Faithfulness** | Fid√©lit√© aux sources | RAG, r√©sum√© |
| **G-Eval** | √âvaluation par LLM | Tout type de t√¢che |

### Pratique : √âvaluation avec DeepEval

In [38]:
"""
Exercice 7 : √âvaluation des LLMs
Objectif : Mesurer et am√©liorer la qualit√© des r√©ponses
"""

from openai import OpenAI
import os
from dotenv import load_dotenv

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# ============================================
# 7.1 √âVALUATION MANUELLE STRUCTUR√âE
# ============================================

class EvaluateurManuel:
    """
    √âvaluateur manuel avec crit√®res structur√©s.
    """

    def __init__(self, criteres: dict = None):
        self.criteres = criteres or {
            "pertinence": "La r√©ponse r√©pond-elle √† la question pos√©e ?",
            "exactitude": "Les informations sont-elles correctes ?",
            "completude": "La r√©ponse est-elle compl√®te ?",
            "clarte": "La r√©ponse est-elle claire et bien structur√©e ?",
            "concision": "La r√©ponse est-elle concise sans √™tre trop courte ?",
        }

    def evaluer_avec_llm(self, question: str, reponse: str, model: str = "gpt-4o-mini") -> dict:
        """
        Utilise un LLM comme juge pour √©valuer une r√©ponse.
        """
        prompt = f"""Tu es un √©valuateur expert. √âvalue la r√©ponse suivante selon les crit√®res donn√©s.

        QUESTION: {question}

        R√âPONSE √Ä √âVALUER: {reponse}

        CRIT√àRES D'√âVALUATION:
        {chr(10).join([f'- {k}: {v}' for k, v in self.criteres.items()])}

        Pour chaque crit√®re, donne une note de 1 √† 5 et une justification br√®ve.
        Termine par une note globale et un r√©sum√©.

        Format de r√©ponse (JSON):
        {{
            "scores": {{
                "pertinence": {{"note": X, "justification": "..."}},
                "exactitude": {{"note": X, "justification": "..."}},
                "completude": {{"note": X, "justification": "..."}},
                "clarte": {{"note": X, "justification": "..."}},
                "concision": {{"note": X, "justification": "..."}}
            }},
            "note_globale": X.X,
            "resume": "..."
        }}"""

        response = client.chat.completions.create(
            model=model,
            messages=[{"role": "user", "content": prompt}],
            temperature=0.1
        )

        return response.choices[0].message.content

# ============================================
# 7.2 COMPARAISON A/B
# ============================================

class ComparateurAB:
    """
    Compare deux variantes de prompts ou de mod√®les.
    """

    def __init__(self, model: str = "gpt-4o-mini"):
        self.model = model

    def comparer(self, question: str, reponse_a: str, reponse_b: str) -> dict:
        """
        Compare deux r√©ponses et d√©termine laquelle est meilleure.
        """
        prompt = f"""Tu es un √©valuateur impartial. Compare les deux r√©ponses suivantes √† la m√™me question.

        QUESTION: {question}

        R√âPONSE A:
        {reponse_a}

        R√âPONSE B:
        {reponse_b}

        Analyse selon ces crit√®res:
        1. Pertinence par rapport √† la question
        2. Exactitude des informations
        3. Clart√© et lisibilit√©
        4. Utilit√© pratique

        Donne ton verdict:
        - Quelle r√©ponse est meilleure ?
        - Pourquoi ?
        - Y a-t-il des √©l√©ments √† combiner des deux r√©ponses ?

        Format JSON:
        {{
            "gagnant": "A" ou "B" ou "√©galit√©",
            "raison": "...",
            "score_a": X/10,
            "score_b": X/10,
            "suggestions": "..."
        }}"""

        response = client.chat.completions.create(
            model=self.model,
            messages=[{"role": "user", "content": prompt}],
            temperature=0.1
        )

        return response.choices[0].message.content

# ============================================
# 7.3 √âVALUATION AVEC DEEPEVAL
# ============================================

def installer_deepeval():
    """Instructions pour installer DeepEval."""
    print("""
    Pour utiliser DeepEval, installez-le avec:
    pip install deepeval

    Puis configurez votre cl√© OpenAI:
    export OPENAI_API_KEY=sk-...
    """)

# Exemple d'utilisation de DeepEval (√† d√©commenter apr√®s installation)
"""
from deepeval import evaluate
from deepeval.metrics import AnswerRelevancyMetric, FaithfulnessMetric
from deepeval.test_case import LLMTestCase

# Cr√©er un cas de test
test_case = LLMTestCase(
    input="Qu'est-ce que le machine learning ?",
    actual_output="Le machine learning est une branche de l'IA...",
    expected_output="Le machine learning est une technique d'apprentissage automatique...",
    context=["Le ML est une sous-branche de l'intelligence artificielle."]
)

# D√©finir les m√©triques
relevancy_metric = AnswerRelevancyMetric(threshold=0.7)
faithfulness_metric = FaithfulnessMetric(threshold=0.7)

# √âvaluer
evaluate([test_case], [relevancy_metric, faithfulness_metric])
"""

'\nfrom deepeval import evaluate\nfrom deepeval.metrics import AnswerRelevancyMetric, FaithfulnessMetric\nfrom deepeval.test_case import LLMTestCase\n\n# Cr√©er un cas de test\ntest_case = LLMTestCase(\n    input="Qu\'est-ce que le machine learning ?",\n    actual_output="Le machine learning est une branche de l\'IA...",\n    expected_output="Le machine learning est une technique d\'apprentissage automatique...",\n    context=["Le ML est une sous-branche de l\'intelligence artificielle."]\n)\n\n# D√©finir les m√©triques\nrelevancy_metric = AnswerRelevancyMetric(threshold=0.7)\nfaithfulness_metric = FaithfulnessMetric(threshold=0.7)\n\n# √âvaluer\nevaluate([test_case], [relevancy_metric, faithfulness_metric])\n'

In [32]:
print("="*70)
print("EXERCICE 7 : √âVALUATION DES LLMS")
print("="*70)

# Exercice 7.1 : √âvaluation d'une r√©ponse
evaluateur = EvaluateurManuel()

question_test = "Quels sont les avantages et inconv√©nients du t√©l√©travail ?"
reponse_test = """
Le t√©l√©travail pr√©sente plusieurs avantages :
- Flexibilit√© des horaires
- √âconomie de temps de transport
- Meilleur √©quilibre vie professionnelle/personnelle

Les inconv√©nients incluent :
- Isolement social
- Difficult√© √† s√©parer vie pro et perso
- Risque de surmenage

En conclusion, le t√©l√©travail peut √™tre b√©n√©fique si bien encadr√©.
"""

print("\n√âvaluation de la r√©ponse:")
print("-"*40)
evaluation = evaluateur.evaluer_avec_llm(question_test, reponse_test)
print(evaluation)

EXERCICE 7 : √âVALUATION DES LLMS

√âvaluation de la r√©ponse:
----------------------------------------
{
    "scores": {
        "pertinence": {"note": 5, "justification": "La r√©ponse aborde directement les avantages et inconv√©nients du t√©l√©travail, r√©pondant ainsi parfaitement √† la question pos√©e."},
        "exactitude": {"note": 5, "justification": "Les informations fournies sur les avantages et inconv√©nients du t√©l√©travail sont correctes et refl√®tent des r√©alit√©s g√©n√©ralement reconnues."},
        "completude": {"note": 4, "justification": "Bien que la r√©ponse couvre les principaux avantages et inconv√©nients, elle pourrait √™tre enrichie par des exemples ou des d√©tails suppl√©mentaires."},
        "clarte": {"note": 5, "justification": "La r√©ponse est bien structur√©e, avec une s√©paration claire entre les avantages et les inconv√©nients, ce qui facilite la compr√©hension."},
        "concision": {"note": 5, "justification": "La r√©ponse est concise et va droit 

In [39]:
# Exercice 7.2 : Comparaison A/B de prompts
print("\n\nComparaison A/B:")
print("-"*40)

comparateur = ComparateurAB()

# Deux versions de r√©ponses g√©n√©r√©es avec diff√©rents prompts
reponse_prompt_simple = """Le t√©l√©travail c'est bien car on ne perd pas de temps dans les transports et on peut travailler en pyjama. Mais c'est aussi nul car on ne voit plus personne."""

reponse_prompt_structure = """
## Avantages du t√©l√©travail

1. **Gain de temps** : √âlimination des trajets domicile-travail
2. **Flexibilit√©** : Meilleure gestion de son emploi du temps
3. **Productivit√©** : Environnement souvent plus calme

## Inconv√©nients du t√©l√©travail

1. **Isolement** : R√©duction des interactions sociales
2. **Fronti√®res floues** : Difficult√© √† "d√©brancher"
3. **Communication** : Collaboration parfois plus complexe

## Recommandations

Un mod√®le hybride (2-3 jours en pr√©sentiel) semble √™tre le meilleur compromis.
"""

resultat_comparaison = comparateur.comparer(
    question_test,
    reponse_prompt_simple,
    reponse_prompt_structure
)
print(resultat_comparaison)



Comparaison A/B:
----------------------------------------
```json
{
    "gagnant": "B",
    "raison": "La r√©ponse B est plus structur√©e, d√©taill√©e et couvre √† la fois les avantages et les inconv√©nients du t√©l√©travail de mani√®re √©quilibr√©e. Elle fournit des informations pr√©cises et des recommandations pratiques, ce qui la rend plus utile.",
    "score_a": 4/10,
    "score_b": 9/10,
    "suggestions": "La r√©ponse A pourrait √™tre am√©lior√©e en ajoutant des d√©tails et en structurant les id√©es de mani√®re plus claire, tout en conservant un ton l√©ger. Des √©l√©ments de la r√©ponse A, comme le travail en pyjama, pourraient √™tre int√©gr√©s dans la r√©ponse B pour ajouter une touche personnelle."
}
```
