### Configuration et pr√©paration des donn√©es

In [None]:
import dspy
import warnings
warnings.filterwarnings('ignore')

# Configurer le mod√®le de langage
lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)

# Configurer DSPy globalement
dspy.configure(lm=lm)

In [None]:
# Donn√©es d'entra√Ænement
trainset = [
    {"ticket": "Mon ordinateur ne d√©marre plus depuis ce matin. J'ai une pr√©sentation importante dans 2 heures.", "category": "Hardware", "priority": "Urgent"},
    {"ticket": "Je n'arrive pas √† me connecter √† l'imprimante du 3e √©tage. √áa peut attendre.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le VPN ne fonctionne plus. Impossible d'acc√©der aux fichiers du serveur.", "category": "Network", "priority": "High"},
    {"ticket": "J'ai oubli√© mon mot de passe Outlook. Je peux utiliser le webmail.", "category": "Account", "priority": "Medium"},
    {"ticket": "Le site web affiche une erreur 500. Les clients ne peuvent plus commander!", "category": "Application", "priority": "Critical"},
    {"ticket": "Ma souris sans fil ne r√©pond plus bien. Les piles sont faibles.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le syst√®me de paie ne calcule pas les heures suppl√©mentaires. C'est la fin du mois.", "category": "Application", "priority": "Urgent"},
    {"ticket": "J'aimerais une mise √† jour de mon logiciel Adobe quand vous aurez le temps.", "category": "Software", "priority": "Low"},
    {"ticket": "Le serveur de base de donn√©es est tr√®s lent. Toute la production est impact√©e.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "Je ne re√ßois plus les emails. J'attends des r√©ponses de fournisseurs.", "category": "Email", "priority": "High"},
    {"ticket": "Mon √©cran externe ne s'affiche plus. Je peux travailler sur le laptop.", "category": "Hardware", "priority": "Medium"},
    {"ticket": "Le wifi de la salle A ne fonctionne pas. R√©union avec des externes dans 30 min.", "category": "Network", "priority": "Urgent"},
    {"ticket": "Je voudrais installer Slack pour mieux collaborer avec l'√©quipe.", "category": "Software", "priority": "Medium"},
    {"ticket": "Le syst√®me de sauvegarde a √©chou√© cette nuit selon le rapport.", "category": "Infrastructure", "priority": "High"},
    {"ticket": "Mon clavier a une touche qui colle. C'est g√©rable mais ennuyeux.", "category": "Peripherals", "priority": "Low"}
]

# Donn√©es de validation
valset = [
    {"ticket": "Le serveur de fichiers est inaccessible. Personne ne peut travailler.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "J'ai besoin d'acc√®s au dossier comptabilit√© pour l'audit. C'est urgent.", "category": "Account", "priority": "Urgent"},
    {"ticket": "L'√©cran de mon coll√®gue en vacances clignote. On peut attendre.", "category": "Hardware", "priority": "Low"},
    {"ticket": "Le CRM plante quand j'essaie d'exporter les contacts.", "category": "Application", "priority": "High"},
    {"ticket": "Je voudrais changer ma photo de profil quand vous aurez un moment.", "category": "Account", "priority": "Low"},
    {"ticket": "La vid√©oconf√©rence ne fonctionne pas. R√©union avec New York dans 10 minutes!", "category": "Application", "priority": "Critical"},
    {"ticket": "Mon antivirus affiche un message d'expiration mais tout fonctionne.", "category": "Software", "priority": "Medium"}
]

# Cat√©gories et priorit√©s possibles
CATEGORIES = ["Hardware", "Software", "Network", "Application", "Infrastructure", "Account", "Email", "Peripherals"]
PRIORITIES = ["Low", "Medium", "High", "Urgent", "Critical"]

print(f"üìä Donn√©es charg√©es : {len(trainset)} entra√Ænement, {len(valset)} validation")
print(f"üì¶ {len(CATEGORIES)} cat√©gories, {len(PRIORITIES)} priorit√©s")

# Partie 5 : Les optimiseurs

## 4.1 Introduction: modules vs optimiseurs

Jusqu'√† pr√©sent, nous avons vu des **modules** (Predict, ChainOfThought, ReAct, etc.). Ces modules **ex√©cutent** des t√¢ches en interrogeant le LLM.

Les **optimiseurs**, quant √† eux, **am√©liorent** les modules en :
- Ajoutant des exemples de d√©monstration (few-shot learning)
- Optimisant les instructions (prompts)
- Ajustant les param√®tres
- S√©lectionnant les meilleures configurations

**Analogie** : Si un module est comme un √©tudiant qui r√©sout un probl√®me, un optimiseur est comme un professeur qui am√©liore la m√©thode de l'√©tudiant en lui montrant des exemples et en affinant ses instructions.

### Principaux optimiseurs DSPy

1. **BootstrapFewShot** - Le plus simple : g√©n√®re des exemples de d√©monstration
2. **BootstrapFewShotWithRandomSearch** - Teste plusieurs combinaisons d'exemples
3. **MIPRO** - Optimise √† la fois les instructions et les exemples
4. **SignatureOptimizer** - Se concentre uniquement sur l'optimisation des instructions
5. **GEPA** - Le plus sophistiqu√© : utilise des algorithmes g√©n√©tiques et la r√©flexion LLM

Dans cette section, nous allons explorer les optimiseurs 1-4. GEPA sera couvert en d√©tail dans la Partie 7.

## 4.2 BootstrapFewShot: g√©n√©rer des exemples de d√©monstration

**BootstrapFewShot** est l'optimiseur le plus simple de DSPy. Il fonctionne en :

1. Ex√©cutant votre module sur les donn√©es d'entra√Ænement
2. Gardant les pr√©dictions correctes (valid√©es par votre m√©trique)
3. Utilisant ces pr√©dictions comme exemples de d√©monstration (few-shot)
4. Injectant ces exemples dans le prompt du module optimis√©

**Avantages** :
- Simple √† comprendre et √† utiliser
- Rapide √† ex√©cuter
- Am√©lioration typique de 5-15%

**Inconv√©nients** :
- Ne modifie pas les instructions
- Qualit√© d√©pend de la qualit√© des donn√©es d'entra√Ænement

### Exemple pratique

In [59]:
from dspy.teleprompt import BootstrapFewShot

print("üîß Optimisation avec BootstrapFewShot...")

# 1. Pr√©parer les donn√©es au format DSPy
train_examples = [
    dspy.Example(
        ticket=ex['ticket'],
        category=ex['category'],
        priority=ex['priority']
    ).with_inputs('ticket')
    for ex in trainset
]

# 2. Cr√©er le module de base
basic_classifier = SimpleTicketClassifier()

# 3. √âvaluer AVANT optimisation
print("\nüìä Performance AVANT optimisation:")
score_before = evaluate_module(basic_classifier, val_examples, exact_match_metric)
print(f"   Score: {score_before:.2%}")

# 4. Configurer l'optimiseur BootstrapFewShot
optimizer = BootstrapFewShot(
    metric=exact_match_metric,
    max_bootstrapped_demos=4,  # Nombre d'exemples √† g√©n√©rer
    max_labeled_demos=4         # Nombre max d'exemples √† utiliser
)

# 5. Compiler (optimiser) le module
print("\nüîÑ Compilation avec BootstrapFewShot...")
optimized_classifier = optimizer.compile(
    student=basic_classifier,
    trainset=train_examples
)

# 6. √âvaluer APR√àS optimisation
print("\nüìä Performance APR√àS optimisation:")
score_after = evaluate_module(optimized_classifier, val_examples, exact_match_metric)
print(f"   Score: {score_after:.2%}")

# 7. Calculer l'am√©lioration
improvement = ((score_after - score_before) / score_before) * 100 if score_before > 0 else 0
print(f"\nüìà Am√©lioration: {improvement:+.1f}%")

üîß Optimisation avec BootstrapFewShot...


NameError: name 'SimpleTicketClassifier' is not defined

### Inspecter les exemples g√©n√©r√©s

BootstrapFewShot a ajout√© des exemples de d√©monstration au module. Nous pouvons les visualiser :

In [None]:
# Inspecter les exemples de d√©monstration ajout√©s par BootstrapFewShot
if hasattr(optimized_classifier, 'classifier'):
    predictor = optimized_classifier.classifier
    
    if hasattr(predictor, 'demos') and predictor.demos:
        print(f"üìö BootstrapFewShot a ajout√© {len(predictor.demos)} exemples de d√©monstration:\n")
        
        for i, demo in enumerate(predictor.demos[:3], 1):  # Afficher les 3 premiers
            print(f"Exemple {i}:")
            print(f"  Ticket: {demo.ticket[:80]}...")
            print(f"  Cat√©gorie: {demo.category}")
            print(f"  Priorit√©: {demo.priority}")
            print()
    else:
        print("‚ÑπÔ∏è Aucun exemple de d√©monstration trouv√© (ou version DSPy diff√©rente)")
else:
    print("‚ÑπÔ∏è Structure du module diff√©rente de celle attendue")

## 4.3 MIPRO: optimisation des instructions et exemples

**MIPRO** (Multi-prompt Instruction Proposal Optimizer) est un optimiseur plus avanc√© qui :

1. **G√©n√®re plusieurs variantes d'instructions** pour votre signature
2. **S√©lectionne les meilleurs exemples** de d√©monstration
3. **Teste diff√©rentes combinaisons** (instructions √ó exemples)
4. **Garde la meilleure configuration** selon votre m√©trique

**Avantages** :
- Optimise √† la fois les instructions et les exemples
- Am√©lioration typique de 10-25%
- Explore l'espace des possibilit√©s de mani√®re syst√©matique

**Inconv√©nients** :
- Plus lent que BootstrapFewShot (n√©cessite plus d'appels LLM)
- Peut prendre 10-20 minutes avec Ollama local

### Exemple pratique

In [None]:
from dspy.teleprompt import MIPRO

print("üöÄ Optimisation avec MIPRO...")
print("‚è∞ Attention : Cela peut prendre 10-20 minutes avec Ollama\n")

# 1. Cr√©er un module de base
mipro_classifier = SimpleTicketClassifier()

# 2. Configurer MIPRO
optimizer = MIPRO(
    metric=exact_match_metric,
    num_candidates=5,           # Nombre de variantes d'instructions √† g√©n√©rer
    init_temperature=1.0        # Temp√©rature pour la g√©n√©ration d'instructions
)

# 3. Compiler avec MIPRO
# Note: MIPRO n√©cessite √† la fois trainset et valset (optionnel)
print("üîÑ Compilation avec MIPRO (cela va prendre du temps)...")

try:
    mipro_optimized = optimizer.compile(
        student=mipro_classifier,
        trainset=train_examples,
        max_bootstrapped_demos=3,  # Nombre d'exemples √† g√©n√©rer
        max_labeled_demos=3,        # Nombre max d'exemples √† utiliser
        requires_permission_to_run=False  # Pas de confirmation interactive
    )
    
    # 4. √âvaluer le r√©sultat
    print("\nüìä Performance apr√®s MIPRO:")
    score_mipro = evaluate_module(mipro_optimized, val_examples, exact_match_metric)
    print(f"   Score: {score_mipro:.2%}")
    
    improvement_mipro = ((score_mipro - score_before) / score_before) * 100 if score_before > 0 else 0
    print(f"   Am√©lioration vs baseline: {improvement_mipro:+.1f}%")
    
except Exception as e:
    print(f"‚ö†Ô∏è Erreur lors de l'optimisation MIPRO: {e}")
    print("   MIPRO n√©cessite une configuration sp√©cifique selon la version de DSPy")
    print("   Consultez la documentation DSPy pour plus de d√©tails.")

## 4.4 Autres optimiseurs importants

### SignatureOptimizer

**SignatureOptimizer** se concentre uniquement sur l'optimisation des instructions de votre signature, sans ajouter d'exemples de d√©monstration.

**Utilisation** :
```python
from dspy.teleprompt import SignatureOptimizer

optimizer = SignatureOptimizer(
    metric=exact_match_metric,
    breadth=10,  # Nombre de variantes √† g√©n√©rer
    depth=3      # Nombre d'it√©rations de raffinement
)

optimized = optimizer.compile(student=classifier, trainset=train_examples)
```

**Avantages** :
- Rapide (pas de g√©n√©ration d'exemples)
- Am√©liore la clart√© des instructions
- Bon pour les t√¢ches o√π les exemples ne sont pas critiques

**Inconv√©nients** :
- Am√©lioration modeste (5-10%)
- Ne tire pas parti du few-shot learning

### BootstrapFewShotWithRandomSearch

Extension de BootstrapFewShot qui teste plusieurs combinaisons al√©atoires d'exemples.

**Utilisation** :
```python
from dspy.teleprompt import BootstrapFewShotWithRandomSearch

optimizer = BootstrapFewShotWithRandomSearch(
    metric=exact_match_metric,
    max_bootstrapped_demos=4,
    num_candidate_programs=8  # Nombre de combinaisons √† tester
)

optimized = optimizer.compile(student=classifier, trainset=train_examples)
```

**Avantages** :
- Trouve de meilleures combinaisons d'exemples
- Plus robuste que BootstrapFewShot simple
- Am√©lioration typique de 8-18%

**Inconv√©nients** :
- Plus lent que BootstrapFewShot (teste plusieurs combinaisons)

## 4.5 Comparaison des optimiseurs

| Optimiseur | Ce qu'il optimise | Vitesse | Am√©lioration typique | Complexit√© | Quand l'utiliser |
|------------|------------------|---------|---------------------|------------|------------------|
| **BootstrapFewShot** | Exemples uniquement | ‚ö°‚ö°‚ö° Rapide | 5-15% | Simple | Premi√®re optimisation, tests rapides |
| **BootstrapFewShotWithRandomSearch** | Exemples (avec recherche) | ‚ö°‚ö° Moyen | 8-18% | Simple | Quand vous avez un peu plus de temps |
| **SignatureOptimizer** | Instructions uniquement | ‚ö°‚ö°‚ö° Rapide | 5-10% | Moyen | T√¢ches o√π les instructions sont critiques |
| **MIPRO** | Instructions + exemples | ‚ö° Lent | 10-25% | Avanc√© | Production, quand vous visez la meilleure performance |
| **GEPA** | Instructions + exemples + r√©flexion | ‚ö° Tr√®s lent | 15-30% | Tr√®s avanc√© | Maximum de performance, recherche |

### Guide de s√©lection

**Pour d√©buter** :
1. Commencez avec **BootstrapFewShot** pour comprendre le concept
2. Si les r√©sultats sont bons, passez √† **BootstrapFewShotWithRandomSearch**
3. Si vous avez du temps, essayez **MIPRO**

**Pour la production** :
- Si vous avez des contraintes de temps : **BootstrapFewShotWithRandomSearch**
- Si vous visez la meilleure performance : **MIPRO** ou **GEPA**
- Si vos instructions sont mal formul√©es : **SignatureOptimizer** d'abord, puis un autre

**Pour la recherche** :
- **GEPA** pour explorer les limites de performance
- **MIPRO** pour une approche plus syst√©matique

### Strat√©gie recommand√©e

1. **Phase 1 - Exploration** : Utilisez BootstrapFewShot pour tester rapidement
2. **Phase 2 - Am√©lioration** : Passez √† MIPRO si les r√©sultats sont prometteurs
3. **Phase 3 - Optimisation finale** : Utilisez GEPA pour maximiser la performance (voir Partie 7)

## 4.6 Introduction √† GEPA

**GEPA** (Genetic-Pareto Algorithm) est l'optimiseur le plus sophistiqu√© de DSPy. Il m√©rite une section compl√®te (Partie 7) car il combine plusieurs techniques avanc√©es :

### Comment GEPA fonctionne

1. **Algorithmes g√©n√©tiques** : √âvolution de populations de prompts
2. **R√©flexion LLM** : Utilise un LLM pour analyser les erreurs et proposer des am√©liorations
3. **Optimisation Pareto** : √âquilibre plusieurs objectifs (pr√©cision, concision, etc.)
4. **It√©rations adaptatives** : Apprend de ses erreurs pour s'am√©liorer

### Nouveaut√©s dans DSPy 3.0+

GEPA a √©t√© int√©gr√© directement dans DSPy et n√©cessite maintenant :
- Un **reflection_lm** : mod√®le d√©di√© √† l'analyse des erreurs
- Configuration via **auto** : 'light', 'medium', ou 'heavy'
- M√©trique compatible avec les nouveaux param√®tres

### Aper√ßu rapide

```python
from dspy.teleprompt import GEPA

# Configuration du mod√®le de r√©flexion
reflection_lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=1.0,
    max_tokens=8000
)

# Optimiseur GEPA
optimizer = GEPA(
    metric=exact_match_metric,
    auto='light',  # 'light', 'medium', ou 'heavy'
    reflection_lm=reflection_lm
)

# Compilation
optimized = optimizer.compile(
    student=classifier,
    trainset=train_examples,
    valset=val_examples
)
```

### Quand utiliser GEPA

- ‚úÖ Vous avez du temps (15-30 minutes minimum)
- ‚úÖ Vous visez la meilleure performance possible
- ‚úÖ Vous avez suffisamment de donn√©es d'entra√Ænement (20+ exemples)
- ‚úÖ Votre m√©trique est bien d√©finie
- ‚úÖ Vous √™tes pr√™t √† exp√©rimenter avec les param√®tres

**La Partie 7 de ce tutoriel couvre GEPA en profondeur avec des exemples pratiques, des comparaisons de param√®tres, et des conseils d'optimisation.**

## 4.7 R√©sum√© de la Partie 4

### Ce que nous avons appris

1. **Diff√©rence modules vs optimiseurs** :
   - Les modules **ex√©cutent** des t√¢ches
   - Les optimiseurs **am√©liorent** les modules

2. **Les optimiseurs principaux** :
   - **BootstrapFewShot** : Simple, rapide, g√©n√®re des exemples
   - **BootstrapFewShotWithRandomSearch** : Teste plusieurs combinaisons
   - **SignatureOptimizer** : Optimise uniquement les instructions
   - **MIPRO** : Optimise instructions + exemples
   - **GEPA** : Le plus sophistiqu√© (d√©tails en Partie 7)

3. **Comment choisir** :
   - D√©buter : BootstrapFewShot
   - Production rapide : BootstrapFewShotWithRandomSearch
   - Meilleure performance : MIPRO ou GEPA
   - Instructions mal formul√©es : SignatureOptimizer

### Points cl√©s √† retenir

- ‚úÖ Toujours √©valuer **avant** et **apr√®s** optimisation
- ‚úÖ Commencer simple, puis complexifier
- ‚úÖ Les optimiseurs n√©cessitent des donn√©es d'entra√Ænement de qualit√©
- ‚úÖ Plus de temps d'optimisation = g√©n√©ralement meilleure performance
- ‚úÖ Votre m√©trique d√©termine ce que l'optimiseur optimise

### Prochaines √©tapes

- **Partie 5** : Multi-mod√®les (utiliser diff√©rents LLMs)
- **Partie 6** : Patterns avanc√©s (optionnel)
- **Partie 7** : GEPA en pratique (optimisation approfondie)