### Configuration et pr√©paration des donn√©es

In [None]:
import dspy
import warnings
warnings.filterwarnings('ignore')

# Configurer le mod√®le de langage
lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)

# Configurer DSPy globalement
dspy.configure(lm=lm)

In [None]:
# Donn√©es d'entra√Ænement
trainset = [
    {"ticket": "Mon ordinateur ne d√©marre plus depuis ce matin. J'ai une pr√©sentation importante dans 2 heures.", "category": "Hardware", "priority": "Urgent"},
    {"ticket": "Je n'arrive pas √† me connecter √† l'imprimante du 3e √©tage. √áa peut attendre.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le VPN ne fonctionne plus. Impossible d'acc√©der aux fichiers du serveur.", "category": "Network", "priority": "High"},
    {"ticket": "J'ai oubli√© mon mot de passe Outlook. Je peux utiliser le webmail.", "category": "Account", "priority": "Medium"},
    {"ticket": "Le site web affiche une erreur 500. Les clients ne peuvent plus commander!", "category": "Application", "priority": "Critical"},
    {"ticket": "Ma souris sans fil ne r√©pond plus bien. Les piles sont faibles.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le syst√®me de paie ne calcule pas les heures suppl√©mentaires. C'est la fin du mois.", "category": "Application", "priority": "Urgent"},
    {"ticket": "J'aimerais une mise √† jour de mon logiciel Adobe quand vous aurez le temps.", "category": "Software", "priority": "Low"},
    {"ticket": "Le serveur de base de donn√©es est tr√®s lent. Toute la production est impact√©e.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "Je ne re√ßois plus les emails. J'attends des r√©ponses de fournisseurs.", "category": "Email", "priority": "High"},
    {"ticket": "Mon √©cran externe ne s'affiche plus. Je peux travailler sur le laptop.", "category": "Hardware", "priority": "Medium"},
    {"ticket": "Le wifi de la salle A ne fonctionne pas. R√©union avec des externes dans 30 min.", "category": "Network", "priority": "Urgent"},
    {"ticket": "Je voudrais installer Slack pour mieux collaborer avec l'√©quipe.", "category": "Software", "priority": "Medium"},
    {"ticket": "Le syst√®me de sauvegarde a √©chou√© cette nuit selon le rapport.", "category": "Infrastructure", "priority": "High"},
    {"ticket": "Mon clavier a une touche qui colle. C'est g√©rable mais ennuyeux.", "category": "Peripherals", "priority": "Low"}
]

# Donn√©es de validation
valset = [
    {"ticket": "Le serveur de fichiers est inaccessible. Personne ne peut travailler.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "J'ai besoin d'acc√®s au dossier comptabilit√© pour l'audit. C'est urgent.", "category": "Account", "priority": "Urgent"},
    {"ticket": "L'√©cran de mon coll√®gue en vacances clignote. On peut attendre.", "category": "Hardware", "priority": "Low"},
    {"ticket": "Le CRM plante quand j'essaie d'exporter les contacts.", "category": "Application", "priority": "High"},
    {"ticket": "Je voudrais changer ma photo de profil quand vous aurez un moment.", "category": "Account", "priority": "Low"},
    {"ticket": "La vid√©oconf√©rence ne fonctionne pas. R√©union avec New York dans 10 minutes!", "category": "Application", "priority": "Critical"},
    {"ticket": "Mon antivirus affiche un message d'expiration mais tout fonctionne.", "category": "Software", "priority": "Medium"}
]

# Cat√©gories et priorit√©s possibles
CATEGORIES = ["Hardware", "Software", "Network", "Application", "Infrastructure", "Account", "Email", "Peripherals"]
PRIORITIES = ["Low", "Medium", "High", "Urgent", "Critical"]

print(f"üìä Donn√©es charg√©es : {len(trainset)} entra√Ænement, {len(valset)} validation")
print(f"üì¶ {len(CATEGORIES)} cat√©gories, {len(PRIORITIES)} priorit√©s")

# Partie 7: GEPA en pratique

## 7.1 Introduction √† GEPA

**GEPA** (Genetic-Pareto Algorithm) est l'optimiseur le plus sophistiqu√© de DSPy. Il combine plusieurs techniques avanc√©es pour am√©liorer automatiquement vos prompts.

### Qu'est-ce que GEPA?

GEPA utilise une approche inspir√©e de l'√©volution biologique :

1. **üß¨ Algorithmes g√©n√©tiques** : G√©n√®re des "populations" de prompts qui √©voluent
2. **ü§î R√©flexion LLM** : Utilise un LLM pour analyser les erreurs et proposer des am√©liorations
3. **üìä Optimisation Pareto** : √âquilibre plusieurs objectifs (pr√©cision, concision, etc.)
4. **üîÑ It√©rations adaptatives** : Apprend de ses erreurs pour s'am√©liorer

### Comment √ßa fonctionne?

```
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ 1. POPULATION INITIALE                                  ‚îÇ
‚îÇ    G√©n√®re plusieurs variantes de prompts               ‚îÇ
‚îÇ    ‚Üì                                                    ‚îÇ
‚îÇ 2. √âVALUATION                                          ‚îÇ
‚îÇ    Teste chaque variante sur les donn√©es d'entra√Ænement‚îÇ
‚îÇ    ‚Üì                                                    ‚îÇ
‚îÇ 3. S√âLECTION                                           ‚îÇ
‚îÇ    Garde les meilleurs (front de Pareto)               ‚îÇ
‚îÇ    ‚Üì                                                    ‚îÇ
‚îÇ 4. R√âFLEXION                                           ‚îÇ
‚îÇ    LLM analyse les erreurs et propose des am√©liorations‚îÇ
‚îÇ    ‚Üì                                                    ‚îÇ
‚îÇ 5. MUTATION                                            ‚îÇ
‚îÇ    G√©n√®re de nouvelles variantes bas√©es sur la r√©flexion‚îÇ
‚îÇ    ‚Üì                                                    ‚îÇ
‚îÇ 6. R√âP√àTE jusqu'√† convergence                          ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
```

### Pourquoi GEPA est diff√©rent?

| Optimiseur | Approche | R√©flexion LLM | Am√©lioration typique |
|------------|----------|---------------|---------------------|
| BootstrapFewShot | Exemples fixes | ‚ùå Non | 5-15% |
| MIPRO | Variations syst√©matiques | ‚ùå Non | 10-25% |
| **GEPA** | **√âvolution + R√©flexion** | **‚úÖ Oui** | **15-30%** |

### Nouveaut√©s dans DSPy 3.0+

GEPA a √©t√© int√©gr√© directement dans DSPy et n√©cessite maintenant :
- **reflection_lm** : Un mod√®le LLM d√©di√© √† l'analyse des erreurs
- **auto** : Niveau d'optimisation ('light', 'medium', 'heavy')
- **M√©trique compatible** : Doit accepter les param√®tres GEPA

## 7.2 Configuration de GEPA

### Pr√©requis

Avant d'utiliser GEPA, vous devez avoir :

1. ‚úÖ **Donn√©es d'entra√Ænement** : Au moins 15-20 exemples de qualit√©
2. ‚úÖ **Donn√©es de validation** : 5-10 exemples s√©par√©s pour √©viter le surapprentissage
3. ‚úÖ **M√©trique d'√©valuation** : Fonction retournant un score entre 0 et 1
4. ‚úÖ **Module √† optimiser** : Votre module DSPy de base
5. ‚úÖ **Temps** : 10-30 minutes selon le niveau d'optimisation

### Configuration du mod√®le de r√©flexion

Le **reflection_lm** est un LLM utilis√© par GEPA pour analyser les erreurs et proposer des am√©liorations. Il est distinct du mod√®le principal.

**Recommandations** :
- Utiliser un mod√®le avec bonne capacit√© de raisonnement
- Temp√©rature √©lev√©e (1.0) pour plus de cr√©ativit√©
- Max tokens √©lev√© (8000+) pour des analyses d√©taill√©es

In [None]:
print("üîß Configuration de GEPA\n")

# 1. Configurer le mod√®le principal (celui qu'on optimise)
lm_main = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)

dspy.configure(lm=lm_main)

# 2. Configurer le mod√®le de r√©flexion pour GEPA
# Important: Temp√©rature √©lev√©e pour plus de cr√©ativit√© dans l'analyse
reflection_lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=1.0,      # Haute temp√©rature = plus de cr√©ativit√©
    max_tokens=8000       # Tokens √©lev√©s = analyses d√©taill√©es
)

print("‚úÖ Mod√®le principal configur√©: llama3.1:8b (temp=0.3)")
print("‚úÖ Mod√®le de r√©flexion configur√©: llama3.1:8b (temp=1.0)")
print()

# 3. Pr√©parer les donn√©es au format DSPy
train_examples = [
    dspy.Example(
        ticket=ex['ticket'],
        category=ex['category'],
        priority=ex['priority']
    ).with_inputs('ticket')
    for ex in trainset
]

val_examples = [
    dspy.Example(
        ticket=ex['ticket'],
        category=ex['category'],
        priority=ex['priority']
    ).with_inputs('ticket')
    for ex in valset
]

print(f"‚úÖ Donn√©es pr√©par√©es:")
print(f"   - Entra√Ænement: {len(train_examples)} exemples")
print(f"   - Validation: {len(val_examples)} exemples")

## 7.3 Optimisation avec GEPA (mode 'light')

Le mode **'light'** est le niveau d'optimisation le plus rapide de GEPA. Il est id√©al pour :
- Premi√®re exp√©rimentation avec GEPA
- Tests rapides (5-10 minutes)
- Validation du concept
- Ressources limit√©es

### Niveaux d'optimisation GEPA

| Niveau | Temps estim√© | Appels LLM | Am√©lioration | Usage |
|--------|-------------|------------|--------------|-------|
| **light** | 5-10 min | ~200-400 | 10-20% | Tests, prototypage |
| **medium** | 10-20 min | ~400-800 | 15-25% | Production l√©g√®re |
| **heavy** | 20-40 min | ~800-1600 | 20-30% | Maximum performance |

### Exemple pratique

In [None]:
from dspy.teleprompt import GEPA

print("=" * 70)
print("üß¨ OPTIMISATION GEPA - MODE 'LIGHT'")
print("=" * 70)
print()

# 1. Cr√©er le module √† optimiser
print("1Ô∏è‚É£ Cr√©ation du module de base...")
baseline_classifier = SimpleTicketClassifier()

# 2. √âvaluer AVANT optimisation
print("2Ô∏è‚É£ √âvaluation AVANT optimisation...")
score_before = evaluate_module(baseline_classifier, val_examples, exact_match_metric)
print(f"   üìä Score baseline: {score_before:.2%}\n")

# 3. Configurer l'optimiseur GEPA
print("3Ô∏è‚É£ Configuration de l'optimiseur GEPA...")
optimizer = GEPA(
    metric=exact_match_metric,
    auto='light',                    # Mode rapide
    reflection_lm=reflection_lm      # Mod√®le pour l'analyse des erreurs
)
print("   ‚úÖ Optimiseur configur√© (mode: light)\n")

# 4. Lancer l'optimisation
print("4Ô∏è‚É£ Lancement de l'optimisation GEPA...")
print("   ‚è∞ Cela va prendre 5-10 minutes avec Ollama")
print("   ‚òï C'est le moment de prendre un caf√©!\n")

try:
    optimized_classifier = optimizer.compile(
        student=baseline_classifier,
        trainset=train_examples,
        valset=val_examples
    )
    
    print("\n‚úÖ Optimisation GEPA termin√©e!\n")
    
    # 5. √âvaluer APR√àS optimisation
    print("5Ô∏è‚É£ √âvaluation APR√àS optimisation...")
    score_after = evaluate_module(optimized_classifier, val_examples, exact_match_metric)
    print(f"   üìä Score optimis√©: {score_after:.2%}\n")
    
    # 6. Calculer l'am√©lioration
    improvement = ((score_after - score_before) / score_before) * 100 if score_before > 0 else 0
    improvement_abs = score_after - score_before
    
    print("=" * 70)
    print("üìà R√âSULTATS DE L'OPTIMISATION")
    print("=" * 70)
    print(f"Score AVANT:      {score_before:.2%}")
    print(f"Score APR√àS:      {score_after:.2%}")
    print(f"Am√©lioration:     {improvement_abs:+.2%} ({improvement:+.1f}%)")
    print("=" * 70)
    
except Exception as e:
    print(f"\n‚ùå Erreur lors de l'optimisation GEPA: {e}")
    print("   V√©rifiez que:")
    print("   - Ollama est en cours d'ex√©cution")
    print("   - Le mod√®le llama3.1:8b est t√©l√©charg√©")
    print("   - Vous avez suffisamment de m√©moire disponible")

## 7.4 Analyser les prompts optimis√©s

Une des forces de GEPA est qu'il **g√©n√®re des prompts explicites** que vous pouvez inspecter et comprendre. Cela permet de :
- üîç Voir ce que GEPA a chang√©
- üìö Apprendre comment am√©liorer vos prompts manuellement
- ‚úÖ Valider que les modifications ont du sens
- üéì Comprendre pourquoi la performance s'est am√©lior√©e

### Inspection des prompts

In [None]:
print("üîç Inspection des prompts optimis√©s par GEPA\n")

# Essayer d'acc√©der aux prompts optimis√©s
if hasattr(optimized_classifier, 'classifier'):
    predictor = optimized_classifier.classifier
    
    # 1. Signature optimis√©e
    if hasattr(predictor, 'extended_signature'):
        print("=" * 70)
        print("üìù SIGNATURE OPTIMIS√âE")
        print("=" * 70)
        sig = predictor.extended_signature
        print(f"Docstring: {sig.__doc__}")
        print()
        
        # Afficher les champs
        if hasattr(sig, 'input_fields'):
            print("Champs d'entr√©e:")
            for name, field in sig.input_fields.items():
                desc = getattr(field, 'desc', 'N/A')
                print(f"  - {name}: {desc}")
        
        if hasattr(sig, 'output_fields'):
            print("\nChamps de sortie:")
            for name, field in sig.output_fields.items():
                desc = getattr(field, 'desc', 'N/A')
                print(f"  - {name}: {desc}")
        print()
    
    # 2. Exemples de d√©monstration
    if hasattr(predictor, 'demos') and predictor.demos:
        print("=" * 70)
        print("üìö EXEMPLES DE D√âMONSTRATION G√âN√âR√âS")
        print("=" * 70)
        print(f"Nombre d'exemples: {len(predictor.demos)}\n")
        
        # Afficher les 3 premiers exemples
        for i, demo in enumerate(predictor.demos[:3], 1):
            print(f"Exemple {i}:")
            print(f"  Ticket: {demo.ticket[:80]}...")
            if hasattr(demo, 'category'):
                print(f"  Cat√©gorie: {demo.category}")
            if hasattr(demo, 'priority'):
                print(f"  Priorit√©: {demo.priority}")
            print()
    
    else:
        print("‚ÑπÔ∏è Aucun exemple de d√©monstration trouv√©")
        print("   (GEPA peut optimiser uniquement les instructions)")
    
else:
    print("‚ÑπÔ∏è Structure du module diff√©rente")
    print("   L'optimisation s'est concentr√©e sur d'autres aspects")

print("=" * 70)
print("üí° Ce que GEPA a fait:")
print("=" * 70)
print("‚úÖ Analys√© les erreurs sur les donn√©es d'entra√Ænement")
print("‚úÖ G√©n√©r√© des variantes de prompts")
print("‚úÖ Utilis√© la r√©flexion LLM pour proposer des am√©liorations")
print("‚úÖ S√©lectionn√© la meilleure configuration via Pareto")
print("=" * 70)

## 7.5 Tester le classifier optimis√©

Maintenant que GEPA a optimis√© notre classifier, testons-le sur de nouveaux exemples pour voir la diff√©rence.

### Comparaison c√¥te √† c√¥te

In [None]:
print("üß™ Test comparatif: Baseline vs GEPA optimis√©\n")

# Exemples de test
test_cases = [
    {
        'ticket': "Mon ordinateur portable ne s'allume plus, j'ai une r√©union importante dans 1h",
        'expected_category': 'Hardware',
        'expected_priority': 'Urgent'
    },
    {
        'ticket': "Je voudrais acc√®s √† la base de donn√©es pour faire des analyses",
        'expected_category': 'Account',
        'expected_priority': 'Medium'
    },
    {
        'ticket': "Le WiFi est compl√®tement HS dans tout le b√¢timent!",
        'expected_category': 'Network',
        'expected_priority': 'Critical'
    },
    {
        'ticket': "Mon logiciel de comptabilit√© plante quand j'exporte en PDF",
        'expected_category': 'Software',
        'expected_priority': 'High'
    }
]

print("=" * 100)
print(f"{'Ticket':<50} | {'Attendu':<20} | {'Baseline':<20} | {'GEPA':<20}")
print("=" * 100)

correct_baseline = 0
correct_gepa = 0

for test in test_cases:
    ticket = test['ticket']
    expected = f"{test['expected_category']}/{test['expected_priority']}"
    
    # Pr√©diction baseline
    pred_baseline = baseline_classifier(ticket=ticket)
    baseline_result = f"{pred_baseline.category}/{pred_baseline.priority}"
    baseline_match = (pred_baseline.category == test['expected_category'] and 
                     pred_baseline.priority == test['expected_priority'])
    
    # Pr√©diction GEPA
    pred_gepa = optimized_classifier(ticket=ticket)
    gepa_result = f"{pred_gepa.category}/{pred_gepa.priority}"
    gepa_match = (pred_gepa.category == test['expected_category'] and 
                 pred_gepa.priority == test['expected_priority'])
    
    if baseline_match:
        correct_baseline += 1
    if gepa_match:
        correct_gepa += 1
    
    # Afficher avec indicateurs de succ√®s
    baseline_icon = "‚úÖ" if baseline_match else "‚ùå"
    gepa_icon = "‚úÖ" if gepa_match else "‚ùå"
    
    print(f"{ticket[:48]:<50} | {expected:<20} | {baseline_icon} {baseline_result:<17} | {gepa_icon} {gepa_result:<17}")

print("=" * 100)
print(f"Pr√©cision sur les exemples de test:")
print(f"  Baseline: {correct_baseline}/{len(test_cases)} ({correct_baseline/len(test_cases)*100:.0f}%)")
print(f"  GEPA:     {correct_gepa}/{len(test_cases)} ({correct_gepa/len(test_cases)*100:.0f}%)")
print("=" * 100)

## 7.6 Conseils pour optimiser avec GEPA

### 7.6.1 Qualit√© des donn√©es

La qualit√© de l'optimisation GEPA d√©pend **fortement** de vos donn√©es :

‚úÖ **Bonnes pratiques** :
- Minimum 15-20 exemples d'entra√Ænement (id√©alement 30-50)
- Exemples **diversifi√©s** couvrant tous les cas d'usage
- Labels **corrects** et **coh√©rents**
- Donn√©es de validation **s√©par√©es** du trainset

‚ùå **√Ä √©viter** :
- Trop peu d'exemples (<10)
- Exemples r√©p√©titifs ou tr√®s similaires
- Labels incoh√©rents ou ambigus
- Utiliser les m√™mes donn√©es pour train et validation

### 7.6.2 Choix de la m√©trique

Votre **m√©trique d√©termine ce que GEPA optimise** :

```python
# M√©trique stricte (tout ou rien)
def exact_match(example, prediction, trace=None, pred_name=None, pred_trace=None):
    return 1.0 if (prediction.category == example.category and 
                   prediction.priority == example.priority) else 0.0

# M√©trique avec cr√©dit partiel (souvent meilleure pour GEPA)
def partial_match(example, prediction, trace=None, pred_name=None, pred_trace=None):
    category_match = prediction.category == example.category
    priority_match = prediction.priority == example.priority
    
    if category_match and priority_match:
        return 1.0
    elif category_match:
        return 0.7  # Cat√©gorie plus importante
    elif priority_match:
        return 0.5
    else:
        return 0.0
```

üí° **Conseil** : Les m√©triques avec cr√©dit partiel donnent g√©n√©ralement de meilleurs r√©sultats car elles fournissent plus de signal d'apprentissage √† GEPA.

### 7.6.3 Choix du niveau d'optimisation

| Situation | Niveau recommand√© | Raison |
|-----------|------------------|---------|
| Premi√®re exp√©rimentation | **light** | Test rapide du concept |
| Prototype pour d√©mo | **light** | Balance vitesse/performance |
| Application production (non-critique) | **medium** | Bon compromis |
| Application production (critique) | **heavy** | Maximum de performance |
| Recherche / benchmark | **heavy** | Explorer les limites |

### 7.6.4 Configuration du mod√®le de r√©flexion

Le **reflection_lm** influence la qualit√© des am√©liorations :

‚úÖ **Bonnes pratiques** :
- Utiliser un mod√®le avec bonne capacit√© de raisonnement
- Temp√©rature √©lev√©e (0.8-1.2) pour la cr√©ativit√©
- Max tokens √©lev√© (6000-10000) pour analyses d√©taill√©es
- Peut √™tre le m√™me mod√®le que le mod√®le principal

‚ùå **√Ä √©viter** :
- Mod√®les trop petits (<7B param√®tres)
- Temp√©rature trop basse (<0.5)
- Max tokens trop faible (<4000)

### 7.6.5 √âviter le surapprentissage

GEPA peut **surapprendre** sur les donn√©es d'entra√Ænement :

‚úÖ **Pr√©vention** :
- Toujours avoir un **valset s√©par√©**
- Valider sur de **nouvelles donn√©es** apr√®s optimisation
- Comparer les scores train vs validation
- Si grand √©cart : vos donn√©es ne sont pas assez diversifi√©es

```python
# Bon: √âvaluation sur donn√©es s√©par√©es
score_train = evaluate_module(optimized, train_examples, metric)
score_val = evaluate_module(optimized, val_examples, metric)

if score_train - score_val > 0.2:
    print("‚ö†Ô∏è Possible surapprentissage!")
```

## 7.7 Troubleshooting et erreurs courantes

### Erreur 1: `TypeError: GEPA.__init__() got an unexpected keyword argument`

**Sympt√¥me** :
```
TypeError: GEPA.__init__() got an unexpected keyword argument 'breadth'
```

**Cause** : Utilisation de param√®tres de l'ancienne API GEPA (pre-3.0)

**Solution** :
```python
# ‚ùå Ancienne API (ne fonctionne plus)
optimizer = GEPA(
    metric=my_metric,
    breadth=10,
    depth=3
)

# ‚úÖ Nouvelle API (DSPy 3.0+)
optimizer = GEPA(
    metric=my_metric,
    auto='light',  # ou 'medium', 'heavy'
    reflection_lm=reflection_lm
)
```

### Erreur 2: `TypeError: metric() missing required positional argument`

**Sympt√¥me** :
```
TypeError: metric() missing 2 required positional arguments: 'pred_name' and 'pred_trace'
```

**Cause** : M√©trique pas compatible avec l'API GEPA

**Solution** : Ajouter les param√®tres optionnels √† votre m√©trique
```python
# ‚ùå Ancienne signature
def my_metric(example, prediction):
    return 1.0 if prediction.category == example.category else 0.0

# ‚úÖ Nouvelle signature (compatible GEPA)
def my_metric(example, prediction, trace=None, pred_name=None, pred_trace=None):
    return 1.0 if prediction.category == example.category else 0.0
```

### Erreur 3: Ollama timeout ou erreur de connexion

**Sympt√¥me** :
```
ConnectionError: Failed to connect to Ollama
```

**Causes possibles** :
1. Ollama n'est pas d√©marr√©
2. Mod√®le non t√©l√©charg√©
3. M√©moire insuffisante

**Solutions** :
```bash
# 1. V√©rifier qu'Ollama tourne
ollama list

# 2. D√©marrer Ollama si n√©cessaire
ollama serve

# 3. T√©l√©charger le mod√®le
ollama pull llama3.1:8b

# 4. V√©rifier la m√©moire disponible
# GEPA + Ollama n√©cessite ~8-12 GB RAM
```

### Erreur 4: GEPA ne s'am√©liore pas

**Sympt√¥me** : Score apr√®s optimisation ‚âà score avant

**Causes possibles** :
1. Donn√©es d'entra√Ænement insuffisantes ou de mauvaise qualit√©
2. M√©trique mal d√©finie
3. T√¢che trop difficile pour le mod√®le
4. Module d√©j√† bien optimis√©

**Solutions** :
```python
# V√©rifier la qualit√© des donn√©es
print(f"Nombre d'exemples train: {len(trainset)}")
print(f"Nombre d'exemples val: {len(valset)}")

# V√©rifier la m√©trique
for ex in trainset[:5]:
    pred = baseline(ticket=ex['ticket'])
    score = metric(ex, pred)
    print(f"Score: {score} | Pred: {pred.category}/{pred.priority} | Truth: {ex['category']}/{ex['priority']}")

# Essayer un niveau plus √©lev√©
optimizer = GEPA(
    metric=metric,
    auto='heavy',  # au lieu de 'light'
    reflection_lm=reflection_lm
)
```

### Erreur 5: Out of Memory (OOM)

**Sympt√¥me** : Ollama ou Python crash avec erreur de m√©moire

**Solutions** :
1. Utiliser un mod√®le plus petit : `mistral:7b` au lieu de `llama3.1:8b`
2. R√©duire `max_tokens` du reflection_lm
3. Utiliser `auto='light'` au lieu de `medium` ou `heavy`
4. Fermer les autres applications
5. Utiliser une API cloud au lieu d'Ollama local

## 7.8 R√©sum√© de la Partie 7

### Ce que nous avons appris

1. **GEPA : L'optimiseur le plus sophistiqu√©**
   - Combine algorithmes g√©n√©tiques + r√©flexion LLM + Pareto
   - Am√©lioration typique : 15-30%
   - N√©cessite un mod√®le de r√©flexion (reflection_lm)

2. **Configuration essentielle**
   - `auto` : 'light', 'medium', ou 'heavy'
   - `reflection_lm` : Mod√®le pour analyser les erreurs (temp=1.0, max_tokens=8000)
   - `metric` : Doit accepter les param√®tres GEPA (trace, pred_name, pred_trace)

3. **Niveaux d'optimisation**
   - **light** : 5-10 min, ~200-400 appels LLM, 10-20% am√©lioration
   - **medium** : 10-20 min, ~400-800 appels LLM, 15-25% am√©lioration
   - **heavy** : 20-40 min, ~800-1600 appels LLM, 20-30% am√©lioration

4. **Inspection des r√©sultats**
   - Voir les prompts optimis√©s
   - Comprendre les changements
   - Valider les am√©liorations

5. **Bonnes pratiques**
   - Donn√©es : 15-20+ exemples diversifi√©s
   - M√©trique : Cr√©dit partiel souvent meilleur
   - Validation : Toujours sur donn√©es s√©par√©es
   - Mod√®le : ‚â•7B param√®tres recommand√©

6. **Troubleshooting**
   - Erreurs d'API : V√©rifier la signature de la m√©trique
   - Pas d'am√©lioration : V√©rifier qualit√© des donn√©es
   - OOM : R√©duire niveau ou utiliser mod√®le plus petit

### Points cl√©s √† retenir

- ‚úÖ **GEPA est puissant** mais n√©cessite temps et ressources
- ‚úÖ **Commencer avec 'light'** pour tester le concept
- ‚úÖ **Qualit√© des donn√©es = qualit√© des r√©sultats**
- ‚úÖ **Toujours valider** sur donn√©es s√©par√©es
- ‚úÖ **Inspecter les prompts** pour comprendre les am√©liorations

### Quand utiliser GEPA?

| Situation | GEPA? | Alternative |
|-----------|-------|-------------|
| Prototypage rapide | ‚ùå Non | Module simple |
| Tests initiaux | ‚ùå Non | BootstrapFewShot |
| Application production (non-critique) | ‚ö†Ô∏è Peut-√™tre | MIPRO |
| Application production (critique) | ‚úÖ Oui | GEPA medium/heavy |
| Recherche / Maximum performance | ‚úÖ Oui | GEPA heavy |
| Ressources limit√©es | ‚ùå Non | BootstrapFewShot |

### Workflow recommand√©

```python
# Phase 1: Baseline
classifier = SimpleTicketClassifier()
score_baseline = evaluate(classifier, valset, metric)

# Phase 2: Optimisation simple
from dspy.teleprompt import BootstrapFewShot
optimizer_simple = BootstrapFewShot(metric=metric)
classifier_simple = optimizer_simple.compile(classifier, trainset)
score_simple = evaluate(classifier_simple, valset, metric)

# Phase 3: GEPA (si am√©lioration justifie le temps)
if score_simple < target_score:
    from dspy.teleprompt import GEPA
    optimizer_gepa = GEPA(metric=metric, auto='light', reflection_lm=reflection_lm)
    classifier_gepa = optimizer_gepa.compile(classifier, trainset, valset)
    score_gepa = evaluate(classifier_gepa, valset, metric)
    
    # Phase 4: GEPA heavy si n√©cessaire
    if score_gepa < target_score:
        optimizer_heavy = GEPA(metric=metric, auto='heavy', reflection_lm=reflection_lm)
        classifier_final = optimizer_heavy.compile(classifier, trainset, valset)
```

### Ressources additionnelles

- üìÑ [Paper GEPA (arXiv)](https://arxiv.org/abs/2507.19457)
- üíª [GitHub GEPA](https://github.com/gepa-ai/gepa)
- üìñ [Documentation DSPy](https://dspy-docs.vercel.app/)

### Prochaines √©tapes

- **Partie 8** : Conclusion et mise en production