### Configuration et pr√©paration des donn√©es

In [None]:
import dspy
import warnings
warnings.filterwarnings('ignore')

# Configurer le mod√®le de langage
lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)

# Configurer DSPy globalement
dspy.configure(lm=lm)

In [None]:
# Donn√©es d'entra√Ænement
trainset = [
    {"ticket": "Mon ordinateur ne d√©marre plus depuis ce matin. J'ai une pr√©sentation importante dans 2 heures.", "category": "Hardware", "priority": "Urgent"},
    {"ticket": "Je n'arrive pas √† me connecter √† l'imprimante du 3e √©tage. √áa peut attendre.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le VPN ne fonctionne plus. Impossible d'acc√©der aux fichiers du serveur.", "category": "Network", "priority": "High"},
    {"ticket": "J'ai oubli√© mon mot de passe Outlook. Je peux utiliser le webmail.", "category": "Account", "priority": "Medium"},
    {"ticket": "Le site web affiche une erreur 500. Les clients ne peuvent plus commander!", "category": "Application", "priority": "Critical"},
    {"ticket": "Ma souris sans fil ne r√©pond plus bien. Les piles sont faibles.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le syst√®me de paie ne calcule pas les heures suppl√©mentaires. C'est la fin du mois.", "category": "Application", "priority": "Urgent"},
    {"ticket": "J'aimerais une mise √† jour de mon logiciel Adobe quand vous aurez le temps.", "category": "Software", "priority": "Low"},
    {"ticket": "Le serveur de base de donn√©es est tr√®s lent. Toute la production est impact√©e.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "Je ne re√ßois plus les emails. J'attends des r√©ponses de fournisseurs.", "category": "Email", "priority": "High"},
    {"ticket": "Mon √©cran externe ne s'affiche plus. Je peux travailler sur le laptop.", "category": "Hardware", "priority": "Medium"},
    {"ticket": "Le wifi de la salle A ne fonctionne pas. R√©union avec des externes dans 30 min.", "category": "Network", "priority": "Urgent"},
    {"ticket": "Je voudrais installer Slack pour mieux collaborer avec l'√©quipe.", "category": "Software", "priority": "Medium"},
    {"ticket": "Le syst√®me de sauvegarde a √©chou√© cette nuit selon le rapport.", "category": "Infrastructure", "priority": "High"},
    {"ticket": "Mon clavier a une touche qui colle. C'est g√©rable mais ennuyeux.", "category": "Peripherals", "priority": "Low"}
]

# Donn√©es de validation
valset = [
    {"ticket": "Le serveur de fichiers est inaccessible. Personne ne peut travailler.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "J'ai besoin d'acc√®s au dossier comptabilit√© pour l'audit. C'est urgent.", "category": "Account", "priority": "Urgent"},
    {"ticket": "L'√©cran de mon coll√®gue en vacances clignote. On peut attendre.", "category": "Hardware", "priority": "Low"},
    {"ticket": "Le CRM plante quand j'essaie d'exporter les contacts.", "category": "Application", "priority": "High"},
    {"ticket": "Je voudrais changer ma photo de profil quand vous aurez un moment.", "category": "Account", "priority": "Low"},
    {"ticket": "La vid√©oconf√©rence ne fonctionne pas. R√©union avec New York dans 10 minutes!", "category": "Application", "priority": "Critical"},
    {"ticket": "Mon antivirus affiche un message d'expiration mais tout fonctionne.", "category": "Software", "priority": "Medium"}
]

# Cat√©gories et priorit√©s possibles
CATEGORIES = ["Hardware", "Software", "Network", "Application", "Infrastructure", "Account", "Email", "Peripherals"]
PRIORITIES = ["Low", "Medium", "High", "Urgent", "Critical"]

print(f"üìä Donn√©es charg√©es : {len(trainset)} entra√Ænement, {len(valset)} validation")
print(f"üì¶ {len(CATEGORIES)} cat√©gories, {len(PRIORITIES)} priorit√©s")

# Partie 6: Multi-mod√®les et flexibilit√©

## 5.1 Introduction: pourquoi utiliser plusieurs mod√®les?

DSPy offre une **abstraction puissante** : votre code reste le m√™me quel que soit le mod√®le utilis√©. Vous pouvez :

1. **Changer de fournisseur** facilement (Ollama ‚Üí OpenAI ‚Üí Anthropic)
2. **Comparer les performances** de diff√©rents mod√®les
3. **Cr√©er des architectures hybrides** (mod√®le rapide pour cat√©gorie, mod√®le pr√©cis pour priorit√©)
4. **Optimiser co√ªt vs performance**

### Avantages du multi-mod√®les

- üîÑ **Flexibilit√©** : Pas de vendor lock-in
- üí∞ **Optimisation des co√ªts** : Mod√®le gratuit (Ollama) pour dev, mod√®le payant pour prod
- üéØ **Performance** : Choisir le meilleur mod√®le pour chaque t√¢che
- üß™ **Exp√©rimentation** : Tester facilement diff√©rents mod√®les

### Ce que nous allons voir

1. Configurer diff√©rents fournisseurs (Ollama, OpenAI, Anthropic)
2. Comparer les performances de diff√©rents mod√®les
3. Cr√©er des architectures hybrides
4. G√©rer les cl√©s API de mani√®re s√©curis√©e

## 5.2 Configuration de diff√©rents fournisseurs

### 5.2.1 Ollama (local, gratuit)

Ollama permet d'ex√©cuter des mod√®les **localement** sans API key ni co√ªts.

**Mod√®les recommand√©s** :
- `llama3.1:8b` - √âquilibr√©, bon pour la plupart des t√¢ches (4.7 GB)
- `mistral:7b` - Rapide, bon pour les t√¢ches simples (4.1 GB)
- `qwen2.5:7b` - Haute qualit√©, excellent pour les t√¢ches complexes (4.7 GB)
- `gemma2:9b` - Alternative de Google, tr√®s performant (5.4 GB)

**Configuration** :

In [None]:
# Configuration Ollama
lm_ollama_llama = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)

lm_ollama_mistral = dspy.LM(
    model='ollama_chat/mistral:7b',
    api_base='http://localhost:11434',
    temperature=0.3
)

lm_ollama_qwen = dspy.LM(
    model='ollama_chat/qwen2.5:7b',
    api_base='http://localhost:11434',
    temperature=0.3
)

print("‚úÖ Mod√®les Ollama configur√©s:")
print("   - llama3.1:8b")
print("   - mistral:7b")
print("   - qwen2.5:7b")

### 5.2.2 OpenAI (API, payant)

OpenAI propose des mod√®les tr√®s performants via API.

**Mod√®les recommand√©s** :
- `gpt-4o-mini` - Rapide et √©conomique, bon rapport qualit√©/prix
- `gpt-4o` - Haute performance, multimodal
- `gpt-4-turbo` - √âquilibr√© performance/co√ªt

**Configuration** :

In [None]:
import os

# Configuration OpenAI (n√©cessite OPENAI_API_KEY dans l'environnement)
if os.getenv('OPENAI_API_KEY'):
    lm_openai_mini = dspy.LM(
        model='openai/gpt-4o-mini',
        temperature=0.3
    )
    
    lm_openai_4o = dspy.LM(
        model='openai/gpt-4o',
        temperature=0.3
    )
    
    print("‚úÖ Mod√®les OpenAI configur√©s:")
    print("   - gpt-4o-mini")
    print("   - gpt-4o")
else:
    print("‚ö†Ô∏è OPENAI_API_KEY non d√©finie - mod√®les OpenAI non disponibles")
    print("   Pour utiliser OpenAI, d√©finissez la variable d'environnement:")
    print("   export OPENAI_API_KEY='votre-cl√©-api'")
    lm_openai_mini = None
    lm_openai_4o = None

### 5.2.3 Anthropic (API, payant)

Anthropic propose les mod√®les Claude, connus pour leur qualit√© et leur s√©curit√©.

**Mod√®les recommand√©s** :
- `claude-3-5-haiku-20241022` - Rapide et √©conomique
- `claude-3-5-sonnet-20241022` - √âquilibr√©, excellent pour la plupart des t√¢ches
- `claude-3-opus-20240229` - Maximum de performance

**Configuration** :

In [None]:
# Configuration Anthropic (n√©cessite ANTHROPIC_API_KEY dans l'environnement)
if os.getenv('ANTHROPIC_API_KEY'):
    lm_claude_haiku = dspy.LM(
        model='anthropic/claude-3-5-haiku-20241022',
        temperature=0.3
    )
    
    lm_claude_sonnet = dspy.LM(
        model='anthropic/claude-3-5-sonnet-20241022',
        temperature=0.3
    )
    
    print("‚úÖ Mod√®les Anthropic configur√©s:")
    print("   - claude-3-5-haiku")
    print("   - claude-3-5-sonnet")
else:
    print("‚ö†Ô∏è ANTHROPIC_API_KEY non d√©finie - mod√®les Anthropic non disponibles")
    print("   Pour utiliser Anthropic, d√©finissez la variable d'environnement:")
    print("   export ANTHROPIC_API_KEY='votre-cl√©-api'")
    lm_claude_haiku = None
    lm_claude_sonnet = None

## 5.3 Comparer les performances de diff√©rents mod√®les

Maintenant que nous avons configur√© plusieurs mod√®les, comparons leurs performances sur notre t√¢che de classification de tickets IT.

### Fonction de benchmarking

In [None]:
import time

def benchmark_model(lm, model_name, examples, metric):
    """
    √âvalue un mod√®le sur un ensemble d'exemples
    
    Args:
        lm: Le language model DSPy
        model_name: Nom du mod√®le (pour affichage)
        examples: Liste d'exemples de validation
        metric: Fonction de m√©trique
    
    Returns:
        dict avec score et temps d'ex√©cution
    """
    # Configurer DSPy avec ce mod√®le
    dspy.configure(lm=lm)
    
    # Cr√©er un classifier avec ce mod√®le
    classifier = SimpleTicketClassifier()
    
    # Mesurer le temps
    start_time = time.time()
    
    # √âvaluer
    total_score = 0
    for example in examples:
        prediction = classifier(ticket=example['ticket'])
        score = metric(example, prediction)
        total_score += score
    
    end_time = time.time()
    
    # Calculer les r√©sultats
    avg_score = total_score / len(examples)
    elapsed_time = end_time - start_time
    
    return {
        'model': model_name,
        'score': avg_score,
        'time': elapsed_time
    }

print("‚úÖ Fonction de benchmarking d√©finie")

### Comparaison des mod√®les Ollama

Comparons les 3 mod√®les Ollama locaux :

In [None]:
print("üîç Comparaison des mod√®les Ollama...")
print("‚è∞ Cela va prendre quelques minutes\n")

results = []

# Benchmarker llama3.1:8b
print("1/3 √âvaluation de llama3.1:8b...")
result_llama = benchmark_model(lm_ollama_llama, 'llama3.1:8b', valset, exact_match_metric)
results.append(result_llama)
print(f"   Score: {result_llama['score']:.2%} | Temps: {result_llama['time']:.1f}s\n")

# Benchmarker mistral:7b
print("2/3 √âvaluation de mistral:7b...")
result_mistral = benchmark_model(lm_ollama_mistral, 'mistral:7b', valset, exact_match_metric)
results.append(result_mistral)
print(f"   Score: {result_mistral['score']:.2%} | Temps: {result_mistral['time']:.1f}s\n")

# Benchmarker qwen2.5:7b
print("3/3 √âvaluation de qwen2.5:7b...")
result_qwen = benchmark_model(lm_ollama_qwen, 'qwen2.5:7b', valset, exact_match_metric)
results.append(result_qwen)
print(f"   Score: {result_qwen['score']:.2%} | Temps: {result_qwen['time']:.1f}s\n")

# Afficher le r√©sum√©
print("=" * 60)
print("üìä R√âSUM√â DES PERFORMANCES")
print("=" * 60)
for r in sorted(results, key=lambda x: x['score'], reverse=True):
    print(f"{r['model']:20} | Score: {r['score']:6.2%} | Temps: {r['time']:5.1f}s")
print("=" * 60)

## 5.4 Architectures hybrides: utiliser diff√©rents mod√®les pour diff√©rentes t√¢ches

Une **architecture hybride** utilise diff√©rents mod√®les pour diff√©rentes parties de votre pipeline. Par exemple :

- Mod√®le **rapide et √©conomique** pour la cat√©gorisation
- Mod√®le **pr√©cis mais co√ªteux** pour la priorisation

### Avantages

- üí∞ **Optimisation des co√ªts** : Utiliser des mod√®les co√ªteux uniquement quand n√©cessaire
- ‚ö° **Optimisation de la vitesse** : Mod√®les rapides pour les t√¢ches simples
- üéØ **Optimisation de la qualit√©** : Meilleurs mod√®les pour les t√¢ches critiques

### Exemple: pipeline hybride

Cr√©ons un classifier qui utilise deux mod√®les diff√©rents :

In [None]:
class HybridTicketClassifier(dspy.Module):
    """
    Classifier hybride utilisant 2 mod√®les diff√©rents:
    - Mod√®le rapide pour la cat√©gorie
    - Mod√®le pr√©cis pour la priorit√©
    """
    
    def __init__(self, fast_lm, accurate_lm):
        super().__init__()
        self.fast_lm = fast_lm
        self.accurate_lm = accurate_lm
        
        # Signature pour la cat√©gorie
        self.category_signature = CategoryClassifier
        
        # Signature pour la priorit√©
        self.priority_signature = PriorityClassifier
    
    def forward(self, ticket):
        # √âtape 1: Cat√©gorisation avec le mod√®le rapide
        with dspy.settings.context(lm=self.fast_lm):
            category_predictor = dspy.ChainOfThought(self.category_signature)
            category_result = category_predictor(ticket=ticket)
        
        # √âtape 2: Priorisation avec le mod√®le pr√©cis
        with dspy.settings.context(lm=self.accurate_lm):
            priority_predictor = dspy.ChainOfThought(self.priority_signature)
            priority_result = priority_predictor(
                ticket=ticket,
                category=category_result.category
            )
        
        return dspy.Prediction(
            category=category_result.category,
            priority=priority_result.priority
        )

print("‚úÖ Classe HybridTicketClassifier d√©finie")

### Tester le classifier hybride

In [None]:
print("üîÄ Test du classifier hybride")
print("   Mod√®le rapide (cat√©gorie): mistral:7b")
print("   Mod√®le pr√©cis (priorit√©): llama3.1:8b\n")

# Cr√©er le classifier hybride
hybrid_classifier = HybridTicketClassifier(
    fast_lm=lm_ollama_mistral,      # Rapide pour la cat√©gorie
    accurate_lm=lm_ollama_llama     # Pr√©cis pour la priorit√©
)

# Configurer DSPy (requis pour l'ex√©cution)
dspy.configure(lm=lm_ollama_llama)

# Tester sur quelques exemples
print("üìù Exemples de pr√©dictions:\n")

test_tickets = [
    "Mon ordinateur portable ne d√©marre plus, j'ai une pr√©sentation importante dans 2 heures",
    "Je voudrais acc√®s au VPN pour le t√©l√©travail quand c'est possible",
    "Toutes les imprimantes de l'√©tage sont hors ligne"
]

for i, ticket in enumerate(test_tickets, 1):
    result = hybrid_classifier(ticket=ticket)
    print(f"{i}. Ticket: {ticket[:60]}...")
    print(f"   ‚Üí Cat√©gorie: {result.category} | Priorit√©: {result.priority}\n")

# √âvaluer sur l'ensemble de validation
print("üìä √âvaluation sur l'ensemble de validation:")
score_hybrid = evaluate_module(hybrid_classifier, val_examples, exact_match_metric)
print(f"   Score: {score_hybrid:.2%}")

## 5.5 Guide de s√©lection de mod√®les

### Crit√®res de s√©lection

| Crit√®re | Ollama (local) | OpenAI | Anthropic |
|---------|---------------|--------|-----------|
| **Co√ªt** | Gratuit (mat√©riel local) | Payant √† l'usage | Payant √† l'usage |
| **Vitesse** | D√©pend du mat√©riel | Rapide (API cloud) | Rapide (API cloud) |
| **Confidentialit√©** | ‚úÖ 100% local | ‚ö†Ô∏è Donn√©es envoy√©es √† OpenAI | ‚ö†Ô∏è Donn√©es envoy√©es √† Anthropic |
| **Qualit√©** | Bonne (7-8B params) | Excellente | Excellente |
| **Disponibilit√©** | N√©cessite installation | API toujours disponible | API toujours disponible |
| **Latence** | Faible (local) | Moyenne (r√©seau) | Moyenne (r√©seau) |

### Recommandations par cas d'usage

#### 1. D√©veloppement et prototypage
**Choix recommand√©** : Ollama (llama3.1:8b ou qwen2.5:7b)
- ‚úÖ Gratuit, it√©rations rapides
- ‚úÖ Pas de limite de requ√™tes
- ‚úÖ Confidentialit√© des donn√©es

#### 2. Production √† faible volume (<1000 requ√™tes/jour)
**Choix recommand√©** : OpenAI (gpt-4o-mini) ou Anthropic (claude-3-5-haiku)
- ‚úÖ Co√ªts acceptables
- ‚úÖ Haute disponibilit√©
- ‚úÖ Excellente qualit√©

#### 3. Production √† haut volume (>10000 requ√™tes/jour)
**Choix recommand√©** : Architecture hybride
- Ollama pour les t√¢ches simples (cat√©gorisation)
- API payante pour les t√¢ches critiques (priorisation)
- ‚úÖ Optimisation du rapport co√ªt/performance

#### 4. Donn√©es sensibles (sant√©, finance, etc.)
**Choix recommand√©** : Ollama uniquement
- ‚úÖ Aucune donn√©e ne quitte votre infrastructure
- ‚úÖ Conformit√© RGPD/HIPAA facilit√©e

#### 5. Recherche et exp√©rimentation
**Choix recommand√©** : Tous les mod√®les
- Tester plusieurs mod√®les pour trouver le meilleur
- Utiliser Ollama pour les it√©rations rapides
- Valider avec des mod√®les API avant production

## 5.6 R√©sum√© de la Partie 5

### Ce que nous avons appris

1. **Abstraction DSPy** : Un seul code fonctionne avec tous les fournisseurs LLM
   
2. **Configuration de fournisseurs** :
   - **Ollama** : Local, gratuit, confidentialit√© maximale
   - **OpenAI** : API cloud, haute qualit√©, payant
   - **Anthropic** : API cloud, excellente qualit√©, payant

3. **Comparaison de mod√®les** :
   - Fonction de benchmarking pour comparer performances
   - Mesure du score ET du temps d'ex√©cution
   - Aide √† la d√©cision data-driven

4. **Architectures hybrides** :
   - Diff√©rents mod√®les pour diff√©rentes t√¢ches
   - Optimisation co√ªt/performance/vitesse
   - Utilisation de `dspy.settings.context(lm=...)`

5. **Guide de s√©lection** :
   - Crit√®res : co√ªt, vitesse, confidentialit√©, qualit√©
   - Recommandations par cas d'usage
   - Strat√©gies adapt√©es au contexte

### Points cl√©s √† retenir

- ‚úÖ **Flexibilit√©** : Changer de mod√®le ne n√©cessite que quelques lignes de code
- ‚úÖ **Exp√©rimentation** : Tester plusieurs mod√®les est facile et recommand√©
- ‚úÖ **Optimisation** : Architectures hybrides pour le meilleur rapport co√ªt/performance
- ‚úÖ **Confidentialit√©** : Ollama pour les donn√©es sensibles
- ‚úÖ **√âvolutivit√©** : Commencer avec Ollama, migrer vers API si n√©cessaire

### Exemple de workflow recommand√©

```python
# 1. D√©veloppement avec Ollama (gratuit, rapide)
lm_dev = dspy.LM('ollama_chat/llama3.1:8b', api_base='http://localhost:11434')
dspy.configure(lm=lm_dev)

# 2. Test avec plusieurs mod√®les
models = [lm_ollama_llama, lm_ollama_qwen, lm_openai_mini]
results = [benchmark_model(lm, name, valset, metric) for lm, name in models]

# 3. Production avec le meilleur mod√®le ou architecture hybride
lm_prod = best_model  # Ou HybridTicketClassifier(fast_lm, accurate_lm)
```

### Prochaines √©tapes

- **Partie 6** : Patterns avanc√©s (optionnel - validation, retry, fallback)
- **Partie 7** : GEPA en pratique (optimisation sophistiqu√©e)