# Partie 3 : Les modules DSPy

In [5]:
import dspy
import warnings
warnings.filterwarnings('ignore')

# Configurer le mod√®le de langage
lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)

# Configurer DSPy globalement
dspy.configure(lm=lm)

# Tester la configuration
response = lm("Bonjour, √ßa fonctionne ?")
print(response)

["Bonjour ! Oui, tout semble fonctionner correctement. Comment puis-je vous aider aujourd'hui ?"]


In [6]:
# Cat√©gories et priorit√©s possibles
CATEGORIES = ["Hardware", "Software", "Network", "Application", "Infrastructure", "Account", "Email", "Peripherals"]
PRIORITIES = ["Low", "Medium", "High", "Urgent", "Critical"]

class TicketClassifier(dspy.Signature):
    """Classifier un ticket de support IT selon sa cat√©gorie et sa priorit√©."""
    
    ticket = dspy.InputField(desc="Description du ticket de support IT")
    category = dspy.OutputField(desc=f"Cat√©gorie parmi: {', '.join(CATEGORIES)}")
    priority = dspy.OutputField(desc=f"Priorit√© parmi: {', '.join(PRIORITIES)}")

## Qu'est-ce qu'un module ?

Un **module** dans DSPy est un composant qui **utilise une signature** pour g√©n√©rer des pr√©dictions.

### Analogie
- **Signature** = Le contrat ("je te donne X, tu me donnes Y")
- **Module** = L'employ√© qui ex√©cute le contrat (avec sa propre m√©thode de travail)

### Les diff√©rents types de modules

DSPy offre plusieurs modules, chacun avec une strat√©gie diff√©rente :

1. **Predict** : G√©n√©ration directe (le plus simple)
2. **ChainOfThought** : Raisonnement avant de r√©pondre
3. **ReAct** : Raisonnement avec actions possibles
4. **ProgramOfThought** : G√©n√©ration de code pour raisonner
5. **Modules personnalis√©s** : Composition de plusieurs modules

## Module 1 : Predict (le plus simple)

**Predict** est le module de base : il g√©n√®re directement une r√©ponse.

### Fonctionnement
1. Re√ßoit les entr√©es
2. G√©n√®re imm√©diatement les sorties
3. Retourne le r√©sultat

### Quand l'utiliser
- T√¢ches simples
- Besoin de rapidit√©
- Premi√®re version d'un syst√®me

In [7]:
# Cr√©er un module Predict avec notre signature
predict_classifier = dspy.Predict(TicketClassifier)

# Tester sur un exemple
test_ticket = "Mon ordinateur ne d√©marre plus. J'ai une pr√©sentation dans 1 heure."
result = predict_classifier(ticket=test_ticket)

print("üîÆ Module : Predict")
print(f"üìù Ticket : {test_ticket}")
print(f"üì¶ Cat√©gorie pr√©dite : {result.category}")
print(f"‚ö° Priorit√© pr√©dite : {result.priority}")

üîÆ Module : Predict
üìù Ticket : Mon ordinateur ne d√©marre plus. J'ai une pr√©sentation dans 1 heure.
üì¶ Cat√©gorie pr√©dite : Hardware
‚ö° Priorit√© pr√©dite : Urgent


## Module 2 : ChainOfThought (avec raisonnement)

**ChainOfThought** demande au mod√®le de raisonner avant de r√©pondre.

### Fonctionnement
1. Re√ßoit les entr√©es
2. **G√©n√®re d'abord un raisonnement**
3. G√©n√®re ensuite les sorties bas√©es sur ce raisonnement
4. Retourne le r√©sultat (avec le raisonnement)

### Quand l'utiliser
- T√¢ches complexes n√©cessitant de la r√©flexion
- Besoin d'expliquer les d√©cisions
- Am√©liorer la pr√©cision (+5-15% typiquement)

### Avantages
- ‚úÖ Meilleure pr√©cision
- ‚úÖ Raisonnement inspectable
- ‚úÖ Plus robuste sur des cas complexes

In [8]:
# Cr√©er un module ChainOfThought avec notre signature
cot_classifier = dspy.ChainOfThought(TicketClassifier)

# Tester sur le m√™me exemple
result = cot_classifier(ticket=test_ticket)

print("üß† Module : ChainOfThought")
print(f"üìù Ticket : {test_ticket}")
print(f"üí≠ Raisonnement : {getattr(result, 'rationale', 'non disponible')}")
print(f"üì¶ Cat√©gorie pr√©dite : {result.category}")
print(f"‚ö° Priorit√© pr√©dite : {result.priority}")

üß† Module : ChainOfThought
üìù Ticket : Mon ordinateur ne d√©marre plus. J'ai une pr√©sentation dans 1 heure.
üí≠ Raisonnement : non disponible
üì¶ Cat√©gorie pr√©dite : Hardware
‚ö° Priorit√© pr√©dite : High


### Comparaison Predict vs ChainOfThought

Testons les deux modules sur plusieurs exemples pour voir la diff√©rence.

In [9]:
# Donn√©es de validation
valset = [
    {"ticket": "Le serveur de fichiers est inaccessible. Personne ne peut travailler.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "J'ai besoin d'acc√®s au dossier comptabilit√© pour l'audit. C'est urgent.", "category": "Account", "priority": "Urgent"},
    {"ticket": "L'√©cran de mon coll√®gue en vacances clignote. On peut attendre.", "category": "Hardware", "priority": "Low"},
    {"ticket": "Le CRM plante quand j'essaie d'exporter les contacts.", "category": "Application", "priority": "High"},
    {"ticket": "Je voudrais changer ma photo de profil quand vous aurez un moment.", "category": "Account", "priority": "Low"},
    {"ticket": "La vid√©oconf√©rence ne fonctionne pas. R√©union avec New York dans 10 minutes!", "category": "Application", "priority": "Critical"},
    {"ticket": "Mon antivirus affiche un message d'expiration mais tout fonctionne.", "category": "Software", "priority": "Medium"}
]

# Tester sur 3 exemples
test_cases = valset[:3]

print("="*70)
print("Comparaison Predict vs ChainOfThought")
print("="*70 + "\n")

for i, example in enumerate(test_cases, 1):
    print(f"--- Exemple {i} ---")
    print(f"Ticket : {example['ticket']}")
    print(f"Attendu : {example['category']} | {example['priority']}\n")
    
    # Predict
    pred_result = predict_classifier(ticket=example['ticket'])
    print(f"  Predict : {pred_result.category} | {pred_result.priority}")
    
    # ChainOfThought
    cot_result = cot_classifier(ticket=example['ticket'])
    print(f"  ChainOfThought : {cot_result.category} | {cot_result.priority}")
    print()

Comparaison Predict vs ChainOfThought

--- Exemple 1 ---
Ticket : Le serveur de fichiers est inaccessible. Personne ne peut travailler.
Attendu : Infrastructure | Critical

  Predict : Infrastructure | High
  ChainOfThought : Infrastructure | High

--- Exemple 2 ---
Ticket : J'ai besoin d'acc√®s au dossier comptabilit√© pour l'audit. C'est urgent.
Attendu : Account | Urgent

  Predict : Account | Urgent
  ChainOfThought : Account | Urgent

--- Exemple 3 ---
Ticket : L'√©cran de mon coll√®gue en vacances clignote. On peut attendre.
Attendu : Hardware | Low

  Predict : Hardware | Low
  ChainOfThought : Hardware | Low



## Module 3 : ReAct (raisonnement + actions)

**ReAct** alterne entre raisonnement et actions. C'est un module qui permet au mod√®le d'interagir avec des outils externes pour r√©soudre des probl√®mes.

### Fonctionnement

1. **Raisonne** sur le probl√®me
2. **D√©cide** d'une action √† faire (ex: chercher dans une base de donn√©es)
3. **Observe** le r√©sultat de l'action
4. **Raisonne** √† nouveau avec cette nouvelle information
5. **R√©p√®te** jusqu'√† avoir la r√©ponse

### Quand l'utiliser

- Besoin d'interactions avec des outils externes
- Recherche d'informations n√©cessaire
- T√¢ches multi-√©tapes n√©cessitant des actions

### Note importante

ReAct n√©cessite de d√©finir des **outils** (fonctions) que le mod√®le peut appeler. Le mod√®le d√©cide quand et comment utiliser ces outils.

### Exemple : ReAct avec base de donn√©es de tickets

Simulons une base de donn√©es de tickets historiques pour d√©montrer ReAct.

In [None]:
# Base de donn√©es simul√©e de tickets similaires
ticket_database = {
    "hardware_boot": [
        {"ticket": "PC ne d√©marre pas", "solution": "V√©rifier l'alimentation", "resolution_time": "2h"},
        {"ticket": "Ordinateur bloqu√© au d√©marrage", "solution": "Mode sans √©chec + r√©paration", "resolution_time": "1h"}
    ],
    "network_vpn": [
        {"ticket": "VPN instable", "solution": "Mise √† jour client VPN", "resolution_time": "30min"},
        {"ticket": "D√©connexions VPN fr√©quentes", "solution": "Changer serveur VPN", "resolution_time": "15min"}
    ],
    "printer": [
        {"ticket": "Imprimante hors ligne", "solution": "Red√©marrer spooler d'impression", "resolution_time": "10min"},
        {"ticket": "Impression bloqu√©e", "solution": "Vider file d'attente", "resolution_time": "5min"}
    ]
}

# D√©finir les outils que ReAct peut utiliser
def search_similar_tickets(category: str) -> str:
    """Cherche des tickets similaires dans la base de donn√©es."""
    category_map = {
        "Hardware": "hardware_boot",
        "Network": "network_vpn",
        "Peripherals": "printer"
    }
    
    key = category_map.get(category, None)
    if key and key in ticket_database:
        tickets = ticket_database[key]
        result = f"Tickets similaires trouv√©s ({len(tickets)}):\n"
        for i, ticket in enumerate(tickets, 1):
            result += f"{i}. {ticket['ticket']} ‚Üí {ticket['solution']} (r√©solu en {ticket['resolution_time']})\n"
        return result
    return "Aucun ticket similaire trouv√©."

# Test de l'outil
print("üîß Outil : search_similar_tickets")
print("\nTest avec cat√©gorie 'Hardware':")
print(search_similar_tickets("Hardware"))

In [None]:
# Cr√©er un module ReAct avec outils
# Note: ReAct dans DSPy n√©cessite une configuration sp√©ciale avec les outils
# Voici une d√©monstration conceptuelle

class TicketWithContext(dspy.Signature):
    """Classifier un ticket IT en utilisant des informations contextuelles."""
    ticket = dspy.InputField(desc="Description du ticket")
    similar_tickets = dspy.InputField(desc="Tickets similaires de la base de donn√©es")
    category = dspy.OutputField(desc=f"Cat√©gorie parmi: {', '.join(CATEGORIES)}")
    priority = dspy.OutputField(desc=f"Priorit√© parmi: {', '.join(PRIORITIES)}")
    suggested_solution = dspy.OutputField(desc="Solution sugg√©r√©e bas√©e sur les tickets similaires")

# Simuler un workflow ReAct manuel
def react_workflow(ticket_description):
    """Simule un workflow ReAct : Raisonne ‚Üí Agit ‚Üí Observe ‚Üí R√©p√®te"""
    
    print("üîÑ WORKFLOW REACT")
    print("="*70)
    
    # √âtape 1 : Raisonnement initial
    print("\n1Ô∏è‚É£ RAISONNEMENT : Analyser le ticket pour identifier la cat√©gorie")
    classifier = dspy.Predict(TicketClassifier)
    initial_result = classifier(ticket=ticket_description)
    print(f"   ‚Üí Cat√©gorie identifi√©e : {initial_result.category}")
    
    # √âtape 2 : Action - Chercher des tickets similaires
    print("\n2Ô∏è‚É£ ACTION : Chercher des tickets similaires dans la base")
    similar = search_similar_tickets(initial_result.category)
    print(f"   ‚Üí {similar.split(chr(10))[0]}")  # Premi√®re ligne du r√©sultat
    
    # √âtape 3 : Observation - Analyser les r√©sultats
    print("\n3Ô∏è‚É£ OBSERVATION : Utiliser les tickets similaires pour affiner la r√©ponse")
    enhanced_classifier = dspy.ChainOfThought(TicketWithContext)
    final_result = enhanced_classifier(
        ticket=ticket_description,
        similar_tickets=similar
    )
    
    # √âtape 4 : R√©ponse finale
    print("\n4Ô∏è‚É£ R√âSULTAT FINAL")
    print(f"   üì¶ Cat√©gorie : {final_result.category}")
    print(f"   ‚ö° Priorit√© : {final_result.priority}")
    print(f"   üí° Solution sugg√©r√©e : {final_result.suggested_solution}")
    
    return final_result

# Tester le workflow ReAct
test_ticket_react = "Mon ordinateur portable ne s'allume plus du tout."
result = react_workflow(test_ticket_react)

## Module 4 : ProgramOfThought (g√©n√©ration de code)

**ProgramOfThought** g√©n√®re du code Python pour raisonner sur des probl√®mes complexes, particuli√®rement utile pour les calculs et la manipulation de donn√©es.

### Fonctionnement

1. **Analyse** le probl√®me
2. **G√©n√®re** du code Python pour le r√©soudre
3. **Ex√©cute** le code
4. **Utilise** le r√©sultat pour g√©n√©rer la r√©ponse finale

### Quand l'utiliser

- Probl√®mes math√©matiques
- Calculs complexes
- Manipulation de donn√©es structur√©es
- T√¢ches n√©cessitant une logique pr√©cise

### ‚ö†Ô∏è Note importante sur cet exemple

L'exemple ci-dessous est une **simulation p√©dagogique** pour illustrer le concept de ProgramOfThought. Le code est cod√© en dur plut√¥t que g√©n√©r√© dynamiquement par le mod√®le.

**Pourquoi une simulation ?**
- ProgramOfThought n√©cessite un environnement d'ex√©cution Python s√©curis√©
- La configuration est plus complexe que les autres modules
- Cela permet de comprendre le concept sans les d√©tails techniques

**Utilisation r√©elle de `dspy.ProgramOfThought` :**

Pour utiliser le vrai module, vous devriez :
1. D√©finir une signature avec un champ de sortie pour le code
2. Utiliser `dspy.ProgramOfThought(Signature)` ou `dspy.TypedPredictor`
3. Configurer un environnement d'ex√©cution s√©curis√© (sandbox)
4. Le mod√®le g√©n√®re alors automatiquement le code

Cette approche n√©cessite des consid√©rations de s√©curit√© importantes (injection de code, acc√®s aux ressources, etc.) qui d√©passent le cadre de ce tutoriel d'introduction.

### Exemple : Simulation du concept

Voyons comment ProgramOfThought analyserait des statistiques de tickets.

In [None]:
# ‚ö†Ô∏è SIMULATION P√âDAGOGIQUE ‚ö†Ô∏è
# Ce code simule le comportement de ProgramOfThought
# Le code est cod√© en dur pour illustrer le concept, 
# plut√¥t que g√©n√©r√© dynamiquement par le mod√®le

class TicketStats(dspy.Signature):
    """Calculer des statistiques sur les temps de r√©solution de tickets."""
    ticket_data = dspy.InputField(desc="Donn√©es des tickets avec temps de r√©solution")
    question = dspy.InputField(desc="Question statistique √† r√©pondre")
    code = dspy.OutputField(desc="Code Python pour calculer la r√©ponse")
    answer = dspy.OutputField(desc="R√©ponse √† la question")

def simulate_program_of_thought():
    """
    Simule comment ProgramOfThought fonctionnerait.
    
    Dans la vraie utilisation :
    - Le mod√®le recevrait ticket_data et question
    - Il g√©n√©rerait automatiquement le code Python
    - Le code serait ex√©cut√© dans un environnement s√©curis√©
    - Le r√©sultat serait retourn√© comme r√©ponse
    """
    
    # Donn√©es de tickets avec temps de r√©solution (en minutes)
    tickets_data = """
    Hardware: [120, 60, 90, 45]
    Software: [30, 45, 20, 35]
    Network: [15, 25, 20, 30]
    """
    
    question = "Quelle est la cat√©gorie avec le temps de r√©solution moyen le plus √©lev√© ?"
    
    print("üíª SIMULATION PROGRAM OF THOUGHT")
    print("="*70)
    print(f"\nüìä Donn√©es : {tickets_data.strip()}")
    print(f"‚ùì Question : {question}\n")
    
    # ‚ö†Ô∏è CODE COD√â EN DUR (dans la r√©alit√©, le mod√®le le g√©n√©rerait)
    # Ce que ProgramOfThought g√©n√©rerait automatiquement :
    generated_code = """
tickets = {
    'Hardware': [120, 60, 90, 45],
    'Software': [30, 45, 20, 35],
    'Network': [15, 25, 20, 30]
}

# Calculer la moyenne pour chaque cat√©gorie
averages = {cat: sum(times) / len(times) for cat, times in tickets.items()}

# Trouver la cat√©gorie avec la moyenne la plus √©lev√©e
max_category = max(averages, key=averages.get)
max_average = averages[max_category]

result = f"{max_category} avec {max_average:.1f} minutes en moyenne"
"""
    
    print("üîß Code qui serait g√©n√©r√© par le mod√®le :")
    print("-" * 70)
    print(generated_code)
    print("-" * 70)
    
    # Ex√©cution du code (cette partie serait faite par DSPy)
    print("\n‚ö° Ex√©cution du code...")
    exec_globals = {}
    exec(generated_code, exec_globals)
    result = exec_globals['result']
    
    print(f"‚úÖ R√©sultat : {result}\n")
    
    print("üí° Dans la vraie utilisation de dspy.ProgramOfThought :")
    print("   - Le mod√®le g√©n√®re le code automatiquement")
    print("   - DSPy l'ex√©cute dans un environnement s√©curis√©")
    print("   - Vous obtenez directement le r√©sultat")
    
    return result

# Ex√©cuter la simulation
simulate_program_of_thought()

## Module 5 : Modules personnalis√©s (composition)

Vous pouvez cr√©er vos propres modules en **composant** plusieurs modules existants. C'est l'une des fonctionnalit√©s les plus puissantes de DSPy.

### Pourquoi composer des modules ?

- **D√©composer** une t√¢che complexe en sous-t√¢ches
- **R√©utiliser** des modules existants
- **Cr√©er** des pipelines sophistiqu√©s
- **Am√©liorer** la pr√©cision avec des strat√©gies avanc√©es

### Comment cr√©er un module personnalis√© ?

1. H√©riter de `dspy.Module`
2. Initialiser les sous-modules dans `__init__`
3. D√©finir la logique dans `forward()`
4. Retourner un `dspy.Prediction`

Voyons trois exemples concrets de composition.

### Exemple 1 : Pipeline s√©quentiel

Classifier d'abord la cat√©gorie, puis la priorit√© **en fonction** de la cat√©gorie identifi√©e.

**Avantage** : La deuxi√®me √©tape peut utiliser le r√©sultat de la premi√®re pour affiner sa d√©cision.

In [None]:
# D√©finir des signatures sp√©cialis√©es
class CategoryClassifier(dspy.Signature):
    """D√©terminer la cat√©gorie technique d'un ticket IT."""
    ticket = dspy.InputField(desc="Description du ticket")
    category = dspy.OutputField(desc=f"Cat√©gorie parmi: {', '.join(CATEGORIES)}")

class PriorityClassifier(dspy.Signature):
    """D√©terminer la priorit√© d'un ticket en fonction de sa cat√©gorie."""
    ticket = dspy.InputField(desc="Description du ticket")
    category = dspy.InputField(desc="Cat√©gorie technique d√©j√† identifi√©e")
    priority = dspy.OutputField(desc=f"Priorit√© parmi: {', '.join(PRIORITIES)}")


# Cr√©er un module compos√© avec pipeline s√©quentiel
class SequentialClassifier(dspy.Module):
    def __init__(self):
        super().__init__()
        # Initialiser les sous-modules
        self.category_predictor = dspy.ChainOfThought(CategoryClassifier)
        self.priority_predictor = dspy.ChainOfThought(PriorityClassifier)

    def forward(self, ticket):
        # √âtape 1 : Pr√©dire la cat√©gorie
        category_result = self.category_predictor(ticket=ticket)

        # √âtape 2 : Pr√©dire la priorit√© en utilisant la cat√©gorie
        priority_result = self.priority_predictor(
            ticket=ticket,
            category=category_result.category
        )

        # Retourner les r√©sultats combin√©s
        return dspy.Prediction(
            category=category_result.category,
            priority=priority_result.priority
        )


# Tester le module compos√©
sequential = SequentialClassifier()
result = sequential(ticket=test_ticket)

print("üîó Module compos√© : SequentialClassifier")
print(f"üìù Ticket : {test_ticket}")
print(f"üì¶ Cat√©gorie (√©tape 1) : {result.category}")
print(f"‚ö° Priorit√© (√©tape 2, bas√©e sur cat√©gorie) : {result.priority}")

### Exemple 2 : Module avec validation

Ajouter une √©tape de validation pour v√©rifier que les pr√©dictions sont valides et les corriger si n√©cessaire.

**Avantage** : Garantit que les sorties respectent toujours les contraintes d√©finies.

In [None]:
# Cr√©er un module avec validation
class ValidatedClassifier(dspy.Module):
    def __init__(self):
        super().__init__()
        self.classifier = dspy.ChainOfThought(TicketClassifier)
    
    def forward(self, ticket):
        # Pr√©diction
        result = self.classifier(ticket=ticket)
        
        # Validation de la cat√©gorie
        if result.category not in CATEGORIES:
            print(f"‚ö†Ô∏è  Cat√©gorie invalide '{result.category}', correction...")
            result.category = "Application"  # Valeur par d√©faut
        
        # Validation de la priorit√©
        if result.priority not in PRIORITIES:
            print(f"‚ö†Ô∏è  Priorit√© invalide '{result.priority}', correction...")
            result.priority = "Medium"  # Valeur par d√©faut
        
        return result

# Tester le module avec validation
validated = ValidatedClassifier()
result = validated(ticket=test_ticket)

print("\n‚úÖ Module avec validation : ValidatedClassifier")
print(f"üì¶ Cat√©gorie valid√©e : {result.category}")
print(f"‚ö° Priorit√© valid√©e : {result.priority}")

### Exemple 3 : Module avec consensus (ensemble)

Utiliser plusieurs modules et combiner leurs pr√©dictions par vote majoritaire.

**Avantage** : Am√©liore la robustesse en r√©duisant les erreurs al√©atoires. Typiquement +3-10% de pr√©cision.

In [None]:
# Cr√©er un module avec consensus (ensemble)
class EnsembleClassifier(dspy.Module):
    def __init__(self):
        super().__init__()
        # Cr√©er plusieurs classifieurs
        self.classifiers = [
            dspy.Predict(TicketClassifier),
            dspy.ChainOfThought(TicketClassifier),
            dspy.ChainOfThought(TicketClassifier)  # 2x ChainOfThought pour plus de poids
        ]

    def forward(self, ticket):
        # Obtenir les pr√©dictions de tous les classifieurs
        predictions = [clf(ticket=ticket) for clf in self.classifiers]

        # Vote majoritaire pour la cat√©gorie
        categories = [p.category for p in predictions]
        category = max(set(categories), key=categories.count)

        # Vote majoritaire pour la priorit√©
        priorities = [p.priority for p in predictions]
        priority = max(set(priorities), key=priorities.count)

        return dspy.Prediction(
            category=category, 
            priority=priority,
            votes={"categories": categories, "priorities": priorities}
        )


# Tester le module avec consensus
ensemble = EnsembleClassifier()
result = ensemble(ticket=test_ticket)

print("üó≥Ô∏è  Module avec consensus : EnsembleClassifier")
print(f"üìù Ticket : {test_ticket}")
print(f"\nüìä Votes pour la cat√©gorie : {result.votes['categories']}")
print(f"üì¶ Cat√©gorie consensus : {result.category}")
print(f"\nüìä Votes pour la priorit√© : {result.votes['priorities']}")
print(f"‚ö° Priorit√© consensus : {result.priority}")

## Bonnes pratiques pour les modules

Pour tirer le meilleur parti des modules DSPy, suivez ces recommandations issues de l'exp√©rience pratique.

### ‚úÖ √Ä faire

1. **Commencer simple** : Utilisez d'abord `Predict`, puis `ChainOfThought` si n√©cessaire
   - Mesurez l'impact avant de complexifier
   - ChainOfThought co√ªte environ 2x plus cher en tokens

2. **Nommer clairement** : `TicketClassifier` plut√¥t que `Classifier1`
   - Les noms explicites facilitent la maintenance
   - Documentez l'intention de chaque module

3. **Un module = une t√¢che** : Gardez les modules focalis√©s
   - Respectez le principe de responsabilit√© unique
   - Facilitez les tests et le d√©bogage

4. **Composer progressivement** : Testez chaque module individuellement
   - Validez chaque composant avant l'int√©gration
   - Utilisez `inspect_history()` pour v√©rifier

5. **Documenter** : Ajoutez des docstrings √† vos modules personnalis√©s
   - Expliquez le "pourquoi" de la composition
   - Documentez les d√©pendances entre modules

### ‚ùå √Ä √©viter

1. **Utiliser ChainOfThought partout**
   - Plus lent (~2x)
   - Plus co√ªteux en tokens (~2x)
   - Utilisez-le seulement quand la r√©flexion est n√©cessaire

2. **Trop de composition**
   - Gardez les pipelines compr√©hensibles (max 3-4 √©tapes)
   - Au-del√†, envisagez de refactoriser

3. **Oublier la validation**
   - V√©rifiez toujours les sorties contre vos contraintes
   - Ajoutez des assertions dans vos modules personnalis√©s

4. **Ne pas mesurer**
   - Utilisez des m√©triques pour comparer les modules
   - Mesurez latence, co√ªt et pr√©cision
   - Documentez les compromis

### üìä Comparaison r√©capitulative

| Module | Complexit√© | Co√ªt (tokens) | Pr√©cision | Cas d'usage |
|--------|-----------|---------------|-----------|-------------|
| **Predict** | ‚≠ê | 1x | Baseline | T√¢ches simples, prototypes |
| **ChainOfThought** | ‚≠ê‚≠ê | ~2x | +5-15% | Raisonnement requis |
| **ReAct** | ‚≠ê‚≠ê‚≠ê | ~3-5x | +10-20% | Avec outils/actions |
| **ProgramOfThought** | ‚≠ê‚≠ê‚≠ê | ~2-3x | +15-25% | Calculs, logique pr√©cise |
| **Modules compos√©s** | ‚≠ê‚≠ê‚≠ê‚≠ê | Variable | Variable | Pipelines complexes |

### üí° Conseil final

Commencez toujours par la solution la plus simple qui pourrait fonctionner. DSPy est con√ßu pour vous permettre d'it√©rer rapidement :

1. Prototype avec `Predict`
2. Mesurez la performance de base
3. Ajoutez de la complexit√© si n√©cessaire
4. Optimisez avec les techniques avanc√©es (voir notebooks suivants)

La vraie puissance de DSPy vient de sa capacit√© √† **optimiser automatiquement** vos modules, ce que nous verrons dans les prochaines parties du tutoriel.

## Inspecter et d√©boguer les modules

Lorsque vous travaillez avec des modules DSPy, il est souvent utile de voir **exactement ce qui est envoy√© au mod√®le de langage**. C'est l√† qu'intervient `dspy.inspect_history()`.

### Pourquoi inspecter l'historique ?

- üîç **Comprendre** ce que fait r√©ellement chaque module sous le capot
- üêõ **D√©boguer** quand les r√©sultats ne sont pas ceux attendus
- üìä **Comparer** les prompts g√©n√©r√©s par diff√©rents modules
- üéì **Apprendre** comment DSPy construit ses prompts

### Utilisation de base

`dspy.inspect_history(n=3)` affiche les `n` derniers appels au mod√®le de langage, avec :
- Les **prompts** envoy√©s au mod√®le
- Les **r√©ponses** re√ßues du mod√®le
- Les **m√©tadonn√©es** (temp√©rature, mod√®le utilis√©, etc.)

In [None]:
# Reconfigurer avec llama3.1 pour les exemples suivants
lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)
dspy.configure(lm=lm)

# Faire quelques appels pour avoir de l'historique
predict_classifier = dspy.Predict(TicketClassifier)
cot_classifier = dspy.ChainOfThought(TicketClassifier)

# Appel 1 : Predict
ticket1 = "L'imprimante du 3√®me √©tage ne fonctionne plus."
result1 = predict_classifier(ticket=ticket1)

# Appel 2 : ChainOfThought
ticket2 = "Le VPN se d√©connecte toutes les 5 minutes. J'ai un deadline ce soir."
result2 = cot_classifier(ticket=ticket2)

print("‚úÖ Deux appels effectu√©s (Predict + ChainOfThought)")
print("   Utilisez dspy.inspect_history() pour voir les d√©tails")

In [None]:
# Inspecter les 2 derniers appels
dspy.inspect_history(n=2)

### Que voyons-nous dans l'historique ?

Pour chaque appel, `inspect_history()` affiche :

1. **Le prompt syst√®me** : Instructions donn√©es au mod√®le
2. **Le prompt utilisateur** : Les donn√©es d'entr√©e format√©es
3. **La r√©ponse** : Ce que le mod√®le a g√©n√©r√©
4. **Les m√©tadonn√©es** : Temp√©rature, mod√®le, tokens utilis√©s

### Diff√©rences cl√©s entre Predict et ChainOfThought

En inspectant l'historique, vous remarquerez que :

**Predict** :
- Prompt direct : "Voici le ticket, donne-moi cat√©gorie et priorit√©"
- Pas de champ de raisonnement dans le prompt
- R√©ponse imm√©diate

**ChainOfThought** :
- Prompt enrichi : Demande d'abord un raisonnement
- Champ `rationale` ajout√© dans le prompt
- Le mod√®le doit d'abord expliquer sa r√©flexion
- Puis g√©n√©rer la r√©ponse finale

### Cas d'usage pratiques

`dspy.inspect_history()` est particuli√®rement utile pour :

- **Optimisation** : Comprendre comment ajuster vos signatures
- **D√©bogage** : Identifier pourquoi un module donne de mauvais r√©sultats
- **Formation** : Voir comment les modules transforment vos signatures en prompts
- **Comparaison** : √âvaluer l'impact de diff√©rents modules sur le m√™me probl√®me

In [None]:
# Acc√©der programmatiquement √† l'historique pour comparaison
history = lm.history

print("="*70)
print("Comparaison des prompts : Predict vs ChainOfThought")
print("="*70 + "\n")

if len(history) >= 2:
    # Premier appel (Predict)
    print("üîÆ PREDICT")
    print("-" * 70)
    predict_call = history[-2]
    print(f"Messages envoy√©s : {len(predict_call['messages'])} message(s)")
    print(f"Ticket : {ticket1}")
    print(f"R√©sultat : {result1.category} | {result1.priority}\n")
    
    # Deuxi√®me appel (ChainOfThought)
    print("üß† CHAINOFTHOUGHT")
    print("-" * 70)
    cot_call = history[-1]
    print(f"Messages envoy√©s : {len(cot_call['messages'])} message(s)")
    print(f"Ticket : {ticket2}")
    print(f"R√©sultat : {result2.category} | {result2.priority}")
    
    # V√©rifier si ChainOfThought a g√©n√©r√© un raisonnement
    if hasattr(result2, 'rationale'):
        print(f"Raisonnement : {result2.rationale}")
else:
    print("‚ö†Ô∏è Historique insuffisant. Ex√©cutez d'abord les cellules pr√©c√©dentes.")

## Ce qu'est `/no_think`

Certains mod√®les ont une capacit√© unique de basculer entre un mode "thinking" (pour le raisonnement logique complexe) et un mode "non-thinking" (pour le dialogue g√©n√©ral efficace).

Par exemple, Qwen3 g√©n√®re par d√©faut du contenu de r√©flexion envelopp√© dans un bloc `<think>...</think>`, suivi de la r√©ponse finale.

Pour contr√¥ler le mode thinking dans Qwen3, une [suggestion sur Discord](https://discord.com/channels/1161519468141355160/1424016693390217299/1426772883903873177) propose d'ajouter un champ d'entr√©e dans la signature DSPy.

In [11]:
import dspy
import warnings
warnings.filterwarnings('ignore')

# Configurer le mod√®le de langage
lm = dspy.LM(
    model='ollama_chat/qwen3:latest',
    api_base='http://localhost:11434',
    temperature=0.3
)

# Configurer DSPy globalement
dspy.configure(lm=lm)

In [13]:
# Cr√©er un module Predict avec notre signature
predict_classifier = dspy.Predict(TicketClassifier)

# Tester sur un exemple
test_ticket = "Mon ordinateur ne d√©marre plus. J'ai une pr√©sentation dans 1 heure."
result = predict_classifier(no_think="/no_think", ticket=test_ticket)

print("üîÆ Module : Predict")
print(f"üìù Ticket : {test_ticket}")
print(f"üì¶ Cat√©gorie pr√©dite : {result.category}")
print(f"‚ö° Priorit√© pr√©dite : {result.priority}")

üîÆ Module : Predict
üìù Ticket : Mon ordinateur ne d√©marre plus. J'ai une pr√©sentation dans 1 heure.
üì¶ Cat√©gorie pr√©dite : Hardware
‚ö° Priorit√© pr√©dite : High


## R√©capitulatif

Dans ce notebook, nous avons explor√© les **modules DSPy**, les composants qui ex√©cutent vos signatures.

### Ce que vous avez appris

1. **Configuration des mod√®les** : Ollama (local) et Claude (API)
2. **Module Predict** : G√©n√©ration directe, simple et rapide
3. **Module ChainOfThought** : Raisonnement avant r√©ponse
4. **Module ReAct** : Interaction avec des outils externes
5. **Module ProgramOfThought** : G√©n√©ration de code pour calculs
6. **Modules personnalis√©s** : Composition pour pipelines complexes
7. **Inspection et d√©bogage** : `dspy.inspect_history()`
8. **Bonnes pratiques** : Comment choisir et utiliser les modules

### Points cl√©s √† retenir

- Les modules transforment vos **signatures** en **prompts optimis√©s**
- Commencez simple (`Predict`) et complexifiez au besoin
- La composition permet de r√©soudre des probl√®mes complexes
- Toujours mesurer avant d'optimiser
- `inspect_history()` est votre meilleur ami pour d√©boguer

### Prochaines √©tapes

Dans le **notebook 03-evaluation**, nous verrons comment :
- D√©finir des m√©triques pour √©valuer vos modules
- Cr√©er des jeux de donn√©es de validation
- Comparer objectivement diff√©rents modules
- Pr√©parer le terrain pour l'optimisation automatique

Les modules sont puissants, mais leur vraie force se r√©v√®le quand on les √©value et les optimise. C'est ce que nous allons d√©couvrir ensuite ! üöÄ