# Tutoriel DSPy et GEPA : Classification Automatique de Tickets IT

Ce tutoriel complet vous guide de mani√®re progressive √† travers **DSPy** (Declarative Self-improving Language Programs) et **GEPA** (Generalized Error-driven Prompt Augmentation).

## Objectifs d'apprentissage

1. Ma√Ætriser les **Signatures** : d√©finir les entr√©es/sorties de vos t√¢ches
2. Comprendre les **Modules** : les diff√©rents types et comment les composer
3. √âvaluer les performances avec des **m√©triques**
4. Optimiser automatiquement avec les **Optimiseurs**
5. Utiliser diff√©rents **mod√®les de langage** facilement
6. Ma√Ætriser **GEPA** pour l'optimisation avanc√©e

## Pr√©requis

- Python 3.9+
- Ollama install√© et en cours d'ex√©cution
- Un mod√®le t√©l√©charg√© (ex: `ollama pull llama3.1:8b`)

## Structure du tutoriel

1. **Configuration et Donn√©es** - Pr√©parer l'environnement
2. **Les Signatures DSPy** - D√©finir ce que vous voulez faire
3. **Les Modules DSPy** - Comment le faire
4. **L'√âvaluation** - Mesurer les performances
5. **Les Optimiseurs** - Am√©liorer automatiquement
6. **Multi-Mod√®les** - Flexibilit√© entre providers
7. **GEPA en Pratique** - Optimisation avanc√©e

## Configuration initiale

Commen√ßons par installer les d√©pendances et configurer notre environnement.

In [None]:
# Installation des d√©pendances (d√©commentez si n√©cessaire)
# !uv pip install dspy-ai

In [39]:
import dspy
import warnings
warnings.filterwarnings('ignore')

print("‚úÖ Biblioth√®ques import√©es avec succ√®s!")

‚úÖ Biblioth√®ques import√©es avec succ√®s!


### Configuration du mod√®le de langage

Nous utilisons Ollama avec Llama 3.1, un mod√®le open-source qui fonctionne localement.

In [40]:
print("üöÄ Configuration de DSPy avec Ollama...")

# Configurer le mod√®le de langage
lm = dspy.LM(
    model='ollama_chat/llama3.1:8b',
    api_base='http://localhost:11434',
    temperature=0.3
)

# Configurer DSPy globalement
dspy.configure(lm=lm)

print("‚úÖ DSPy configur√© avec Ollama Llama 3.1:8b")

üöÄ Configuration de DSPy avec Ollama...
‚úÖ DSPy configur√© avec Ollama Llama 3.1:8b


### Pr√©paration des donn√©es

Nous travaillons avec des tickets IT en fran√ßais. Chaque ticket contient :
- Une **description** du probl√®me
- Une **cat√©gorie** (Hardware, Software, Network, etc.)
- Une **priorit√©** (Low, Medium, High, Urgent, Critical)

In [1]:
# Donn√©es d'entra√Ænement
trainset = [
    {"ticket": "Mon ordinateur ne d√©marre plus depuis ce matin. J'ai une pr√©sentation importante dans 2 heures.", "category": "Hardware", "priority": "Urgent"},
    {"ticket": "Je n'arrive pas √† me connecter √† l'imprimante du 3e √©tage. √áa peut attendre.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le VPN ne fonctionne plus. Impossible d'acc√©der aux fichiers du serveur.", "category": "Network", "priority": "High"},
    {"ticket": "J'ai oubli√© mon mot de passe Outlook. Je peux utiliser le webmail.", "category": "Account", "priority": "Medium"},
    {"ticket": "Le site web affiche une erreur 500. Les clients ne peuvent plus commander!", "category": "Application", "priority": "Critical"},
    {"ticket": "Ma souris sans fil ne r√©pond plus bien. Les piles sont faibles.", "category": "Peripherals", "priority": "Low"},
    {"ticket": "Le syst√®me de paie ne calcule pas les heures suppl√©mentaires. C'est la fin du mois.", "category": "Application", "priority": "Urgent"},
    {"ticket": "J'aimerais une mise √† jour de mon logiciel Adobe quand vous aurez le temps.", "category": "Software", "priority": "Low"},
    {"ticket": "Le serveur de base de donn√©es est tr√®s lent. Toute la production est impact√©e.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "Je ne re√ßois plus les emails. J'attends des r√©ponses de fournisseurs.", "category": "Email", "priority": "High"},
    {"ticket": "Mon √©cran externe ne s'affiche plus. Je peux travailler sur le laptop.", "category": "Hardware", "priority": "Medium"},
    {"ticket": "Le wifi de la salle A ne fonctionne pas. R√©union avec des externes dans 30 min.", "category": "Network", "priority": "Urgent"},
    {"ticket": "Je voudrais installer Slack pour mieux collaborer avec l'√©quipe.", "category": "Software", "priority": "Medium"},
    {"ticket": "Le syst√®me de sauvegarde a √©chou√© cette nuit selon le rapport.", "category": "Infrastructure", "priority": "High"},
    {"ticket": "Mon clavier a une touche qui colle. C'est g√©rable mais ennuyeux.", "category": "Peripherals", "priority": "Low"}
]

# Donn√©es de validation
valset = [
    {"ticket": "Le serveur de fichiers est inaccessible. Personne ne peut travailler.", "category": "Infrastructure", "priority": "Critical"},
    {"ticket": "J'ai besoin d'acc√®s au dossier comptabilit√© pour l'audit. C'est urgent.", "category": "Account", "priority": "Urgent"},
    {"ticket": "L'√©cran de mon coll√®gue en vacances clignote. On peut attendre.", "category": "Hardware", "priority": "Low"},
    {"ticket": "Le CRM plante quand j'essaie d'exporter les contacts.", "category": "Application", "priority": "High"},
    {"ticket": "Je voudrais changer ma photo de profil quand vous aurez un moment.", "category": "Account", "priority": "Low"},
    {"ticket": "La vid√©oconf√©rence ne fonctionne pas. R√©union avec New York dans 10 minutes!", "category": "Application", "priority": "Critical"},
    {"ticket": "Mon antivirus affiche un message d'expiration mais tout fonctionne.", "category": "Software", "priority": "Medium"}
]

# Cat√©gories et priorit√©s possibles
CATEGORIES = ["Hardware", "Software", "Network", "Application", "Infrastructure", "Account", "Email", "Peripherals"]
PRIORITIES = ["Low", "Medium", "High", "Urgent", "Critical"]

print(f"üìä Donn√©es charg√©es : {len(trainset)} entra√Ænement, {len(valset)} validation")
print(f"üì¶ {len(CATEGORIES)} cat√©gories, {len(PRIORITIES)} priorit√©s")

üìä Donn√©es charg√©es : 15 entra√Ænement, 7 validation
üì¶ 8 cat√©gories, 5 priorit√©s
