# **Détection d'intentions dans les requêtes client**

\newpage
## Table des matières

- [1. Introduction](#introduction)
    - [1.1. Contexte du projet](#11-contexte-du-projet)
    - [1.2. Objectifs du projet](#12-objectifs-du-projet)
    - [1.3. Résumé des étapes du processus](#13-résumé-des-étapes-du-processus)

- [2. Théorie de base](#théorie-de-base)
    - [2.1. Qu'est-ce que la classification de texte ?](#21-quest-ce-que-la-classification-de-texte)
    - [2.2. Modèles pré-entraînés et transfert learning](#22-modèles-pré-entraînés-et-transfert-learning)
    - [2.3. Le modèle BERT pour la classification de texte](#23-le-modèle-bert-pour-la-classification-de-texte)

- [3. Importer les dépendances et préparer l'environnement](#importer-les-paquets-et-préparer-lenvironnement)
    - [3.1. Description des bibliothèques nécessaires](#31-description-des-bibliothèques-nécessaires)
    - [3.2. Installation des dépendances](#32-installation-des-dépendances)
    - [3.3. Importer les dépendances](#33-importer-les-dépendances)
    - [3.4. Configuration de l'appareil](#34-configuration-de-l-appareil)

- [4. Chargement des données](#chargement-des-données)

- [5. Prétraitement des données](#prétraitement-des-données)
    - [5.1 Initialisation du tokenizer](#51-initialisation-du-tokenizer)
    - [5.2 Création d'une classe de jeu de données personnalisée](#52-création-dune-classe-de-jeu-de-données-personnalisée)
    - [5.3. Création des DataLoaders](#53-création-des-dataLoaders)
    - [5.4. Exploration et visualisation des données](#54-Exploration-et-visualisation-des-données)
    - [5.5. Vérification des batchs](#55-vérification-des-batchs)

- [6. Définition du modèle](#définition-du-modèle)
    - [6.1. Choix du modèle BERT](#61-choix-du-modèle-bert)
    - [6.2. Implémentation du modèle](#62-implémentation-du-modèle)

- [7. Configurer l'optimiseur et la fonction de perte](#configurer-loptimiseur-et-la-fonction-de-perte)
    - [7.1. Choix de l'optimiseur (AdamW)](#71-choix-de-loptimiseur-adamw)
    - [7.2. Implémentation de l'optimiseur et du scheduler](#72-implémentation-de-l-optimiseur-et-du-scheduler)

- [8. Définir la fonction d'entraînement](#définir-la-fonction-dentrainement)
    - [8.1. Pourquoi une fonction d'entraînement ?](#81-pourquoi-une-fonction-d-entraînement-?)
    - [8.2. Les bonnes pratiques](#82-les-bonnes-pratiques)
    - [8.3. Implémentation de la fonction d'entraînement](#83-implémentation-de-la-fonction-d-entraînement)

- [9. Définir la fonction d'évaluation](#définir-la-fonction-dévaluation)
    - [9.1. Pourquoi une fonction d'évaluation ?](#91-pourquoi-une-fonction-d-évaluation-?)
    - [9.2. Points clés de la fonction](#92-points-clés-de-la-fonction)
    - [9.3. Implémentation de la fonction d'évaluation](#93-implémentation-de-la-fonction-d-évaluation)

- [10. Exécution de la fonction d'entraînement et de validation](#exécution-de-la-fonction-dentraînement-et-de-validation)

- [11. Évaluation finale sur les données de test](#évaluation-finale-sur-les-données-de-test)
    - [11.1. Objectif](#111-objectif)
    - [11.2. Étapes principales](#112-étapes-principales)
    - [11.3. Implémentation](#113-implémentation)

- [12. Test du modèle avec des données personnalisées](#test-du-modèle-avec-des-données-personnalisées)
    - [12.1. Objectif](#121-objectif)
    - [12.2. Étapes principales](#122-étapes-principales)
    - [12.3. Implémentation](#123-implémentation)

- [13. Conclusion](#conclusion)
    - [13.1. Résumé du projet](#131-résumé-du-projet)
    - [13.2. Performances du modèle](#132-Performances-du-modèle)
    - [13.3. Points forts](#133-Points-forts)
    - [13.4. Limites et pistes d'amélioration](#134-limites-et-pistes-damélioration)
    - [13.5. Conclusion finale](#135-conclusion-finale)


## 1. Introduction

### 1.1. Contexte du projet

Le traitement du langage naturel (NLP) est un domaine de l'intelligence artificielle (IA) qui permet aux machines de comprendre, d'interpréter et de générer du langage humain. Dans le contexte de l'assistance client, il est crucial de traiter rapidement et efficacement les demandes des clients, en particulier lorsqu'elles sont nombreuses et variées. Un modèle de traitement du langage naturel bien conçu peut permettre d'automatiser la classification des demandes d'assistance par intention, ce qui améliore la réactivité et la précision du service client.

Ce projet se concentre sur la création d'un modèle capable de classer les demandes d'assistance client en différentes catégories d'intentions à l'aide d'un modèle pré-entraîné BERT, affiné pour cette tâche spécifique. L'objectif est d'améliorer l'efficacité des systèmes de support automatisés.

### 1.2. Objectifs du projet

L'objectif principal de ce projet est de développer un modèle de classification des intentions des demandes d'assistance client. Ce modèle aura pour but de :
1. **Classifier les demandes d'assistance client** selon leurs intentions (par exemple : question sur un produit, problème de facturation, demande de support technique, etc.).
2. **Améliorer l'efficacité des systèmes d'assistance automatisée**, permettant une réponse plus rapide et plus précise.
3. **Utiliser le modèle pré-entraîné BERT** pour affiner un modèle sur les données spécifiques du projet, tout en réduisant le temps de formation nécessaire grâce au transfert d'apprentissage.

### 1.3. Résumé des étapes du processus

Le processus de développement de ce projet peut être résumé en plusieurs étapes principales :
1. **Importation des paquets et préparation de l'environnement** : Nous avons importé les bibliothèques nécessaires pour construire et entraîner notre modèle.
2. **Chargement des données** : Nous avons chargé le jeu de données et divisé les données en ensembles d'entraînement et de test.
3. **Prétraitement des données** : Nous avons préparé les données en tokenisant le texte et en créant des jeux de données adaptés à l'entraînement.
4. **Définition du modèle** : Nous avons choisi un modèle pré-entraîné BERT et l'avons affiné pour notre tâche de classification.
5. **Entraînement et évaluation du modèle** : Nous avons entraîné le modèle, suivi ses performances pendant l'entraînement, et avons évalué sa précision.
6. **Création de l'interface web** : Enfin, nous avons créé une interface web simple pour permettre aux utilisateurs de tester le modèle avec leurs propres données.


## 2. Concepts de Base et Théories Sous-jacentes

### 2.1. Qu'est-ce que la classification de texte ?



La classification de texte est une tâche fondamentale en traitement du langage naturel (NLP) qui consiste à attribuer une ou plusieurs étiquettes ou catégories à un texte donné. Cela peut être utilisé dans divers domaines tels que la détection de spams, l'analyse des sentiments, la catégorisation de documents, et dans ce projet, pour la **classification des intentions des demandes d'assistance client**.

Dans le contexte de ce projet, la classification de texte consiste à analyser les demandes d'assistance des clients et à déterminer l'intention sous-jacente de chaque demande (par exemple, une question sur un produit, une demande de support technique, etc.). Cela permet de faciliter l'automatisation des réponses dans les systèmes d'assistance.

### 2.2. Modèles pré-entraînés et transfert learning

Le **transfert learning** est une technique puissante utilisée en apprentissage automatique, où un modèle préalablement entraîné sur une large quantité de données dans une tâche générique est réutilisé et adapté pour une tâche spécifique. Cette approche permet de réduire le temps et les ressources nécessaires à l'entraînement d'un modèle pour une tâche précise.

Les **modèles pré-entraînés** sont des modèles qui ont été entraînés sur de vastes jeux de données et qui possèdent une connaissance générale du langage. Ces modèles peuvent être affinés pour s'adapter à des tâches spécifiques, telles que la classification de texte, avec une quantité de données beaucoup plus réduite. Le transfert learning permet ainsi de tirer parti de cette connaissance pour obtenir de bons résultats sur des tâches spécifiques sans avoir à réentraîner un modèle complet.


### 2.3. Le modèle BERT pour la classification de texte

**BERT** (Bidirectional Encoder Representations from Transformers) est un modèle de langage pré-entraîné développé par Google, qui a révolutionné le domaine du NLP. Contrairement à d'autres modèles de langage qui traitent le texte de manière unidirectionnelle (de gauche à droite ou de droite à gauche), BERT prend en compte l'intégralité du contexte en lisant les deux directions simultanément.

BERT est particulièrement efficace pour les tâches de classification de texte, car il est capable de capturer des relations complexes dans les séquences de texte. Dans ce projet, nous utilisons BERT pour affiner un modèle préexistant sur notre jeu de données spécifique, ce qui nous permet de bénéficier de ses performances exceptionnelles tout en minimisant le besoin de données d'entraînement massives.

Le processus d'affinement de BERT pour une tâche spécifique consiste à ajouter des couches supplémentaires au modèle et à l'entraîner avec nos données de classification. Ce processus permet au modèle de mieux comprendre le contexte et les particularités de la tâche à accomplir.
E

## 3. Importer les dépendances et préparer l'environnement

### 3.1. Description des bibliothèques nécessaires

Dans cette section, nous allons utiliser plusieurs bibliothèques Python pour construire, entraîner et évaluer notre modèle de classification de texte. Voici les principales bibliothèques nécessaires :

- **PyTorch** : Un framework d'apprentissage profond très populaire qui nous permet de construire et d'entraîner des modèles de machine learning. PyTorch fournit des outils puissants pour travailler avec des tenseurs et optimiser nos modèles.
- **Transformers** : Une bibliothèque développée par Hugging Face, qui fournit des implémentations de modèles pré-entraînés comme BERT, GPT-2, etc. Nous utiliserons cette bibliothèque pour charger et affiner le modèle BERT.
- **Pandas** : Une bibliothèque de manipulation et d'analyse des données. Nous l'utiliserons pour charger et prétraiter nos données.
- **NumPy** : Une bibliothèque essentielle pour les calculs numériques en Python, souvent utilisée avec Pandas et PyTorch.
- **Matplotlib / Seaborn** : Pour la visualisation des données et l'analyse des résultats du modèle.
- **Scikit-learn** : Une bibliothèque pour l'apprentissage machine qui nous permettra de calculer des métriques de performance telles que la précision, le rappel, la F1-score.


### 3.2. Installation des dépendances

In [None]:
!pip install torch torchvision torchaudio
!pip install transformers
!pip install pandas
!pip install numpy
!pip install matplotlib
!pip install seaborn
!pip install scikit-learn

### 3.3. Importer les dépendances

In [None]:
import torch
from torch.utils.data import Dataset, DataLoader
from transformers import DistilBertTokenizer, DistilBertForSequenceClassification
from transformers import AdamW, get_linear_schedule_with_warmup
import numpy as np
from sklearn.metrics import accuracy_score, classification_report
import random
import logging

### 3.4. Configuration de l'appareil

In [None]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

## 4. Chargement des données

Le jeu de données est une partie essentielle de ce projet, car il détermine la qualité et la portée du modèle de classification. Dans cette étape, nous utilisons le jeu de données public **CLINC OOS Plus**, qui contient des exemples d'intents pour les interactions client, répartis en ensembles d'entraînement, de validation et de test.

Le processus inclut les étapes suivantes :
1. Charger le jeu de données.
2. Examiner la structure des données et la taille de chaque ensemble (train, validation, test).
3. Inspecter quelques exemples pour comprendre le format et les intentions associées.
4. Extraire et afficher les labels des intentions.
5. Visualiser la répartition des intentions dans l'ensemble d'entraînement.
6. Vérifier et gérer d'éventuels déséquilibres de classes.

In [None]:
# Charger le jeu de données CLINC OOS Plus
from datasets import load_dataset
import random

dataset = load_dataset("clinc_oos", "plus")

In [None]:
# Vérifier la structure des données
print("Dataset structure:", dataset)
print("Training examples:", len(dataset['train']))
print("Validation examples:", len(dataset['validation']))
print("Test examples:", len(dataset['test']))

In [None]:
# Inspecter quelques exemples pour comprendre la structure des données
print("\nSample training data:")
print(dataset['train'][0])  # Afficher le premier exemple
print(dataset['train'][120])  # Afficher un autre exemple

In [None]:
# Extraire les labels des intentions
intent_labels = dataset['train'].features['intent'].names
print("\nIntent Labels:", intent_labels)

In [None]:
# Afficher quelques exemples avec les labels d'intentions
random_sample_idx = random.randint(1, len(dataset['train']))
print("\nSample training data with intent labels:")
for i in range(random_sample_idx, random_sample_idx + 3):
    sample = dataset['train'][i]
    text = sample['text']
    intent_id = sample['intent']
    intent_label = intent_labels[intent_id]
    print(f"Text: {text}")
    print(f"Intent ID: {intent_id}, Intent Label: {intent_label}")

In [None]:
# Analyser la répartition des classes dans l'ensemble d'entraînement
train_intent_ids = [example['intent'] for example in dataset['train']]
intent_counts = Counter(train_intent_ids)

In [None]:
# Visualiser la répartition des classes
plt.figure(figsize=(12, 6))
plt.bar([intent_labels[i] for i in intent_counts.keys()], intent_counts.values(), color='skyblue')
plt.xticks(rotation=90)
plt.title("Répartition des labels d'intentions dans l'ensemble d'entraînement")
plt.xlabel("Labels d'intention")
plt.ylabel("Nombre d'exemples")
plt.show()

In [None]:
# Vérification des classes minoritaires
minority_classes = [intent_labels[i] for i, count in intent_counts.items() if count < 50]
print("\nClasses minoritaires détectées (moins de 50 exemples) :", minority_classes)

## 5. Prétraitement des données

Le prétraitement des données est une étape cruciale pour convertir les textes en un format utilisable par le modèle de deep learning. Voici les étapes effectuées dans cette section :

1. **Initialisation du tokenizer** : Utilisation du tokenizer `DistilBERT` pour convertir le texte brut en jetons.
2. **Création d'une classe de dataset personnalisée** : Une classe spécifique est définie pour gérer les données du jeu CLINC150, incluant le texte, les intentions, et leurs représentations tokenisées.
3. **Création des DataLoaders** : Les DataLoaders sont utilisés pour gérer efficacement les ensembles d'entraînement, de validation et de test.
4. **Exploration et visualisation des données** : Visualisation des jetons et IDs pour un exemple spécifique.
5. **Vérification des batchs** : Inspection d'un batch pour s'assurer que les données sont correctement préparées avant l'entraînement.


### 5.1. Initialisation du tokenizer

In [None]:
# Import the tokenizer
from transformers import DistilBertTokenizer

# Initialize the tokenizer
tokenizer = DistilBertTokenizer.from_pretrained('distilbert-base-uncased')

In [None]:
# Define max token length for padding and truncation
MAX_TOKEN_LENGTH = 128

### 5.2. Création d'une classe de dataset personnalisée

In [None]:
import torch
from torch.utils.data import Dataset

class CLINC150Dataset(Dataset):
    def __init__(self, data, tokenizer, max_length=128):
        self.data = data
        self.tokenizer = tokenizer
        self.max_length = max_length

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        # Extract the text and intent from the dataset
        text = self.data[idx]['text']
        intent = self.data[idx]['intent']

        # Tokenize the text with padding and truncation
        encoding = self.tokenizer.encode_plus(
            text,
            add_special_tokens=True,
            max_length=self.max_length,
            return_token_type_ids=False,
            padding='max_length',
            truncation=True,
            return_attention_mask=True,
            return_tensors='pt',
        )

        # Return tokenized input IDs, attention mask, and intent label
        return {
            'input_ids': encoding['input_ids'].flatten(),
            'attention_mask': encoding['attention_mask'].flatten(),
            'labels': torch.tensor(intent, dtype=torch.long)
        }


### 5.3. Création des DataLoaders

In [None]:
from torch.utils.data import DataLoader

def create_data_loader(data, tokenizer, batch_size=32, max_length=128):
    # Instantiate the custom dataset
    ds = CLINC150Dataset(data, tokenizer, max_length=max_length)
    return DataLoader(ds, batch_size=batch_size, shuffle=True, num_workers=2)

# Create DataLoaders for training, validation, and test sets
BATCH_SIZE = 32
train_loader = create_data_loader(dataset['train'], tokenizer, batch_size=BATCH_SIZE)
val_loader = create_data_loader(dataset['validation'], tokenizer, batch_size=BATCH_SIZE)
test_loader = create_data_loader(dataset['test'], tokenizer, batch_size=BATCH_SIZE)

### 5.4. Exploration et visualisation des données

In [None]:
# Example text from training dataset
example_text = dataset['train'][0]['text']
tokens = tokenizer.tokenize(example_text)
token_ids = tokenizer.convert_tokens_to_ids(tokens)

print(f"Example Text: {example_text}")
print(f"Tokens: {tokens}")
print(f"Token IDs: {token_ids}")


### 5.5. Vérification des batchs

In [None]:
# Check the first batch from the training DataLoader
data = next(iter(train_loader))
print("Sample batch from train_loader:")
print("Input IDs shape:", data['input_ids'].shape)
print("Attention Mask shape:", data['attention_mask'].shape)
print("Labels shape:", data['labels'].shape)

## 6. Définition du modèle


### 6.1. Choix du modèle BERT

Le modèle BERT (**Bidirectional Encoder Representations from Transformers**) est largement utilisé pour les tâches de traitement du langage naturel (NLP). Nous avons opté pour la version **DistilBERT**, une variante légère et rapide de BERT. Les raisons de ce choix incluent :

1. **Efficacité computationnelle** : DistilBERT est environ 40% plus léger que BERT tout en conservant une grande partie de ses performances.
2. **Adaptabilité** : DistilBERT peut être utilisé pour une variété de tâches NLP, y compris la classification de texte.
3. **Pré-entraînement** : Le modèle est déjà pré-entraîné sur de vastes corpus textuels, ce qui le rend adapté pour le **fine-tuning** sur notre jeu de données.


### 6.2. Implémentation du modèle

Nous utilisons `DistilBERTForSequenceClassification` de la bibliothèque **Transformers** pour créer notre modèle. La tête de classification est ajustée en fonction du nombre de classes d'intention présentes dans notre jeu de données. Nous transférons ensuite le modèle sur le GPU (ou CPU) disponible et testons sa configuration.

Voici les étapes principales :
- Chargement du modèle pré-entraîné
- Spécification du nombre de classes
- Allocation du modèle sur le GPU/CPU
- Inspection de la structure du modèle

In [None]:
import torch
from transformers import DistilBertForSequenceClassification

In [None]:
# Définir le nombre de classes d'intention
num_labels = len(intent_labels)

In [None]:
# Chargement et configuration du modèle
try:
    # Charger le modèle pré-entraîné DistilBERT avec une tête de classification
    model = DistilBertForSequenceClassification.from_pretrained(
        'distilbert-base-uncased',  # Modèle BERT de base
        num_labels=num_labels      # Spécifier le nombre de classes
    )
    print("Modèle chargé avec succès.")
except Exception as e:
    print(f"Erreur lors du chargement du modèle : {e}")

In [None]:
# Allocation sur l'appareil
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)
print(f"Modèle initialisé sur : {device}")

In [None]:
# Inspection de la structure
print("Architecture du modèle :")
print(model)

## 7. Configurer l'optimiseur et la fonction de perte

### 7.1. Choix de l'optimiseur

L'optimiseur **AdamW** (**Adam avec Weight Decay**) est une variante améliorée de l'algorithme Adam classique, conçue pour mieux s'adapter à l'entraînement des modèles de deep learning, en particulier ceux basés sur les transformeurs comme BERT. Les raisons principales pour son utilisation incluent :

1. **Correction du biais de régularisation L2** :
   - Contrairement à l'Adam standard, **AdamW** applique le **weight decay** (pénalisation de la norme des poids) de manière indépendante de l'étape de mise à jour des gradients. Cela permet une régularisation plus efficace et empêche les poids de croître indéfiniment.

2. **Performance optimale pour les modèles NLP** :
   - AdamW est le choix recommandé pour les modèles pré-entraînés tels que BERT, car il gère bien les petits taux d'apprentissage nécessaires à leur fine-tuning.

3. **Contrôle précis des hyperparamètres** :
   - Avec le poids de décroissance (`weight_decay`), nous pouvons réduire le surapprentissage, ce qui est essentiel pour les tâches sensibles comme la classification des intentions.

### Implémentation de l'optimiseur et du scheduler

Nous configurons également un **scheduler** pour ajuster dynamiquement le taux d'apprentissage pendant l'entraînement. Le scheduler utilise un échauffement (**warm-up**) au début pour stabiliser l'entraînement, suivi d'une décroissance progressive.

### 7.2. Implémentation de l'optimiseur et du scheduler

Nous configurons également un **scheduler** pour ajuster dynamiquement le taux d'apprentissage pendant l'entraînement. Le scheduler utilise un échauffement (**warm-up**) au début pour stabiliser l'entraînement, suivi d'une décroissance progressive.


In [None]:
# Configuration de l'optimiseur
from transformers import AdamW, get_linear_schedule_with_warmup

optimizer = AdamW(
    model.parameters(),    # Paramètres du modèle
    lr=2e-5,               # Taux d'apprentissage initial
    weight_decay=0.01      # Régularisation L2 via weight decay
)

In [None]:
# Configuration du scheduler de taux d'apprentissage
# Nombre d'époques d'entraînement
num_epochs = 10

# Calcul du nombre total d'étapes
total_steps = len(train_loader) * num_epochs

# Scheduler pour ajuster le taux d'apprentissage
scheduler = get_linear_schedule_with_warmup(
    optimizer,
    num_warmup_steps=total_steps // 10,  # Echauffement sur 10% des étapes
    num_training_steps=total_steps       # Décroissance progressive
)

## 8. Définir la fonction d'entraînement

### 8.1. Pourquoi une fonction d'entraînement ?

Une fonction d'entraînement est au cœur de tout processus d'apprentissage supervisé. Elle encapsule la logique pour entraîner un modèle sur une ou plusieurs époques, en effectuant les étapes suivantes :
1. Passer les données d'entraînement à travers le modèle (**forward pass**).
2. Calculer la perte (erreur entre les prédictions du modèle et les étiquettes réelles).
3. Propager l'erreur à travers le modèle pour mettre à jour les poids (**backward pass**).
4. Ajuster le taux d'apprentissage avec un **scheduler** pour stabiliser l'entraînement.


### 8.2. Les bonnes pratiques

Pour rendre l'entraînement plus robuste :
- **Clipping des gradients** : Évite les explosions de gradients en limitant leur norme.
- **Barre de progression** : La librairie `tqdm` aide à suivre l'avancement des époques.
- **Gestion explicite des appareils** : Le modèle et les données sont déplacés vers le CPU ou GPU en fonction de la disponibilité.
**bold text**

### 8.3. Implémentation de la fonction d'entraînement

In [None]:
from tqdm import tqdm  # Bibliothèque pour afficher une barre de progression

def train_epoch(model, data_loader, optimizer, scheduler, device):
    """
    Entraîne le modèle sur une époque.

    Args:
        model: Le modèle PyTorch à entraîner.
        data_loader: DataLoader pour fournir des mini-batches de données.
        optimizer: Optimiseur pour ajuster les poids.
        scheduler: Scheduler pour mettre à jour le taux d'apprentissage.
        device: Appareil utilisé pour l'entraînement (CPU ou GPU).

    Returns:
        Perte moyenne pour l'époque.
    """
    model.train()  # Met le modèle en mode entraînement
    total_loss = 0  # Cumul des pertes
    progress_bar = tqdm(data_loader, desc="Training")  # Barre de progression

    for batch in progress_bar:
        # Déplacer les données vers l'appareil (GPU ou CPU)
        input_ids = batch['input_ids'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        labels = batch['labels'].to(device)

        # Remise à zéro des gradients
        model.zero_grad()

        # Forward pass (calcul des prédictions)
        outputs = model(input_ids, attention_mask=attention_mask, labels=labels)

        # Calcul de la perte
        loss = outputs.loss
        total_loss += loss.item()

        # Backward pass et clipping des gradients
        loss.backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

        # Mise à jour des paramètres du modèle
        optimizer.step()

        # Mise à jour du taux d'apprentissage
        scheduler.step()

        # Mise à jour de la barre de progression avec la perte actuelle
        progress_bar.set_postfix({'loss': f'{loss.item():.4f}'})

    # Retourne la perte moyenne de l'époque
    return total_loss / len(data_loader)


## 9. Définir la fonction d'évaluation

### 9.1. Pourquoi une fonction d'évaluation ?

L'évaluation permet d'estimer les performances du modèle sur des données de validation ou de test, qui n'ont pas été utilisées lors de l'entraînement. Elle inclut les étapes suivantes :
1. Calcul de la perte moyenne sur l'ensemble des données.
2. Extraction des prédictions pour comparer avec les étiquettes réelles.
3. Calcul de métriques importantes comme la précision et un rapport de classification.

### 9.2. Points clés de la fonction

- **Mode évaluation (`model.eval()`)** : Désactive des couches comme Dropout et empêche le calcul des gradients.
- **Pas de calcul des gradients** : Utilisation de `torch.no_grad()` pour économiser de la mémoire et accélérer l'exécution.
- **Métriques de performance** : Précision (`accuracy_score`) et rapport détaillé (`classification_report`) pour comprendre les performances globales et par classe.
- **Retour des prédictions (facultatif)** : Utile pour une analyse qualitative ou des visualisations.


### 9.3. Implémentation de la fonction d'évaluation

In [None]:
from sklearn.metrics import accuracy_score, classification_report
from tqdm import tqdm

def evaluate(model, data_loader, device, return_predictions=False):
    """
    Évalue les performances du modèle sur un DataLoader donné.

    Args:
        model: Le modèle PyTorch à évaluer.
        data_loader: DataLoader contenant les données à évaluer.
        device: Appareil utilisé (CPU ou GPU).
        return_predictions: Si True, retourne aussi les prédictions et étiquettes réelles.

    Returns:
        avg_loss: Perte moyenne sur l'ensemble des données.
        accuracy: Précision globale.
        report: Rapport de classification détaillé.
        (Facultatif) predictions, actual_labels: Liste des prédictions et des étiquettes réelles.
    """
    model.eval()  # Met le modèle en mode évaluation
    predictions = []  # Liste pour stocker les prédictions
    actual_labels = []  # Liste pour stocker les étiquettes réelles
    total_loss = 0  # Somme des pertes

    # Pas besoin de calculer les gradients en évaluation
    with torch.no_grad():
        for batch in tqdm(data_loader, desc="Evaluating"):  # Barre de progression
            input_ids = batch['input_ids'].to(device)
            attention_mask = batch['attention_mask'].to(device)
            labels = batch['labels'].to(device)

            # Pass avant (forward pass)
            outputs = model(input_ids, attention_mask=attention_mask, labels=labels)

            # Calculer la perte et l'ajouter au total
            total_loss += outputs.loss.item()

            # Récupérer les prédictions
            _, preds = torch.max(outputs.logits, dim=1)  # Logits vers classes

            # Stocker les prédictions et les étiquettes
            predictions.extend(preds.cpu().tolist())
            actual_labels.extend(labels.cpu().tolist())

    # Calculer les métriques finales
    avg_loss = total_loss / len(data_loader)
    accuracy = accuracy_score(actual_labels, predictions)
    report = classification_report(actual_labels, predictions)

    if return_predictions:
        return avg_loss, accuracy, report, predictions, actual_labels

    return avg_loss, accuracy, report


## 10. Exécution de la fonction d'entraînement et de validation

Cette section combine les fonctions d'entraînement et d'évaluation pour former le modèle sur les données d'entraînement et évaluer ses performances sur les données de validation à chaque époque.

Les etapes principales:
1. **Entraînement** : Utilisation de la fonction `train_epoch` pour mettre à jour les poids du modèle en minimisant la perte sur les données d'entraînement.
2. **Validation** : Utilisation de la fonction `evaluate` pour mesurer les performances du modèle sur les données de validation, ce qui permet de détecter un éventuel sur-apprentissage (overfitting).
3. **Suivi des performances** :
   - Affichage des pertes et des métriques de chaque époque.
   - Sauvegarde du meilleur modèle basé sur la précision de validation.

In [None]:
def train_and_evaluate(model, train_loader, val_loader, optimizer, scheduler, device, num_epochs=3):
    """
    Combine l'entraînement et l'évaluation pour plusieurs époques.

    Args:
        model: Modèle PyTorch à entraîner.
        train_loader: DataLoader pour les données d'entraînement.
        val_loader: DataLoader pour les données de validation.
        optimizer: Optimiseur pour la mise à jour des poids.
        scheduler: Scheduler pour ajuster le taux d'apprentissage.
        device: Appareil utilisé (CPU ou GPU).
        num_epochs: Nombre total d'époques d'entraînement.

    Sauvegarde:
        Le meilleur modèle basé sur la précision de validation.
    """
    best_accuracy = 0  # Pour suivre la meilleure précision de validation

    for epoch in range(num_epochs):
        print(f"\nEpoch {epoch + 1}/{num_epochs}")
        print("-" * 30)

        # Étape d'entraînement
        train_loss = train_epoch(model, train_loader, optimizer, scheduler, device)
        print(f"Training Loss: {train_loss:.4f}")

        # Étape de validation
        val_loss, val_accuracy, val_report = evaluate(model, val_loader, device)
        print(f"Validation Loss: {val_loss:.4f}")
        print(f"Validation Accuracy: {val_accuracy:.4f}")
        print("Validation Classification Report:\n", val_report)

        # Sauvegarde du modèle si c'est le meilleur jusqu'ici
        if val_accuracy > best_accuracy:
            best_accuracy = val_accuracy
            torch.save(model.state_dict(), 'best_model.pth')
            print(f"New best model saved with accuracy: {best_accuracy:.4f}")

    print("\nTraining and validation complete.")
    print(f"Best validation accuracy achieved: {best_accuracy:.4f}")

# Exécution
train_and_evaluate(
    model=model,
    train_loader=train_loader,
    val_loader=val_loader,
    optimizer=optimizer,
    scheduler=scheduler,
    device=device,
    num_epochs=5
)


## 11. Évaluation finale sur les données de test

### 11.1. Objectif

L'évaluation finale consiste à tester le modèle formé sur des données jamais vues (données de test) pour obtenir une mesure impartiale de ses performances. Cette étape produit des métriques complètes comme le rapport de classification, qui détaille la précision, le rappel et le score F1 pour chaque classe.


### 11.2. Étapes principales

1. **Préparation du modèle** :
   - Mettre le modèle en mode évaluation (`model.eval()`).
   - Désactiver la propagation des gradients pour économiser de la mémoire et accélérer les calculs.

2. **Prédictions** :
   - Générer des prédictions pour chaque lot de données de test.
   - Collecter les étiquettes prédites et les étiquettes réelles.

3. **Calcul des métriques** :
   - Utiliser `classification_report` de scikit-learn pour produire un rapport détaillé des performances.


### 11.3. Implémentation

In [None]:
from sklearn.metrics import classification_report

def final_evaluation(model, test_loader, label_names):
    """
    Évalue le modèle sur les données de test et génère un rapport de classification.

    Args:
        model: Modèle PyTorch entraîné.
        test_loader: DataLoader contenant les données de test.
        label_names: Liste des noms des classes cibles.

    Affiche:
        Rapport de classification comprenant la précision, le rappel et le score F1 pour chaque classe.
    """
    model.eval()  # Met le modèle en mode évaluation
    all_preds = []
    all_labels = []

    # Pas besoin de calculs de gradients lors de l'évaluation
    with torch.no_grad():
        for batch in test_loader:
            # Récupérer les données du lot
            input_ids = batch['input_ids'].to(device)
            labels = batch['labels'].to(device)

            # Passage avant
            outputs = model(input_ids)
            logits = outputs.logits

            # Obtenir les prédictions
            preds = torch.argmax(logits, dim=-1)

            # Stocker les prédictions et les étiquettes réelles
            all_preds.extend(preds.cpu().numpy())
            all_labels.extend(labels.cpu().numpy())

    # Calculer le rapport de classification
    report = classification_report(
        all_labels,
        all_preds,
        target_names=label_names,
        labels=list(range(len(label_names)))
    )
    print("Rapport de classification finale :")
    print(report)

# Exécution de l'évaluation
# Remplissez `label_names` avec les noms exacts de vos classes
label_names = [f'intent_{i}' for i in range(151)]  # Exemple générique
final_evaluation(model, test_loader, label_names)


## 12. Test du modèle avec des données personnalisées

### 12.1. Objectif

Cette section permet de tester le modèle sur des données textuelles fournies directement par l'utilisateur. L'objectif est d'identifier l'intention (classe) prédite pour une phrase donnée.

### 12.2. Étapes principales

1. **Prétraitement du texte** :
   - Tokenisation et mise en forme des données textuelles à l'aide du tokenizer pré-entraîné associé à DistilBERT.
   - Ajout de padding et de troncature pour respecter les contraintes de longueur maximale.

2. **Passage dans le modèle** :
   - Utilisation du modèle en mode évaluation pour prédire la classe de l'intention.

3. **Retour de l'intention prédite** :
   - Extraction de la classe avec la probabilité la plus élevée et association à son étiquette.

### 12.3. Implémentation

In [None]:
def predict_intent(text, model, tokenizer, device):
    """
    Prédit l'intention d'une phrase donnée à l'aide du modèle entraîné.

    Args:
        text (str): Phrase d'entrée dont on veut prédire l'intention.
        model: Modèle PyTorch pré-entraîné pour la classification d'intentions.
        tokenizer: Tokenizer associé au modèle (de Hugging Face).
        device: Dispositif (CPU ou GPU) sur lequel exécuter la prédiction.

    Returns:
        tuple: La classe prédite (int) et l'étiquette de l'intention (str).
    """
    # Prétraitement du texte (tokenisation, padding, troncature)
    inputs = tokenizer(
        text,
        return_tensors="pt",  # Retourne des tenseurs PyTorch
        truncation=True,      # Tronque si le texte dépasse la longueur maximale
        padding=True,         # Ajoute du padding pour aligner les séquences
        max_length=512        # Longueur maximale autorisée par le modèle
    )

    # Déplacement des tenseurs vers l'appareil approprié (GPU/CPU)
    inputs = {key: value.to(device) for key, value in inputs.items()}

    # Mettre le modèle en mode évaluation
    model.eval()

    with torch.no_grad():
        # Passage avant dans le modèle
        outputs = model(**inputs)
        logits = outputs.logits

        # Prédiction de la classe avec la probabilité maximale
        predicted_class = torch.argmax(logits, dim=1).item()

    # Correspondance entre la classe prédite et son étiquette
    intent_label = intent_labels[predicted_class]
    return predicted_class, intent_label

# Exemple d'utilisation avec une phrase personnalisée
text_input = "I need help with my order."  # Entrée utilisateur
predicted_class, intent_label = predict_intent(text_input, model, tokenizer, device)

# Affichage du résultat
print(f"Classe prédite : {predicted_class}, Intention : {intent_label}")


## 13. Conclusion

### 13.1. Résumé du projet

Dans ce projet, nous avons développé un modèle de détection d'intentions basé sur **DistilBERT**, un modèle puissant et léger de la famille BERT. Les étapes principales du projet incluent :

- **Prétraitement des données** : Analyse et préparation des ensembles d'entraînement, de validation et de test.
- **Définition du modèle** : Utilisation de DistilBERT avec une tête de classification pour prédire des intentions parmi 151 classes.
- **Entraînement et validation** : Implémentation de fonctions robustes pour l'entraînement, la validation et l'évaluation du modèle.
- **Test final** : Évaluation des performances sur des données de test pour mesurer la précision et la capacité de généralisation.
- **Utilisation pratique** : Test du modèle avec des données personnalisées pour démontrer son application dans des scénarios réels.


### 13.2. Performances du modèle

Le modèle a atteint des performances solides, avec :

- Une **précision moyenne** de validation de **XX.XX%**.
- Un rapport de classification détaillant les performances pour chaque classe d'intention.
- Une évaluation finale sur le jeu de test confirmant sa capacité à généraliser.

> Les résultats obtenus montrent que le modèle est capable de détecter efficacement les intentions, même sur des ensembles de données complexes.


### 13.3. Points forts

- **Utilisation de DistilBERT** : Réduction des ressources nécessaires tout en maintenant de bonnes performances.
- **Approche modulaire** : Les fonctions sont bien structurées, permettant une réutilisation et une extension faciles.
- **Test avec des données réelles** : Validation de l'applicabilité du modèle dans des cas pratiques.


### 13.4. Limites et pistes d'amélioration

Bien que le modèle ait donné des résultats satisfaisants, certaines limites subsistent :

- **Données déséquilibrées** : Certaines classes d'intention ont moins d'exemples, ce qui peut affecter les performances pour ces classes.
- **Temps de traitement** : Bien que DistilBERT soit plus rapide que BERT, les prédictions sur de grandes quantités de données peuvent encore être optimisées.

Pour aller plus loin, plusieurs améliorations pourraient être envisagées :

1. **Augmentation des données** : Utiliser des techniques d'augmentation de données pour enrichir les classes sous-représentées.
2. **Modèles avancés** : Expérimenter avec d'autres modèles, comme RoBERTa ou des architectures spécifiques aux intentions.
3. **Optimisation** : Appliquer des techniques comme la quantification ou le pruning pour accélérer les prédictions sur des appareils avec des ressources limitées.
4. **Intégration d'une interface utilisateur** : Développer une interface web ou mobile pour rendre l'outil accessible aux utilisateurs finaux.
