# Entra√Ænement du mod√®le de classification Call Center sur Google Colab

Ce notebook permet d'entra√Æner notre mod√®le de classification des tickets sur Google Colab en utilisant le GPU pour de meilleures performances.

In [None]:
try:
    from google.colab import drive
except ImportError:
    raise RuntimeError("Ce notebook doit √™tre ex√©cut√© dans Google Colab. Veuillez l'ouvrir avec : https://colab.research.google.com")

## 1. Configuration de Google Drive

Premi√®rement, nous allons connecter Google Drive pour acc√©der √† nos donn√©es et sauvegarder nos mod√®les.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# Cr√©er les dossiers n√©cessaires
!mkdir -p /content/drive/MyDrive/CallCenter/data
!mkdir -p /content/drive/MyDrive/CallCenter/models

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


## 2. V√©rification du GPU

V√©rifions que nous avons bien acc√®s au GPU sur Colab.

In [None]:
import torch

# V√©rifier si le GPU est disponible
print("GPU disponible:", torch.cuda.is_available())
if torch.cuda.is_available():
    print("Nom du GPU:", torch.cuda.get_device_name(0))
    print("M√©moire totale (Go):", torch.cuda.get_device_properties(0).total_memory / 1e9)

GPU disponible: True
Nom du GPU: Tesla T4
M√©moire totale (Go): 15.828320256


In [None]:
# V√©rification de CUDA
if torch.cuda.is_available():
    print("Version CUDA:", torch.version.cuda)
    print("Nombre de GPUs disponibles:", torch.cuda.device_count())
    # Afficher les informations sur la m√©moire GPU
    print("\nM√©moire GPU:")
    print("!nvidia-smi")

Version CUDA: 12.6
Nombre de GPUs disponibles: 1

M√©moire GPU:
!nvidia-smi


## 3. Installation des d√©pendances

Installons les packages n√©cessaires pour l'entra√Ænement.

In [None]:
# Installation des packages
!pip install transformers datasets evaluate scikit-learn pandas numpy mlflow --quiet
!pip install accelerate -U --quiet

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/84.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m84.1/84.1 kB[0m [31m8.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m8.8/8.8 MB[0m [31m124.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m2.3/2.3 MB[0m [31m102.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m1.3/1.3 MB[0m [31m81.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚î

In [None]:
# V√©rifier les versions install√©es
import transformers
import datasets
import pandas
import torch

print("transformers version:", transformers.__version__)
print("datasets version:", datasets.__version__)
print("pandas version:", pandas.__version__)
print("torch version:", torch.__version__)

transformers version: 4.57.1
datasets version: 4.0.0
pandas version: 2.2.2
torch version: 2.8.0+cu126


## 4. Chargement et pr√©paration des donn√©es

Copions les donn√©es n√©cessaires depuis notre projet local vers Google Drive.

In [None]:
# Charger les donn√©es
import pandas as pd
import os
from sklearn.model_selection import train_test_split
from transformers import AutoTokenizer
from datasets import Dataset

# V√©rifier si le fichier existe dans Google Drive
data_path = '/content/drive/MyDrive/CallCenter/data/processed/tickets_clean.csv'
if not os.path.exists(data_path):
    raise FileNotFoundError(
        "\nERREUR : Le fichier tickets_clean.csv n'a pas √©t√© trouv√© dans Google Drive.\n"
        "Veuillez suivre ces √©tapes :\n"
        "1. Assurez-vous d'avoir mont√© Google Drive (ex√©cutez la section 1)\n"
        "2. Cr√©ez le dossier : /content/drive/MyDrive/CallCenter/data/\n"
        "3. Uploadez votre fichier tickets_clean.csv dans ce dossier\n"
        "4. V√©rifiez que le chemin est correct : " + data_path
    )

print("Chargement des donn√©es depuis:", data_path)
df = pd.read_csv(data_path)
print(f"Nombre total d'√©chantillons charg√©s : {len(df)}")

# Nettoyage des donn√©es
df = df.dropna(subset=['Document', 'Topic_group'])
print(f"Nombre d'√©chantillons apr√®s nettoyage : {len(df)}")

# Pr√©paration des labels
labels = df['Topic_group'].unique()
print(f"\nNombre de classes : {len(labels)}")
print("Classes disponibles :", labels)

label2id = {label: idx for idx, label in enumerate(labels)}
id2label = {idx: label for label, idx in label2id.items()}
df['label'] = df['Topic_group'].map(label2id)

# Split train/test
train_df, test_df = train_test_split(df, test_size=0.2, random_state=42, stratify=df['label'])
print(f"\nSplit des donn√©es :")
print(f"- Ensemble d'entra√Ænement : {len(train_df)} √©chantillons")
print(f"- Ensemble de test : {len(test_df)} √©chantillons")

# Initialiser le tokenizer
print("\nChargement du tokenizer...")
tokenizer = AutoTokenizer.from_pretrained('distilbert-base-multilingual-cased')

# Fonction de tokenization
def tokenize_function(examples):
    return tokenizer(
        examples['Document'],
        padding='max_length',
        truncation=True,
        max_length=128
    )

# Cr√©er les datasets HF
print("\nCr√©ation des datasets...")
train_dataset = Dataset.from_pandas(train_df[['Document', 'label']])
test_dataset = Dataset.from_pandas(test_df[['Document', 'label']])

print("Tokenisation des donn√©es...")
train_tokenized = train_dataset.map(tokenize_function, batched=True)
test_tokenized = test_dataset.map(tokenize_function, batched=True)

# D√©finir le format pour PyTorch
train_tokenized.set_format('torch', columns=['input_ids', 'attention_mask', 'label'])
test_tokenized.set_format('torch', columns=['input_ids', 'attention_mask', 'label'])

print("\nPr√©paration des donn√©es termin√©e !")

Chargement des donn√©es depuis: /content/drive/MyDrive/CallCenter/data/processed/tickets_clean.csv
Nombre total d'√©chantillons charg√©s : 47834
Nombre d'√©chantillons apr√®s nettoyage : 47834

Nombre de classes : 8
Classes disponibles : ['Hardware' 'Access' 'Miscellaneous' 'HR Support' 'Purchase'
 'Administrative rights' 'Storage' 'Internal Project']

Split des donn√©es :
- Ensemble d'entra√Ænement : 38267 √©chantillons
- Ensemble de test : 9567 √©chantillons

Chargement du tokenizer...

Cr√©ation des datasets...
Tokenisation des donn√©es...


Map:   0%|          | 0/38267 [00:00<?, ? examples/s]

Map:   0%|          | 0/9567 [00:00<?, ? examples/s]


Pr√©paration des donn√©es termin√©e !


## 5. Configuration de l'entra√Ænement avec optimisation m√©moire

Configuration du mod√®le et des param√®tres d'entra√Ænement avec les optimisations pour une utilisation efficace du GPU.

In [None]:
import torch
from transformers import (
    AutoModelForSequenceClassification,
    TrainingArguments,
    Trainer,
    DataCollatorWithPadding
)
from sklearn.metrics import accuracy_score, f1_score

# Configuration du device
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# Initialiser le mod√®le
model = AutoModelForSequenceClassification.from_pretrained(
    'distilbert-base-multilingual-cased',
    num_labels=len(label2id),
    id2label=id2label,
    label2id=label2id
)

# Activer le gradient checkpointing pour √©conomiser la m√©moire
model.gradient_checkpointing_enable()

# D√©placer le mod√®le sur GPU
model = model.to(device)

# Fonction de calcul des m√©triques
def compute_metrics(eval_pred):
    predictions, labels = eval_pred
    predictions = predictions.argmax(axis=1)

    return {
        'accuracy': accuracy_score(labels, predictions),
        'f1_macro': f1_score(labels, predictions, average='macro'),
        'f1_weighted': f1_score(labels, predictions, average='weighted')
    }

# Configuration de l'entra√Ænement avec optimisations m√©moire et stockage
training_args = TrainingArguments(
    output_dir='/content/drive/MyDrive/CallCenter/models/best_model',  # Chang√© pour sauvegarder directement dans best_model
    eval_strategy='epoch',
    save_strategy='epoch',
    learning_rate=2e-5,
    per_device_train_batch_size=8,  # R√©duit de 16 √† 8
    per_device_eval_batch_size=8,   # R√©duit de 16 √† 8
    gradient_accumulation_steps=4,   # Augment√© de 2 √† 4
    num_train_epochs=2,             # R√©duit de 3 √† 2
    weight_decay=0.01,
    load_best_model_at_end=True,
    metric_for_best_model='f1_weighted',
    greater_is_better=True,
    fp16=True,
    gradient_checkpointing=True,
    report_to='none',
    save_total_limit=1,
    push_to_hub=False,
    overwrite_output_dir=True,
    remove_unused_columns=True
)

# Data collator pour le padding dynamique
data_collator = DataCollatorWithPadding(tokenizer=tokenizer)

# Initialiser le Trainer
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_tokenized,
    eval_dataset=test_tokenized,
    tokenizer=tokenizer,
    data_collator=data_collator,
    compute_metrics=compute_metrics
)

Some weights of DistilBertForSequenceClassification were not initialized from the model checkpoint at distilbert-base-multilingual-cased and are newly initialized: ['classifier.bias', 'classifier.weight', 'pre_classifier.bias', 'pre_classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
  trainer = Trainer(


## 6. Entra√Ænement du mod√®le

Lan√ßons l'entra√Ænement avec les optimisations de m√©moire et GPU.

In [None]:
# Lib√©rer la m√©moire cache GPU avant l'entra√Ænement
if torch.cuda.is_available():
    torch.cuda.empty_cache()

# Lancer l'entra√Ænement
trainer.train()

# √âvaluation finale
eval_results = trainer.evaluate()
print("\nR√©sultats de l'√©valuation finale:")
print(eval_results)

Step,Training Loss,Validation Loss,Accuracy,F1 Macro,F1 Weighted
100,No log,1.283284,0.597993,0.440001,0.559423
200,No log,0.878258,0.723633,0.671147,0.713505
300,No log,0.667368,0.795338,0.79506,0.794471
400,No log,0.612816,0.804014,0.806465,0.803726
500,0.942000,0.549966,0.822515,0.82777,0.823147
600,0.942000,0.568378,0.814571,0.820149,0.814005
700,0.942000,0.534644,0.820424,0.814376,0.820373
800,0.942000,0.501611,0.837044,0.838475,0.836378
900,0.942000,0.477105,0.839135,0.838776,0.839359
1000,0.504900,0.485938,0.842166,0.842407,0.84322



R√©sultats de l'√©valuation finale:
{'eval_loss': 0.4043479859828949, 'eval_accuracy': 0.8659977004285565, 'eval_f1_macro': 0.8643472774432597, 'eval_f1_weighted': 0.8660024442231926, 'eval_runtime': 13.0537, 'eval_samples_per_second': 732.897, 'eval_steps_per_second': 45.811, 'epoch': 3.0}


In [None]:
# Fonction pour nettoyer la m√©moire GPU
def clear_gpu_memory():
    if torch.cuda.is_available():
        torch.cuda.empty_cache()
        print("M√©moire GPU nettoy√©e")
        
# Nettoyage avant l'entra√Ænement
clear_gpu_memory()

try:
    # Lancer l'entra√Ænement avec gestion d'erreur
    trainer.train()
except Exception as e:
    print(f"\nErreur pendant l'entra√Ænement : {str(e)}")
    
    # Sauvegarder l'√©tat actuel en cas d'erreur
    print("\nSauvegarde de secours du mod√®le...")
    trainer.save_model('/content/drive/MyDrive/CallCenter/models/backup_model')
    print("Mod√®le de secours sauvegard√©!")

# √âvaluation finale
print("\n√âvaluation du mod√®le...")
eval_results = trainer.evaluate()
print("\nR√©sultats de l'√©valuation finale:")
print(eval_results)

## 7. Sauvegarde du mod√®le

Sauvegardons le mod√®le entra√Æn√© sur Google Drive.

In [None]:
# Chemin de sauvegarde sur Google Drive
save_path = '/content/drive/MyDrive/CallCenter/models/best_model'

# Sauvegarder le mod√®le et le tokenizer
trainer.save_model(save_path)
tokenizer.save_pretrained(save_path)

# Sauvegarder les mappings label2id et id2label
import json
with open(f'{save_path}/label_mappings.json', 'w') as f:
    json.dump({
        'label2id': label2id,
        'id2label': id2label
    }, f, indent=2)

# ‚≠ê FORCER LA CR√âATION DU FICHIER pytorch_model.bin
import torch
import os
from transformers import AutoModelForSequenceClassification

print("\n=== V√©rification et cr√©ation du pytorch_model.bin ===")

# V√©rifier si le fichier existe d√©j√†
pytorch_model_path = os.path.join(save_path, 'pytorch_model.bin')

if not os.path.exists(pytorch_model_path):
    print("‚ö†Ô∏è  Le fichier pytorch_model.bin n'existe pas, cr√©ation en cours...")
    
    # R√©cup√©rer le mod√®le depuis le trainer
    model = trainer.model
    
    # G√©rer les mod√®les envelopp√©s (DataParallel, DistributedDataParallel)
    if hasattr(model, 'module'):
        model_to_save = model.module
    else:
        model_to_save = model
    
    # D√©placer sur CPU pour √©viter les probl√®mes m√©moire
    model_to_save = model_to_save.to('cpu')
    
    # Sauvegarder le state_dict
    torch.save(model_to_save.state_dict(), pytorch_model_path)
    print(f"‚úÖ Fichier pytorch_model.bin cr√©√© avec succ√®s !")
    print(f"   Taille : {os.path.getsize(pytorch_model_path) / (1024*1024):.2f} MB")
else:
    size_mb = os.path.getsize(pytorch_model_path) / (1024*1024)
    print(f"‚úÖ Le fichier pytorch_model.bin existe d√©j√† ! Taille : {size_mb:.2f} MB")

# V√©rifier la structure compl√®te du dossier
print("\nüìÅ Fichiers dans le dossier de sauvegarde :")
for f in sorted(os.listdir(save_path)):
    filepath = os.path.join(save_path, f)
    if os.path.isfile(filepath):
        size = os.path.getsize(filepath) / (1024*1024)
        print(f"   - {f} ({size:.2f} MB)")
    else:
        print(f"   - {f}/ (dossier)")

print("\n‚úÖ Mod√®le sauvegard√© avec succ√®s dans Google Drive !")

Mod√®le sauvegard√© avec succ√®s dans Google Drive !


**Note:** If you encounter a `NameError: name 'trainer' is not defined` when saving the model, ensure that you have executed the "6. Entra√Ænement du mod√®le" section first. The `trainer` object is created in that section.

In [None]:
# ‚≠ê DIAGNOSTIC ET R√âPARATION - Ex√©cuter SI pytorch_model.bin est manquant
import os
import torch
from transformers import AutoModelForSequenceClassification

model_path = '/content/drive/MyDrive/CallCenter/models/best_model/pytorch_model.bin'
save_path = '/content/drive/MyDrive/CallCenter/models/best_model'

print("=== V√âRIFICATION DU MOD√àLE ===\n")

# 1. V√©rifier l'existence du fichier
if os.path.exists(model_path):
    size_mb = os.path.getsize(model_path) / (1024 * 1024)
    print(f"‚úÖ Le fichier pytorch_model.bin existe ! Taille : {size_mb:.2f} MB")
else:
    print("‚ùå ERREUR : Le fichier pytorch_model.bin n'existe pas !")
    print("\nüîß R√âPARATION EN COURS...\n")
    
    # 2. V√©rifier ce qui existe dans le dossier
    print("Fichiers trouv√©s dans le dossier :")
    files = os.listdir(save_path)
    for f in sorted(files):
        print(f"   - {f}")
    
    # 3. Tenter de charger le mod√®le depuis la configuration
    try:
        print("\nüì• Tentative de chargement du mod√®le depuis les fichiers existants...")
        model = AutoModelForSequenceClassification.from_pretrained(save_path, local_files_only=True)
        print("‚úÖ Mod√®le charg√© avec succ√®s !")
        
        # 4. Sauvegarder en format unique
        print("\nüíæ Sauvegarde en fichier unique...")
        model = model.to('cpu')
        torch.save(model.state_dict(), model_path)
        print(f"‚úÖ Fichier pytorch_model.bin cr√©√© ! Taille : {os.path.getsize(model_path) / (1024*1024):.2f} MB")
        
    except Exception as e:
        print(f"\n‚ùå Erreur : {str(e)}")
        print("\nüí° SOLUTIONS :")
        print("   1. V√©rifiez que trainer.save_model() a bien √©t√© ex√©cut√©")
        print("   2. V√©rifiez la sauvegarde dans Google Drive √† ce chemin :")
        print(f"      {save_path}")
        print("   3. Sinon, r√©-ex√©cutez la cellule de sauvegarde (section 7)")

print("\n" + "="*50)

In [None]:
# üß™ TEST DE CHARGEMENT - V√©rifier que le mod√®le fonctionne
from transformers import AutoModelForSequenceClassification, AutoTokenizer

save_path = '/content/drive/MyDrive/CallCenter/models/best_model'

print("üîÑ Chargement du mod√®le depuis Google Drive...\n")

try:
    # Charger le mod√®le et le tokenizer
    model = AutoModelForSequenceClassification.from_pretrained(save_path)
    tokenizer = AutoTokenizer.from_pretrained(save_path)
    
    print("‚úÖ Mod√®le charg√© avec succ√®s !")
    print(f"   Type : {model.__class__.__name__}")
    print(f"   Nombre de param√®tres : {sum(p.numel() for p in model.parameters()) / 1e6:.2f}M")
    
    # Test rapide de pr√©diction
    print("\nüß™ Test rapide de pr√©diction...")
    test_text = "Mon probl√®me est r√©solu"
    
    inputs = tokenizer(test_text, return_tensors="pt", truncation=True, max_length=128)
    outputs = model(**inputs)
    predictions = outputs.logits.argmax(-1)
    
    print(f"   Texte : '{test_text}'")
    print(f"   Classe pr√©dite : {predictions.item()}")
    print("\n‚úÖ Le mod√®le fonctionne correctement !")
    
except Exception as e:
    print(f"‚ùå Erreur lors du chargement : {str(e)}")
    print("\nüí° Assurez-vous que pytorch_model.bin existe dans le dossier")

In [None]:
# Cell √† coller dans Colab (ex√©cuter APRES l'entra√Ænement)
import os
import torch
from transformers import AutoModelForSequenceClassification

save_path = "/content/drive/MyDrive/CallCenter/models/best_model"

print("=== Listing du dossier de sauvegarde ===")
if os.path.exists(save_path):
    for f in sorted(os.listdir(save_path)):
        print(f)
else:
    raise FileNotFoundError(f"Le dossier {save_path} n'existe pas. V√©rifiez le chemin ou sauvegardez d'abord le mod√®le.")

# D√©tecter formats courants
files = os.listdir(save_path)
has_safetensors = any(f.endswith(".safetensors") for f in files)
has_single_bin = "pytorch_model.bin" in files
has_index = "pytorch_model.bin.index.json" in files
shards = [f for f in files if f.startswith("pytorch_model") and f.endswith(".bin") and f != "pytorch_model.bin"]

print("\nDetections:")
print(" - safetensors:", has_safetensors)
print(" - pytorch_model.bin exists:", has_single_bin)
print(" - sharded index json:", has_index)
print(" - shards count:", len(shards))

if has_single_bin or has_safetensors:
    print("\nUn fichier de poids unique est d√©j√† pr√©sent. Vous pouvez charger le mod√®le avec:")
    print(f"AutoModelForSequenceClassification.from_pretrained('{save_path}')")
else:
    print("\nAucun fichier unique trouv√©. On va tenter de forcer la cr√©ation d'un fichier 'pytorch_model.bin' unique.")
    # R√©cup√©rer l'objet mod√®le depuis trainer si possible, sinon recharger depuis le dossier (attention m√©moire)
    try:
        model = trainer.model  # si trainer d√©fini dans le notebook
        print(" - Mod√®le r√©cup√©r√© depuis 'trainer.model'.")
    except NameError:
        model = None
        print(" - 'trainer' non trouv√© en scope. On va essayer de recharger depuis le dossier (peut demander beaucoup de RAM).")

    # Si on ne peut pas r√©cup√©rer trainer.model, on tente from_pretrained (transformers va merger les shards automatiquement si possible)
    if model is None:
        try:
            print(" - Tentative de rechargement depuis le dossier (AutoModelForSequenceClassification.from_pretrained).")
            model = AutoModelForSequenceClassification.from_pretrained(save_path, local_files_only=False)
            print(" - Rechargement OK.")
        except Exception as e:
            raise RuntimeError("Impossible de recharger le mod√®le depuis le dossier. Message d'erreur: " + str(e))

    # G√©rer les mod√®les distribu√©s/DP
    if hasattr(model, "module"):
        print(" - D√©tect√© model.module (wrapped). On prend .module")
        model_to_save = model.module
    else:
        model_to_save = model

    # Move to CPU pour sauver (s√©curise la m√©moire GPU)
    device_before = next(model_to_save.parameters()).device
    try:
        model_to_save.to("cpu")
    except Exception as e:
        print(" - Warning: impossible de d√©placer le mod√®le sur CPU:", e)

    # Sauvegarder state_dict en un seul fichier
    target_file = os.path.join(save_path, "pytorch_model.bin")
    print(f"\nSauvegarde de state_dict dans: {target_file}")
    try:
        torch.save(model_to_save.state_dict(), target_file)
        print(" - Sauvegarde r√©ussie.")
    except Exception as e:
        raise RuntimeError("Erreur lors de torch.save: " + str(e))
    finally:
        # remettre sur l'appareil d'origine si possible
        try:
            model_to_save.to(device_before)
        except Exception:
            pass

    print("\nListe finale des fichiers:")
    for f in sorted(os.listdir(save_path)):
        print(f)

    print("\nVous pouvez maintenant charger avec:\nAutoModelForSequenceClassification.from_pretrained('{}')".format(save_path))