# Guide Complet : Fine-tuning d'un LLM Open-Source en Local

Ce notebook vous guide √† travers le processus complet de fine-tuning d'un mod√®le de langage (LLM) open-source sur votre machine locale. Nous utiliserons des techniques modernes comme LoRA (Low-Rank Adaptation) pour un entra√Ænement efficace.

## üéØ Objectifs
- Apprendre √† fine-tuner un LLM localement
- Utiliser LoRA pour un entra√Ænement efficace en m√©moire
- Pr√©parer et traiter des donn√©es d'entra√Ænement
- √âvaluer et sauvegarder le mod√®le fine-tun√©

## üìã Pr√©requis
- Python 3.8+
- GPU recommand√© (mais CPU possible)
- Au moins 8GB de RAM (16GB+ recommand√©)
- Espace disque suffisant pour le mod√®le (~3-7GB selon le mod√®le)

## üöÄ Commen√ßons !

## 1. üì¶ Installation des Biblioth√®ques N√©cessaires

Nous commen√ßons par installer toutes les biblioth√®ques requises pour le fine-tuning. Cette √©tape peut prendre quelques minutes selon votre connexion internet.

In [None]:
# Installation des biblioth√®ques principales
# D√©commentez la ligne suivante si vous n'avez pas encore install√© les d√©pendances
# !pip install -r ../requirements.txt

# Imports n√©cessaires
import torch
import os
import json
import pandas as pd
from transformers import (
    AutoTokenizer, 
    AutoModelForCausalLM, 
    TrainingArguments, 
    Trainer,
    DataCollatorForLanguageModeling
)
from datasets import Dataset, DatasetDict
from peft import LoraConfig, get_peft_model, TaskType
import numpy as np
from datetime import datetime

print("‚úÖ Biblioth√®ques import√©es avec succ√®s")
print(f"üî• PyTorch version: {torch.__version__}")
print(f"üîß Device disponible: {'CUDA' if torch.cuda.is_available() else 'CPU'}")
if torch.cuda.is_available():
    print(f"üéÆ GPU: {torch.cuda.get_device_name(0)}")
    print(f"üíæ M√©moire GPU: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")

## 2. ü§ñ Charger un Mod√®le LLM Open-Source

Nous allons charger un mod√®le open-source adapt√© au fine-tuning. Pour cet exemple, nous utiliserons Microsoft DialoGPT, un mod√®le conversationnel relativement l√©ger et efficace.

**Options de mod√®les populaires :**
- `microsoft/DialoGPT-medium` (117M param√®tres) - Bon pour d√©buter
- `microsoft/DialoGPT-large` (345M param√®tres) - Plus puissant
- `facebook/opt-350m` (350M param√®tres) - Alternative int√©ressante
- `EleutherAI/gpt-neo-125M` (125M param√®tres) - Tr√®s l√©ger pour tests

In [None]:
# Configuration du mod√®le
MODEL_NAME = "microsoft/DialoGPT-medium"
CACHE_DIR = "../models/cache"

# Cr√©er le r√©pertoire de cache
os.makedirs(CACHE_DIR, exist_ok=True)

print(f"üîÑ Chargement du mod√®le: {MODEL_NAME}")

# Charger le tokenizer
tokenizer = AutoTokenizer.from_pretrained(
    MODEL_NAME, 
    cache_dir=CACHE_DIR,
    padding_side='left'  # Important pour les mod√®les causaux
)

# Ajouter un token de padding si n√©cessaire
if tokenizer.pad_token is None:
    tokenizer.pad_token = tokenizer.eos_token
    tokenizer.pad_token_id = tokenizer.eos_token_id

print(f"‚úÖ Tokenizer charg√©")
print(f"üìù Taille du vocabulaire: {len(tokenizer):,} tokens")
print(f"üîö Token EOS: '{tokenizer.eos_token}' (ID: {tokenizer.eos_token_id})")
print(f"üìã Token PAD: '{tokenizer.pad_token}' (ID: {tokenizer.pad_token_id})")

# Charger le mod√®le
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    cache_dir=CACHE_DIR,
    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
    device_map="auto" if torch.cuda.is_available() else None
)

if not torch.cuda.is_available():
    model = model.to(device)

print(f"‚úÖ Mod√®le charg√© sur {device}")

# Informations sur le mod√®le
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)

print(f"üìä Param√®tres totaux: {total_params:,}")
print(f"üéØ Param√®tres entra√Ænables: {trainable_params:,}")
print(f"üìà Pourcentage entra√Ænable: {(trainable_params/total_params)*100:.1f}%")

## 3. üìä Pr√©parer les Donn√©es d'Entra√Ænement

Nous allons cr√©er un jeu de donn√©es d'exemple pour le fine-tuning. Dans un cas r√©el, vous remplaceriez ceci par vos propres donn√©es.

**Format des donn√©es pour la conversation :**
```json
{
  "conversations": [
    {
      "input": "Question de l'utilisateur",
      "output": "R√©ponse de l'assistant"
    }
  ]
}
```

In [None]:
# Cr√©er des donn√©es d'exemple pour la d√©monstration
# Dans un cas r√©el, vous chargeriez vos propres donn√©es

sample_conversations = [
    {
        "input": "Bonjour, comment allez-vous ?",
        "output": "Bonjour ! Je vais tr√®s bien, merci de demander. Comment puis-je vous aider aujourd'hui ?"
    },
    {
        "input": "Pouvez-vous m'expliquer ce qu'est l'intelligence artificielle ?",
        "output": "L'intelligence artificielle (IA) est un domaine de l'informatique qui vise √† cr√©er des machines capables de r√©aliser des t√¢ches n√©cessitant normalement l'intelligence humaine, comme la compr√©hension du langage, la reconnaissance d'images, ou la prise de d√©cisions."
    },
    {
        "input": "Quels sont les avantages du machine learning ?",
        "output": "Le machine learning offre plusieurs avantages : automatisation des t√¢ches complexes, capacit√© √† traiter de grandes quantit√©s de donn√©es, am√©lioration continue des performances, d√©tection de patterns invisibles √† l'≈ìil humain, et personnalisation des exp√©riences utilisateur."
    },
    {
        "input": "Comment fonctionne un r√©seau de neurones ?",
        "output": "Un r√©seau de neurones est inspir√© du cerveau humain. Il est compos√© de neurones artificiels organis√©s en couches qui traitent l'information. Chaque connexion a un poids qui s'ajuste pendant l'entra√Ænement pour apprendre √† reconna√Ætre des patterns dans les donn√©es."
    },
    {
        "input": "Qu'est-ce que le deep learning ?",
        "output": "Le deep learning est une sous-branche du machine learning qui utilise des r√©seaux de neurones profonds (avec plusieurs couches cach√©es) pour apprendre des repr√©sentations complexes des donn√©es. Il excelle dans des t√¢ches comme la vision par ordinateur et le traitement du langage naturel."
    },
    # Ajout de plus d'exemples pour un entra√Ænement plus robuste
    {
        "input": "Merci pour votre aide !",
        "output": "Je vous en prie ! C'√©tait un plaisir de vous aider. N'h√©sitez pas si vous avez d'autres questions."
    },
    {
        "input": "Qu'est-ce que Python ?",
        "output": "Python est un langage de programmation populaire, connu pour sa simplicit√© et sa lisibilit√©. Il est largement utilis√© en data science, intelligence artificielle, d√©veloppement web et automatisation."
    },
    {
        "input": "Comment apprendre la programmation ?",
        "output": "Pour apprendre la programmation, commencez par choisir un langage (Python est excellent pour d√©buter), pratiquez r√©guli√®rement avec des petits projets, utilisez des ressources en ligne, et n'h√©sitez pas √† rejoindre des communaut√©s de d√©veloppeurs."
    }
]

print(f"üìö Dataset cr√©√© avec {len(sample_conversations)} exemples")

# Afficher quelques exemples
print("\nüîç Aper√ßu des donn√©es:")
for i, conv in enumerate(sample_conversations[:3]):
    print(f"\nExemple {i+1}:")
    print(f"  Input: {conv['input']}")
    print(f"  Output: {conv['output'][:100]}...")

In [None]:
# Fonction pour formater les conversations
def format_conversation(example):
    """Formate une conversation pour l'entra√Ænement"""
    input_text = example["input"]
    output_text = example["output"]
    
    # Format conversationnel avec tokens sp√©ciaux
    formatted_text = f"<|user|>{input_text}<|endoftext|><|assistant|>{output_text}<|endoftext|>"
    return {"text": formatted_text}

# Convertir en Dataset HuggingFace
dataset = Dataset.from_list(sample_conversations)
dataset = dataset.map(format_conversation)

print("‚úÖ Dataset format√©")
print(f"üìä Colonnes: {dataset.column_names}")
print(f"üìè Taille: {len(dataset)} exemples")

# Exemple de texte format√©
print(f"\nüìù Exemple de texte format√©:")
print(dataset[0]["text"])

# Diviser en train/validation (80/20)
dataset_split = dataset.train_test_split(test_size=0.2, seed=42)
train_dataset = dataset_split["train"]
eval_dataset = dataset_split["test"]

print(f"\nüìä Split des donn√©es:")
print(f"  Train: {len(train_dataset)} exemples")
print(f"  Validation: {len(eval_dataset)} exemples")

# Fonction de tokenisation
def tokenize_function(examples):
    """Tokenise les textes pour l'entra√Ænement"""
    # Tokeniser avec padding et truncation
    result = tokenizer(
        examples["text"],
        truncation=True,
        padding="max_length",
        max_length=512,
        return_tensors=None
    )
    
    # Pour l'entra√Ænement causal, les labels sont les m√™mes que input_ids
    result["labels"] = result["input_ids"].copy()
    
    return result

# Tokeniser les datasets
train_dataset = train_dataset.map(
    tokenize_function,
    batched=True,
    remove_columns=["input", "output", "text"]
)

eval_dataset = eval_dataset.map(
    tokenize_function,
    batched=True,
    remove_columns=["input", "output", "text"]
)

print("‚úÖ Datasets tokenis√©s")
print(f"üîß Colonnes finales: {train_dataset.column_names}")

# V√©rifier la forme des donn√©es
print(f"üìê Forme d'un √©chantillon:")
sample = train_dataset[0]
for key, value in sample.items():
    print(f"  {key}: {len(value) if isinstance(value, list) else type(value)}")

## 4. ‚öôÔ∏è Configurer le Fine-tuning avec LoRA

LoRA (Low-Rank Adaptation) est une technique qui permet de fine-tuner efficacement de gros mod√®les en n'entra√Ænant qu'une petite fraction des param√®tres. Cela r√©duit consid√©rablement les besoins en m√©moire et en calcul.

**Avantages de LoRA :**
- üöÄ Entra√Ænement plus rapide
- üíæ Moins d'utilisation m√©moire
- üéØ R√©sultats comparables au fine-tuning complet
- üíΩ Mod√®les plus petits √† stocker

In [None]:
# Configuration LoRA
lora_config = LoraConfig(
    task_type=TaskType.CAUSAL_LM,  # Type de t√¢che: mod√®le de langage causal
    r=16,                          # Rang de la d√©composition (plus bas = moins de param√®tres)
    lora_alpha=32,                 # Param√®tre de scaling LoRA
    lora_dropout=0.1,              # Dropout pour la r√©gularisation
    target_modules=["c_attn", "c_proj", "c_fc"],  # Modules √† adapter (sp√©cifique au mod√®le)
    bias="none"                    # Ne pas adapter les bias
)

print("üîß Configuration LoRA:")
print(f"  Rang (r): {lora_config.r}")
print(f"  Alpha: {lora_config.lora_alpha}")
print(f"  Dropout: {lora_config.lora_dropout}")
print(f"  Modules cibles: {lora_config.target_modules}")

# Appliquer LoRA au mod√®le
model = get_peft_model(model, lora_config)

# Afficher les informations apr√®s LoRA
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)

print(f"\nüìä Param√®tres apr√®s LoRA:")
print(f"  Total: {total_params:,}")
print(f"  Entra√Ænables: {trainable_params:,}")
print(f"  Pourcentage entra√Ænable: {(trainable_params/total_params)*100:.2f}%")
print(f"  R√©duction: {((total_params-trainable_params)/total_params)*100:.1f}% de param√®tres en moins √† entra√Æner!")

# V√©rifier que LoRA est bien appliqu√©
model.print_trainable_parameters()

In [None]:
# Configuration des param√®tres d'entra√Ænement
output_dir = "../models/finetuned"
os.makedirs(output_dir, exist_ok=True)

training_args = TrainingArguments(
    output_dir=output_dir,
    
    # Param√®tres d'entra√Ænement
    num_train_epochs=3,                    # Nombre d'√©poques
    per_device_train_batch_size=2,         # Taille de batch (ajustez selon votre GPU)
    per_device_eval_batch_size=2,          # Taille de batch pour l'√©valuation
    gradient_accumulation_steps=4,         # Accumulation de gradients
    
    # Optimiseur
    learning_rate=2e-4,                    # Taux d'apprentissage
    weight_decay=0.01,                     # D√©croissance des poids
    warmup_ratio=0.1,                      # Warmup
    lr_scheduler_type="cosine",            # Type de scheduler
    
    # Sauvegarde et √©valuation
    save_strategy="steps",
    save_steps=50,                         # Sauvegarder tous les 50 steps
    evaluation_strategy="steps",
    eval_steps=25,                         # √âvaluer tous les 25 steps
    save_total_limit=3,                    # Garder seulement 3 checkpoints
    load_best_model_at_end=True,
    
    # Logging
    logging_steps=10,
    logging_dir="../logs",
    
    # Optimisations
    fp16=torch.cuda.is_available(),        # Pr√©cision mixte si GPU disponible
    dataloader_num_workers=2,
    remove_unused_columns=False,
    
    # Autres
    seed=42,
    data_seed=42,
    report_to=[],                          # D√©sactiver W&B pour la d√©mo
)

print("‚úÖ Arguments d'entra√Ænement configur√©s")
print(f"üéØ √âpoques: {training_args.num_train_epochs}")
print(f"üì¶ Batch size: {training_args.per_device_train_batch_size}")
print(f"üéöÔ∏è Learning rate: {training_args.learning_rate}")
print(f"üíæ R√©pertoire de sortie: {training_args.output_dir}")
print(f"üî• FP16: {training_args.fp16}")

# Data collator pour l'entra√Ænement de mod√®les de langage
data_collator = DataCollatorForLanguageModeling(
    tokenizer=tokenizer,
    mlm=False,  # Pas de masquage pour les mod√®les causaux
    pad_to_multiple_of=8 if training_args.fp16 else None
)

print("‚úÖ Data collator configur√©")

## 5. üöÄ Lancer le Fine-tuning

Maintenant que tout est configur√©, nous pouvons lancer l'entra√Ænement ! Le processus peut prendre quelques minutes selon votre mat√©riel.

**‚è±Ô∏è Temps estim√© :**
- CPU: 10-30 minutes
- GPU (GTX 1060/RTX 2060): 5-15 minutes  
- GPU (RTX 3080+): 2-5 minutes

In [None]:
# Cr√©er le trainer
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    tokenizer=tokenizer,
    data_collator=data_collator,
)

print("‚úÖ Trainer cr√©√©")
print("\nüî• D√©but de l'entra√Ænement...")
print("="*50)

# Lancer l'entra√Ænement
start_time = datetime.now()

try:
    # Entra√Æner le mod√®le
    trainer.train()
    
    end_time = datetime.now()
    training_time = end_time - start_time
    
    print("="*50)
    print("üéâ Entra√Ænement termin√© avec succ√®s !")
    print(f"‚è±Ô∏è Temps total: {training_time}")
    
    # Afficher les m√©triques finales
    final_metrics = trainer.state.log_history[-1]
    print(f"\nüìä M√©triques finales:")
    for key, value in final_metrics.items():
        if isinstance(value, float):
            print(f"  {key}: {value:.4f}")
        else:
            print(f"  {key}: {value}")
            
except Exception as e:
    print(f"‚ùå Erreur durante l'entra√Ænement: {e}")
    raise

## 6. üìà √âvaluer le Mod√®le Fine-tun√©

Maintenant que l'entra√Ænement est termin√©, √©valuons les performances du mod√®le et testons-le avec quelques exemples.

In [None]:
# √âvaluation sur le jeu de validation
print("üîç √âvaluation sur le jeu de validation...")
eval_results = trainer.evaluate()

print("üìä R√©sultats d'√©valuation:")
for metric, value in eval_results.items():
    if isinstance(value, float):
        print(f"  {metric}: {value:.4f}")
    else:
        print(f"  {metric}: {value}")

# Fonction pour g√©n√©rer du texte avec le mod√®le fine-tun√©
def generate_response(prompt, max_length=200, temperature=0.7):
    """G√©n√®re une r√©ponse avec le mod√®le fine-tun√©"""
    # Formater le prompt
    formatted_prompt = f"<|user|>{prompt}<|endoftext|><|assistant|>"
    
    # Tokeniser
    inputs = tokenizer.encode(formatted_prompt, return_tensors="pt").to(device)
    
    # G√©n√©rer
    with torch.no_grad():
        outputs = model.generate(
            inputs,
            max_length=len(inputs[0]) + max_length,
            temperature=temperature,
            top_p=0.9,
            do_sample=True,
            pad_token_id=tokenizer.pad_token_id,
            eos_token_id=tokenizer.eos_token_id
        )
    
    # D√©coder seulement la partie g√©n√©r√©e
    generated_text = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
    
    # Nettoyer la r√©ponse
    if "<|endoftext|>" in generated_text:
        generated_text = generated_text.split("<|endoftext|>")[0]
    
    return generated_text.strip()

# Tester le mod√®le avec quelques exemples
test_prompts = [
    "Bonjour, pouvez-vous m'aider ?",
    "Qu'est-ce que le machine learning ?",
    "Comment puis-je apprendre l'IA ?",
    "Expliquez-moi Python simplement",
    "Merci pour votre aide !"
]

print("\nüß™ Test du mod√®le fine-tun√©:")
print("="*60)

for i, prompt in enumerate(test_prompts, 1):
    print(f"\nüìù Test {i}:")
    print(f"üë§ Utilisateur: {prompt}")
    
    response = generate_response(prompt)
    print(f"ü§ñ Assistant: {response}")
    print("-" * 40)

## 7. üíæ Sauvegarder et Charger le Mod√®le Fine-tun√©

Une fois satisfait des r√©sultats, nous pouvons sauvegarder le mod√®le pour une utilisation future.

In [None]:
# Sauvegarder le mod√®le fine-tun√©
save_path = "../models/my_finetuned_model"
os.makedirs(save_path, exist_ok=True)

print(f"üíæ Sauvegarde du mod√®le dans {save_path}...")

# Sauvegarder le mod√®le LoRA
model.save_pretrained(save_path)

# Sauvegarder le tokenizer
tokenizer.save_pretrained(save_path)

# Sauvegarder les m√©triques d'entra√Ænement
metrics_path = os.path.join(save_path, "training_metrics.json")
with open(metrics_path, "w") as f:
    json.dump(trainer.state.log_history, f, indent=2)

print("‚úÖ Mod√®le sauvegard√© avec succ√®s !")

# Lister les fichiers sauvegard√©s
import os
saved_files = os.listdir(save_path)
print(f"\nüìÅ Fichiers sauvegard√©s:")
for file in saved_files:
    file_path = os.path.join(save_path, file)
    if os.path.isfile(file_path):
        size = os.path.getsize(file_path) / (1024*1024)  # MB
        print(f"  üìÑ {file} ({size:.1f} MB)")

print(f"\nüìä Taille totale du mod√®le:")
total_size = sum(os.path.getsize(os.path.join(save_path, f)) 
                for f in saved_files if os.path.isfile(os.path.join(save_path, f)))
print(f"  {total_size / (1024*1024):.1f} MB")

In [None]:
# D√©monstration du rechargement du mod√®le
print("üîÑ D√©monstration du rechargement du mod√®le...")

# Pour recharger le mod√®le plus tard, utilisez ce code:
from peft import PeftModel

def load_finetuned_model(model_path, base_model_name):
    """Charge un mod√®le fine-tun√© avec LoRA"""
    
    # Charger le tokenizer
    loaded_tokenizer = AutoTokenizer.from_pretrained(model_path)
    
    # Charger le mod√®le de base
    base_model = AutoModelForCausalLM.from_pretrained(
        base_model_name,
        torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
        device_map="auto" if torch.cuda.is_available() else None
    )
    
    # Charger les adaptateurs LoRA
    loaded_model = PeftModel.from_pretrained(base_model, model_path)
    
    return loaded_model, loaded_tokenizer

# Exemple d'utilisation (comment√© pour √©viter de recharger maintenant)
"""
loaded_model, loaded_tokenizer = load_finetuned_model(
    save_path, 
    MODEL_NAME
)
print("‚úÖ Mod√®le recharg√© avec succ√®s !")
"""

print("üìù Code de rechargement pr√™t √† utiliser !")

# Afficher le code d'utilisation
usage_code = f'''
# Pour utiliser votre mod√®le fine-tun√© plus tard:

from transformers import AutoTokenizer, AutoModelForCausalLM
from peft import PeftModel
import torch

# Chemins
model_path = "{save_path}"
base_model_name = "{MODEL_NAME}"

# Charger le tokenizer
tokenizer = AutoTokenizer.from_pretrained(model_path)

# Charger le mod√®le de base
base_model = AutoModelForCausalLM.from_pretrained(
    base_model_name,
    torch_dtype=torch.float16,
    device_map="auto"
)

# Charger les adaptateurs LoRA
model = PeftModel.from_pretrained(base_model, model_path)

# Fonction de g√©n√©ration
def chat_with_model(prompt):
    formatted_prompt = f"<|user|>{{prompt}}<|endoftext|><|assistant|>"
    inputs = tokenizer.encode(formatted_prompt, return_tensors="pt")
    
    with torch.no_grad():
        outputs = model.generate(
            inputs,
            max_length=len(inputs[0]) + 200,
            temperature=0.7,
            top_p=0.9,
            do_sample=True,
            pad_token_id=tokenizer.pad_token_id
        )
    
    response = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
    return response.split("<|endoftext|>")[0].strip()

# Utilisation
response = chat_with_model("Bonjour, comment allez-vous ?")
print(response)
'''

print("üí° Code d'utilisation:")
print(usage_code)

## üéâ Conclusion

F√©licitations ! Vous avez r√©ussi √† fine-tuner un LLM en local avec LoRA. 

### üéØ Ce que vous avez appris :
- ‚úÖ Charger et pr√©parer un mod√®le LLM open-source
- ‚úÖ Pr√©parer et formater des donn√©es d'entra√Ænement
- ‚úÖ Configurer LoRA pour un fine-tuning efficace
- ‚úÖ Entra√Æner le mod√®le avec des param√®tres optimaux
- ‚úÖ √âvaluer et tester le mod√®le fine-tun√©
- ‚úÖ Sauvegarder et recharger le mod√®le

### üöÄ Prochaines √©tapes :
1. **Donn√©es r√©elles** : Remplacez les donn√©es d'exemple par vos propres donn√©es
2. **Mod√®les plus gros** : Essayez des mod√®les plus grands comme Llama 2 7B
3. **Optimisations** : Exp√©rimentez avec diff√©rents param√®tres LoRA
4. **D√©ploiement** : Int√©grez votre mod√®le dans une application
5. **√âvaluation avanc√©e** : Utilisez des m√©triques plus sophistiqu√©es

### üìö Ressources utiles :
- [Documentation PEFT](https://huggingface.co/docs/peft/)
- [LoRA Paper](https://arxiv.org/abs/2106.09685)
- [Transformers Documentation](https://huggingface.co/docs/transformers/)
- [Datasets Documentation](https://huggingface.co/docs/datasets/)

### üí° Conseils pour l'optimisation :
- **Augmentez les donn√©es** : Plus de donn√©es = meilleur mod√®le
- **Ajustez LoRA** : Exp√©rimentez avec `r` et `alpha`
- **Monitoring** : Utilisez W&B ou TensorBoard pour suivre l'entra√Ænement
- **GPU** : Un GPU acc√©l√®re consid√©rablement le processus

Bonne chance avec vos projets de fine-tuning ! üöÄ