# Entra√Ænement d'un Mod√®le de Computer Vision YOLO Personnalis√© pour Dofus (Transfer Learning)
## INTRODUCTION
Bienvenue dans ce guide interactif ! L'objectif est de vous accompagner, √©tape par √©tape, dans l'entra√Ænement d'un mod√®le de d√©tection d'objets YOLO personnalis√©. Gr√¢ce √† ce mod√®le, vous pourrez reconna√Ætre automatiquement des ressources pour bucheron et paysan dans des images du jeu Dofus.

**Les outils que nous allons utiliser :**
1.  **Votre dataset Dofus annot√© :**
    *   **Option A (Label Studio) :** Vous l'avez pr√©par√© avec soin en utilisant Label Studio.
    *   **Option B (Roboflow) :** Vous pouvez utilis√© roboflow pour r√©cup√©rer mon dataset ou faire le votre.
2.  **Ultralytics :** Une biblioth√®que Python puissante et conviviale pour entra√Æner les derni√®res g√©n√©rations de mod√®les YOLO.
3.  **Google Colab :** Notre environnement de travail. Il nous offre un acc√®s gratuit √† des GPUs (processeurs graphiques), indispensables pour acc√©l√©rer l'entra√Ænement.

**Ce que vous obtiendrez √† la fin :**
-   Un mod√®le YOLO entra√Æn√© et performant (un fichier `.pt`).
-   Un fichier ZIP (`dofus_AI.zip`) contenant votre mod√®le et les fichiers de configuration, pr√™t √† √™tre t√©l√©charg√© et utilis√© dans vos propres projets.

Suivez attentivement les √©tapes ci-dessous. Chaque bloc de code est ex√©cutable directement dans Colab.


# √âTAPE 0 : V√âRIFIER LA DISPONIBILIT√â DU GPU NVIDIA
Pour que l'entra√Ænement soit rapide, il est crucial d'utiliser un GPU.
**Action :** Assurez-vous que Colab utilise bien un GPU.
1.  Dans le menu Colab : "Ex√©cution" (ou "Runtime").
2.  Cliquez sur "Modifier le type d'ex√©cution" (ou "Change runtime type").
3.  Dans la section "Acc√©l√©rateur mat√©riel" (ou "Hardware accelerator"), s√©lectionnez "GPU" (g√©n√©ralement T4).
4.  Sauvegardez.

Ex√©cutez la commande ci-dessous pour confirmer que le GPU est bien d√©tect√© :

In [None]:
!nvidia-smi

*(Vous devriez voir appara√Ætre des informations sur un GPU NVIDIA, comme Tesla T4, K80, etc.)*

---

**SI VOUS UTILISEZ UN DATASET EXPORT√â DE LABEL STUDIO, SUIVEZ L'√âTAPE 1 CI-DESSOUS.**   
**SI VOUS UTILISEZ UN DATASET EXPORT√â DE ROBOFLOW, PASSEZ DIRECTEMENT √Ä L'√âTAPE 1 (ALTERNATIVE) CI-DESSOUS.**

---

## √âTAPE 1 : PR√âPARATION DE VOTRE DATASET DOFUS (EXPORT√â DE LABEL STUDIO)

Cette √©tape est fondamentale : la qualit√© de votre mod√®le d√©pendra directement de la qualit√© de votre dataset.

### 1.1 Rappels sur la pr√©paration de votre dataset avec Label Studio
Pour cr√©er le dataset j'ai utilis√© Label Studio ([https://labelstud.io/](https://labelstud.io/)) qui permet d'annoter nos images Dofus. Pour la d√©tection d'objets avec YOLO, le processus consiste √† :
1.  Dessiner des **bo√Ætes englobantes** (bounding boxes) autour des objets d'int√©r√™t, des ressources dans notre cas.
2.  Assigner une **classe** (un nom) √† chaque bo√Æte (par exemple, "Frene", "Ble", "Eau").

**Format d'exportation depuis Label Studio :**
Lorsque vous exportez votre projet depuis Label Studio, il est imp√©ratif de choisir le format **"YOLO"**.
Cet export g√©n√®re typiquement :
-   Un dossier `images/` : Contient toutes vos images originales (ex: `.jpg`, `.png`).
-   Un dossier `labels/` : Contient des fichiers `.txt` portant le m√™me nom que vos images. Chaque fichier `.txt` d√©crit les objets de l'image correspondante, avec une ligne par objet :
    `<class_id> <x_center_norm> <y_center_norm> <width_norm> <height_norm>`
    *   `<class_id>` : Un num√©ro identifiant la classe (commen√ßant √† 0).
    *   Les autres valeurs sont les coordonn√©es normalis√©es (entre 0 et 1) du centre de la bo√Æte, sa largeur et sa hauteur, relatives √† la taille de l'image.
-   Un fichier `classes.txt` : Liste tous les noms de vos classes, un par ligne. L'ordre est CRUCIAL car il d√©finit les `class_id` (la premi√®re ligne est la classe 0, la deuxi√®me la classe 1, etc.).

**‚úÖ Action requise de votre part (pr√©paration du ZIP) :**
1.  Exportez votre projet Label Studio au format YOLO.
2.  Cr√©ez un fichier ZIP unique nomm√© `data.zip`.
3.  **Important :** Ce `data.zip` DOIT contenir **√Ä SA RACINE** (pas dans un sous-dossier √† l'int√©rieur du ZIP) :
    -   Le dossier `images/` (avec vos images).
    -   Le dossier `labels/` (avec vos fichiers d'annotation `.txt`).
    -   Le fichier `classes.txt` (listant vos classes).

**Exemple de structure attendue √† l'int√©rieur de `data.zip` :**
```
data.zip/
  ‚îú‚îÄ‚îÄ images/
  ‚îÇ   ‚îú‚îÄ‚îÄ dofus_image1.jpg
  ‚îÇ   ‚îú‚îÄ‚îÄ dofus_image2.png
  ‚îÇ   ‚îî‚îÄ‚îÄ ...
  ‚îú‚îÄ‚îÄ labels/
  ‚îÇ   ‚îú‚îÄ‚îÄ dofus_image1.txt
  ‚îÇ   ‚îú‚îÄ‚îÄ dofus_image2.txt
  ‚îÇ   ‚îî‚îÄ‚îÄ ...
  ‚îî‚îÄ‚îÄ classes.txt
```
**Exemple de contenu du fichier `classes.txt` pour Dofus :**
```
Frene
Ble
Eau
...
```
*(Assurez-vous que les noms de classes sont exacts et dans l'ordre souhait√©.)*

### 1.2 T√©l√©verser votre `data.zip` sur Colab

Vous avez deux options pour importer votre `data.zip` dans l'environnement Colab.

**OPTION A : T√©l√©chargement direct via l'interface Colab (pour les petits fichiers, < 100Mo)**
1.  Dans la barre lat√©rale gauche de Colab, cliquez sur l'ic√¥ne "Dossier" üìÅ.
2.  Cliquez sur l'ic√¥ne "Importer dans l'espace de stockage de la session" (üìÑ‚Üë).
3.  S√©lectionnez votre fichier `data.zip` depuis votre ordinateur.
4.  Attendez que le t√©l√©chargement soit complet (le fichier `data.zip` appara√Ætra dans la liste).

**OPTION B : Copier depuis Google Drive (recommand√© pour les datasets plus volumineux)**
1.  Uploadez votre `data.zip` sur votre Google Drive (par exemple, dans un dossier `MesProjetsIA/Dofus`).  (Par exemple dans mon cas j'ai cr√©√© un dossier dans mon Drive appel√© DOFUS_BOT o√π j'ai mis mon `data.zip`)
2.  Ex√©cutez le code ci-dessous. Vous devrez autoriser Colab √† acc√©der √† votre Drive.
3.  **‚ö†Ô∏è ATTENTION :** Modifiez la ligne `!cp /content/gdrive/MyDrive/DOFUS_BOT/data.zip ...` pour qu'elle corresponde au chemin exact de votre `data.zip` sur votre Drive.

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

!cp /content/gdrive/MyDrive/DOFUS_BOT/data.zip /content/data.zip # Adaptez ce chemin !

### 1.3 D√©compresser le dataset et organiser les donn√©es pour l'entra√Ænement
Une fois `data.zip` upload√©, il devrait se trouver dans `/content/data.zip`.
V√©rifions sa pr√©sence :

In [None]:
!ls -lh /content/data.zip

Maintenant, d√©compressons ce ZIP. Nous allons placer son contenu dans un dossier `/content/custom_data`.
Ce dossier `custom_data` contiendra donc vos dossiers `images/`, `labels/` et votre fichier `classes.txt` (exactement la structure que vous aviez dans le ZIP).

In [None]:
!unzip -q /content/data.zip -d /content/custom_data
# V√©rifions le contenu de custom_data
!ls /content/custom_data

*(Vous devriez voir `images`, `labels`, et `classes.txt` list√©s.)*

Ultralytics (et les bonnes pratiques en Machine Learning) n√©cessite que les donn√©es soient s√©par√©es en au moins deux ensembles :
-   **Ensemble d'entra√Ænement (train) :** Utilis√© pour apprendre au mod√®le.
-   **Ensemble de validation (val) :** Utilis√© pour √©valuer la performance du mod√®le sur des donn√©es qu'il n'a jamais vues pendant l'entra√Ænement. Cela aide √† d√©tecter le sur-apprentissage (overfitting) et √† choisir le "meilleur" mod√®le.

Le script Python ci-dessous va :
1.  Prendre vos donn√©es depuis `/content/custom_data/`.
2.  Cr√©er une nouvelle structure de dossiers dans `/content/data/` avec des sous-dossiers `train/images`, `train/labels`, `validation/images`, `validation/labels`.
3.  R√©partir al√©atoirement vos images (et leurs labels correspondants) entre ces ensembles d'entra√Ænement et de validation. Nous utiliserons une r√©partition classique de 80% pour l'entra√Ænement et 20% pour la validation.

In [None]:
import os
import shutil
import random
from pathlib import Path

# --- Configuration du split ---
data_path_source = "/content/custom_data"  # Dossier source apr√®s d√©compression de data.zip
output_data_root = "/content/data"         # Dossier de sortie pour les donn√©es organis√©es
train_percentage_split = 0.8               # 80% pour l'entra√Ænement, 20% pour la validation

print(f"Source des donn√©es : {data_path_source}")
print(f"Destination des donn√©es organis√©es : {output_data_root}")
print(f"Pourcentage pour l'entra√Ænement : {train_percentage_split*100}%\n")

# V√©rifier si le dossier source existe
if not os.path.isdir(data_path_source):
   print(f"ERREUR : Le dossier source '{data_path_source}' est introuvable.")
   print("Veuillez v√©rifier que votre `data.zip` a √©t√© correctement d√©compress√© dans `custom_data`.")
   # Vous pouvez ajouter un `raise Exception(...)` ici si vous voulez arr√™ter le script
else:
    # D√©finir les chemins des sous-dossiers source
    input_image_path_str = os.path.join(data_path_source, 'images')
    input_label_path_str = os.path.join(data_path_source, 'labels')

    # V√©rifier l'existence des dossiers images et labels source
    if not os.path.isdir(input_image_path_str):
        print(f"ERREUR : Le dossier d'images source '{input_image_path_str}' est introuvable dans '{data_path_source}'.")
    if not os.path.isdir(input_label_path_str):
        print(f"ERREUR : Le dossier de labels source '{input_label_path_str}' est introuvable dans '{data_path_source}'.")

    # D√©finir les chemins des dossiers de destination
    train_img_path_str = os.path.join(output_data_root, 'train/images')
    train_txt_path_str = os.path.join(output_data_root, 'train/labels')
    val_img_path_str = os.path.join(output_data_root, 'validation/images')
    val_txt_path_str = os.path.join(output_data_root, 'validation/labels')

    # Cr√©er les dossiers de destination s'ils n'existent pas
    for dir_path_str in [train_img_path_str, train_txt_path_str, val_img_path_str, val_txt_path_str]:
       if not os.path.exists(dir_path_str):
          os.makedirs(dir_path_str)
          print(f"Dossier cr√©√© : {dir_path_str}")

    # Obtenir la liste de tous les fichiers images
    # Utilisation de Path pour rglob qui cherche r√©cursivement (utile si vous avez des sous-dossiers dans images/)
    # Si vos images sont toutes √† la racine de 'images/', os.listdir pourrait aussi fonctionner.
    img_file_list = [p for p in Path(input_image_path_str).rglob('*') if p.is_file()]
    # S'assurer que ce sont bien des fichiers et pas des dossiers cach√©s comme .DS_Store
    img_file_list = [f for f in img_file_list if not f.name.startswith('.')]


    if not img_file_list:
        print(f"ERREUR : Aucun fichier image trouv√© dans '{input_image_path_str}'.")
    else:
        print(f"\nNombre total de fichiers images trouv√©s : {len(img_file_list)}")

        # M√©langer la liste des fichiers pour une s√©lection al√©atoire
        random.shuffle(img_file_list)

        # D√©terminer le nombre de fichiers pour chaque ensemble
        file_num_total = len(img_file_list)
        train_num = int(file_num_total * train_percentage_split)
        val_num = file_num_total - train_num

        print(f"Nombre d'images pour l'entra√Ænement : {train_num}")
        print(f"Nombre d'images pour la validation : {val_num}\n")

        # R√©partir les fichiers
        print("D√©but de la copie des fichiers d'entra√Ænement...")
        for i in range(train_num):
            img_path_obj = img_file_list[i]
            img_filename = img_path_obj.name
            base_filename = img_path_obj.stem
            label_filename = base_filename + '.txt'
            label_path_source_obj = Path(input_label_path_str) / label_filename

            # Copier l'image
            shutil.copy(str(img_path_obj), os.path.join(train_img_path_str, img_filename))

            # Copier le fichier label correspondant s'il existe
            if label_path_source_obj.exists():
                shutil.copy(str(label_path_source_obj), os.path.join(train_txt_path_str, label_filename))
            # else:
            #     print(f"  INFO: Fichier label '{label_filename}' non trouv√© pour l'image d'entra√Ænement '{img_filename}'. (Peut √™tre une image de fond)")

        print("Fin de la copie des fichiers d'entra√Ænement.")
        print("D√©but de la copie des fichiers de validation...")
        for i in range(train_num, file_num_total): # Les images restantes vont √† la validation
            img_path_obj = img_file_list[i]
            img_filename = img_path_obj.name
            base_filename = img_path_obj.stem
            label_filename = base_filename + '.txt'
            label_path_source_obj = Path(input_label_path_str) / label_filename

            # Copier l'image
            shutil.copy(str(img_path_obj), os.path.join(val_img_path_str, img_filename))

            # Copier le fichier label correspondant s'il existe
            if label_path_source_obj.exists():
                shutil.copy(str(label_path_source_obj), os.path.join(val_txt_path_str, label_filename))
            # else:
            #     print(f"  INFO: Fichier label '{label_filename}' non trouv√© pour l'image de validation '{img_filename}'. (Peut √™tre une image de fond)")
        print("Fin de la copie des fichiers de validation.")
        print("\nR√©partition des donn√©es termin√©e !")

# V√©rifions la structure cr√©√©e dans /content/data (facultatif mais utile)
print("\nContenu de /content/data :")
!ls /content/data
print("\nContenu de /content/data/train/images (premiers fichiers) :")
!ls /content/data/train/images | head -n 5
print("\nContenu de /content/data/train/labels (premiers fichiers) :")
!ls /content/data/train/labels | head -n 5
print("\nContenu de /content/data/validation/images (premiers fichiers) :")
!ls /content/data/validation/images | head -n 5
print("\nContenu de /content/data/validation/labels (premiers fichiers) :")
!ls /content/data/validation/labels | head -n 5
print("--- Fin de la v√©rification ---")

YOLO a besoin d'un fichier de configuration, traditionnellement nomm√© `data.yaml`. Ce fichier est comme une "carte d'identit√©" de votre dataset pour le mod√®le. Il lui indique :
-   O√π trouver les images d'entra√Ænement et de validation.
-   Le nombre de classes d'objets √† d√©tecter.
-   Les noms de ces classes.

Nous allons g√©n√©rer ce fichier `data.yaml` automatiquement √† partir de votre fichier `classes.txt` (que vous avez fourni dans `data.zip` et qui se trouve maintenant dans `/content/custom_data/classes.txt`).

In [None]:
import yaml
import os

def create_data_yaml(path_to_classes_txt_in_custom_data, output_data_yaml_path, root_data_dir_for_yaml):
  """
  Cr√©e le fichier data.yaml n√©cessaire pour l'entra√Ænement YOLO.

  Args:
    path_to_classes_txt_in_custom_data (str): Chemin vers votre fichier classes.txt original (ex: /content/custom_data/classes.txt).
    output_data_yaml_path (str): Chemin o√π le fichier data.yaml sera sauvegard√© (ex: /content/dofus_data.yaml).
    root_data_dir_for_yaml (str): Chemin racine que YOLO utilisera pour trouver les dossiers train/val (ex: /content/data).
  """
  if not os.path.exists(path_to_classes_txt_in_custom_data):
    print(f"ERREUR : Le fichier {path_to_classes_txt_in_custom_data} est introuvable !")
    print("Veuillez v√©rifier que votre `data.zip` contenait bien `classes.txt` et qu'il a √©t√© extrait correctement.")
    return

  with open(path_to_classes_txt_in_custom_data, 'r') as f:
    classes = [line.strip() for line in f if line.strip()] # Lire les classes, ignorer les lignes vides

  if not classes:
    print(f"ERREUR : Aucune classe n'a √©t√© trouv√©e dans {path_to_classes_txt_in_custom_data}. Le fichier est-il vide ou mal format√© ?")
    return

  number_of_classes = len(classes)
  print(f"Nombre de classes d√©tect√©es : {number_of_classes}")
  print(f"Noms des classes : {classes}")

  data_config = {
      'path': root_data_dir_for_yaml,  # Chemin absolu vers le dossier contenant train/ et validation/
      'train': 'train/images',       # Chemin relatif √† 'path' pour les images d'entra√Ænement
      'val': 'validation/images',    # Chemin relatif √† 'path' pour les images de validation
      # 'test': Optional: chemin vers les images de test
      'nc': number_of_classes,
      'names': classes
  }

  with open(output_data_yaml_path, 'w') as f:
    yaml.dump(data_config, f, sort_keys=False, indent=2)
  print(f"Fichier de configuration YAML cr√©√© avec succ√®s : {output_data_yaml_path}")

# D√©finition des chemins
# Le fichier classes.txt original se trouve dans custom_data apr√®s d√©compression.
path_to_original_classes_txt = '/content/custom_data/classes.txt'
# Le dossier racine pour les donn√©es format√©es (train/val) est /content/data.
data_root_for_yolo = '/content/data'
# Nous allons cr√©er notre fichier de configuration data.yaml √† la racine de /content.
path_to_output_yaml = '/content/dofus_data.yaml' # Nommez-le comme vous voulez

create_data_yaml(path_to_original_classes_txt, path_to_output_yaml, data_root_for_yolo)

# Affichons le contenu du fichier YAML cr√©√© pour v√©rification
print('\nContenu du fichier data.yaml g√©n√©r√© :\n')
!cat {path_to_output_yaml}

## √âTAPE 1 (ALTERNATIVE) : PR√âPARATION DE VOTRE DATASET DOFUS (EXPORT√â DE ROBOFLOW)

Mon dataset est disponible sur roboflow pour le t√©l√©charger ([https://roboflow.com/](https://universe.roboflow.com/mathisl-qvljq/dofus-resource-detection/dataset/1))

### 1.A Exporter votre dataset depuis Roboflow
1.  Dans votre projet Roboflow, apr√®s avoir annot√© et g√©n√©r√© une version de votre dataset.
2.  Cliquez sur "Export Dataset".
3.  Choisissez le format **"YOLOv11"** . Ce format inclut typiquement :
    *   Des dossiers `train/`, `valid/` (et parfois `test/`) contenant chacun des sous-dossiers `images/` et `labels/`.
    *   Un fichier `data.yaml` d√©j√† configur√© pour votre dataset.
4.  Choisissez l'option "download zip to computer". Vous obtiendrez un fichier ZIP (par exemple, `MonProjetDofus.zip` ou `Dofus-Resources-1.zip`).
5.  Renommer le `data.zip`.

### 1.B T√©l√©verser votre `data.zip` (export√© de Roboflow) sur Colab

Comme pour l'option Label Studio, vous pouvez soit le t√©l√©charger directement, soit passer par Google Drive (recommand√©).

1.  Uploadez le fichier ZIP t√©l√©charg√© de Roboflow sur votre Google Drive (par exemple, dans un dossier `MesProjetsIA/DOFUS_BOT`).
2.  Ex√©cutez le code ci-dessous. Vous devrez autoriser Colab √† acc√©der √† votre Drive.
3.  **‚ö†Ô∏è ATTENTION :**
    * Renommer le ZIP en `data.zip`.

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

# MODIFIER CETTE LIGNE AVEC LE CHEMIN DE VOTRE FICHIER ZIP SUR GOOGLE DRIVE
path_to_zip_on_drive = f"/content/gdrive/MyDrive/DOFUS_BOT/data.zip" # EXEMPLE: "/content/gdrive/MyDrive/MesDatasets/Roboflow_Exports/data.zip"
# --- FIN DES MODIFICATIONS ---

destination_zip_path_colab = "/content/data.zip"

print(f"Tentative de copie de {path_to_zip_on_drive} vers {destination_zip_path_colab}")
!cp "{path_to_roboflow_zip_on_drive}" "{destination_zip_path_colab}"

# V√©rifions sa pr√©sence :
print("\nContenu de /content apr√®s la copie :")
!ls -lh /content

### 1.C D√©compresser le dataset Roboflow
Le ZIP de Roboflow contient d√©j√† la structure `train/`, `valid/` et le fichier data.yaml. Nous allons le d√©compresser dans un dossier sp√©cifique, `/content/data`.

In [None]:
!unzip -q /content/data.zip -d /content/data
# V√©rifions le contenu de custom_data
!ls /content/data

*(Vous devriez voir `train/`, `valid/`, `test/` et `data.yaml` list√©s.)*


## √âTAPE 2 : ENTRA√éNER LE MOD√àLE YOLO
C'est le moment cl√© ! Nous allons lancer l'entra√Ænement.

Ultralytics est la biblioth√®que Python qui nous fournit les outils pour entra√Æner notre mod√®le YOLO.
Installons la derni√®re version :

In [None]:
!pip install ultralytics


### 4.1 Choix des param√®tres d'entra√Ænement (√Ä AJUSTER SELON VOS BESOINS)
-   `model`: Le mod√®le pr√©-entra√Æn√© qui servira de base. Utiliser un mod√®le pr√©-entra√Æn√© (sur de grands datasets comme COCO) permet un apprentissage plus rapide et efficace (transfer learning).
    *   Exemples : `yolo11n.pt` (nano, le plus petit et rapide, id√©al pour commencer), `yolo11s.pt` (small), `yolo11m.pt` (medium), `yolo11l.pt` (large), `yolo11xl.pt` (extra-large, plus pr√©cis mais plus lent et gourmand en ressources).
    *   Si vous d√©butez ou avez un petit dataset, `yolo11n.pt` ou `yolo11s.pt` sont de bons choix.
    *   Vous pouvez aussi utiliser les mod√®les YOLOv5 et YOLOv8 en changeant `yolo11` par `yolov5` ou `yolov8`.
-   `data`: Chemin vers votre fichier `dofus_data.yaml` cr√©√© √† l'√©tape pr√©c√©dente.
-   `epochs`: Nombre de fois que le mod√®le verra l'ensemble de votre dataset d'entra√Ænement.
    Un bon point de d√©part est entre 25 et 100. Plus de donn√©es ou des t√¢ches plus complexes peuvent n√©cessiter plus d'√©poques. Commencez petit (ex: 30-50) pour un premier test.
-   `imgsz` (ou `img`): La taille (r√©solution en pixels) √† laquelle les images seront redimensionn√©es avant d'√™tre pr√©sent√©es au mod√®le.
    *   Exemple : `640` (pour des images carr√©es de 640x640). Des tailles plus grandes peuvent am√©liorer la d√©tection de petits objets, mais augmentent l'utilisation de m√©moire GPU (VRAM) et le temps d'entra√Ænement. `320` est aussi une option pour des entra√Ænements plus rapides.
-   `batch`: Nombre d'images trait√©es en une seule fois par le GPU.
    Une valeur de `-1` laisse Ultralytics choisir automatiquement la meilleure taille de batch en fonction de la VRAM disponible. Sinon, essayez 8, 16, 32...
    Si vous avez une erreur "CUDA out of memory", r√©duisez cette valeur ou `imgsz`.
-   `patience`: Nombre d'√©poques √† attendre sans am√©lioration de la performance sur le set de validation avant d'arr√™ter l'entra√Ænement pr√©matur√©ment (early stopping). Utile pour √©viter le sur-apprentissage. Exemple : `patience=10` (arr√™te si pas d'am√©lioration apr√®s 10 √©poques).

Consultez la documentation Ultralytics pour plus d'options : [https://docs.ultralytics.com/modes/train/](https://docs.ultralytics.com/modes/train/)

In [None]:
# Configuration pour l'entra√Ænement (MODIFIEZ CES VALEURS)
MODEL_CHOICE = 'yolo11s.pt'
NUM_EPOCHS = 100 # Commencez par un nombre plus petit pour tester (ex: 10-25), puis augmentez.
IMAGE_SIZE = 640
BATCH_SIZE = -1 # -1 pour auto-batch, ou un nombre comme 8, 16
PATIENCE_EPOCHS = 10

# Commande d'entra√Ænement
!yolo detect train \
    model={MODEL_CHOICE} \
    data={path_to_output_yaml} \
    epochs={NUM_EPOCHS} \
    imgsz={IMAGE_SIZE} \
    batch={BATCH_SIZE} \
    patience={PATIENCE_EPOCHS}

L'entra√Ænement peut prendre un certain temps (de quelques minutes √† plusieurs heures) en fonction de :
- La taille de votre dataset.
- Le mod√®le (`MODEL_CHOICE`) choisi.
- Le nombre d'√©poques (`NUM_EPOCHS`).
- La puissance du GPU Colab qui vous est allou√©.


**O√π trouver les r√©sultats ?**
Les r√©sultats, incluant les poids du mod√®le entra√Æn√© (notamment `best.pt` qui est le plus important), les graphiques de performance, et des exemples de validation, seront sauvegard√©s dans un dossier. Avec les param√®tres ci-dessus, ce sera quelque chose comme :
`/content/runs/detect`
Vous y trouverez un sous-dossier `weights/` contenant `best.pt` (le mod√®le ayant eu les meilleures performances sur l'ensemble de validation) et `last.pt` (le mod√®le √† la toute derni√®re √©poque).

## √âTAPE 5 : TESTER LE MOD√àLE ENTRA√éN√â
Une fois l'entra√Ænement termin√©, il est bon de v√©rifier visuellement comment votre mod√®le se comporte sur quelques images qu'il n'a pas vues pendant l'entra√Ænement (celles de votre ensemble de validation).
Nous utiliserons le mod√®le `best.pt` car c'est g√©n√©ralement celui qui offre les meilleures performances de g√©n√©ralisation


In [None]:
!yolo detect predict model=runs/detect/train/weights/best.pt source=data/validation/images save=True

In [None]:
import glob
from IPython.display import Image, display
for image_path in glob.glob(f'/content/runs/detect/predict/*.jpg')[:10]:
  display(Image(filename=image_path, height=400))
  print('\n')

Le mod√®le devrait dessiner des bo√Ætes (bounding boxes) autour des objets d'int√©r√™t qu'il a appris √† reconna√Ætre, avec le nom de la classe et un score de confiance.

**Si les r√©sultats ne sont pas satisfaisants :**
-   **V√©rifiez vos annotations :** Des erreurs ou incoh√©rences dans l'√©tiquetage (dataset) sont la cause la plus fr√©quente de mauvaises performances.
-   **Augmentez le nombre d'√©poques :** Le mod√®le n'a peut-√™tre pas eu assez de temps pour apprendre.
-   **Utilisez un mod√®le de base plus grand :** Passez √† `yolo11l.pt` (cela demandera plus de ressources et de temps).
-   **Augmentez la taille de votre dataset :** Plus d'images, et surtout plus de diversit√© dans les images (diff√©rents angles, √©clairages, contextes) am√©liorent la robustesse du mod√®le.
-   **Data Augmentation :** Ultralytics applique d√©j√† des techniques d'augmentation de donn√©es (rotations, changements de couleurs, etc.) pendant l'entra√Ænement. Vous pouvez explorer des configurations plus avanc√©es si besoin.
-   **Ajustez `imgsz` :** Si vos objets sont petits, une r√©solution plus √©lev√©e peut aider.

D√©tecter des ressources ici c'est pas mal, mais ce n'est pas tr√®s utile pour r√©colter. On va exporter le mod√®le pour pouvoir l'utiliser en local sur notre ordinateur.

### VISUALISER LES PERFORMANCES DU MOD√àLE
Apr√®s l'entra√Ænement, Ultralytics sauvegarde plusieurs graphiques qui nous aident √† comprendre si notre mod√®le est performant. Nous allons afficher les plus importants et expliquer comment les lire, m√™me sans √™tre un expert en IA !

Ces graphiques se trouvent dans le dossier de r√©sultats de votre entra√Ænement.

In [None]:
import os
import glob
from pathlib import Path # Utilis√© pour une recherche plus robuste des dossiers
from IPython.display import Image, display, Markdown
import textwrap

results_base_dir = Path('/content/runs/detect')
latest_experiment_path = None # Sera un str

if results_base_dir.is_dir():
    # Obtenir tous les sous-dossiers commen√ßant par 'train'
    experiment_dirs = [d for d in results_base_dir.glob('train*') if d.is_dir()]

    if experiment_dirs:
        # Trouver celui avec le temps de modification le plus r√©cent
        # Cela correspond g√©n√©ralement au dernier entra√Ænement effectu√©.
        latest_experiment_path_obj = max(experiment_dirs, key=lambda p: p.stat().st_mtime)
        latest_experiment_path = str(latest_experiment_path_obj) # Convertir Path en string
        print(f"Analyse des r√©sultats depuis : {latest_experiment_path}\n")
    else:
        print(f"Aucun sous-dossier 'train*' trouv√© dans '{results_base_dir}'.")
        print("Veuillez vous assurer que l'√âtape 4 (Entra√Ænement) a bien √©t√© ex√©cut√©e.")
else:
    print(f"Le dossier de base des r√©sultats '{results_base_dir}' n'existe pas.")
    print("Veuillez vous assurer que l'√âtape 4 (Entra√Ænement) a bien √©t√© ex√©cut√©e.")


# --- Suite du code de visualisation, seulement si latest_experiment_path a √©t√© trouv√© ---
if latest_experiment_path and os.path.isdir(latest_experiment_path):

    # --- 1. Affichage du graphique principal des r√©sultats (results.png) ---
    results_png_path = None # Initialisation
    # Chercher les fichiers PNG pertinents pour les m√©triques
    possible_results_plots = ['results.png', 'metrics_plot.png', 'P_R_F1_curve.png', 'F1_curve.png', 'PR_curve.png']
    found_results_plot = False
    for plot_name in possible_results_plots:
        potential_path = os.path.join(latest_experiment_path, plot_name)
        if os.path.exists(potential_path):
            results_png_path = potential_path
            found_results_plot = True
            print(f"Graphique des m√©triques principales trouv√© : {results_png_path}")
            break

    if found_results_plot and results_png_path:
        display(Markdown("### 1. Graphique des M√©triques d'Entra√Ænement et de Validation"))
        display(Image(filename=results_png_path, width=800)) # Ajustez width si besoin

        explanation_markdown = textwrap.dedent("""
        **Comment lire ce graphique ?**

        *   **Axe X (Horizontal - Epochs) :** Repr√©sente les cycles d'entra√Ænement. Plus on va vers la droite, plus le mod√®le a √©t√© entra√Æn√© longtemps.
        *   **Axe Y (Vertical) :** Repr√©sente la valeur de la m√©trique (g√©n√©ralement entre 0 et 1, o√π 1 est parfait).

        **Les courbes importantes √† regarder :**
        (Les noms exacts des courbes peuvent l√©g√®rement varier, mais cherchez des termes similaires)

        *   **`metrics/precision` (ou P) : Pr√©cision.**
            *   **Ce que √ßa veut dire :** Quand le mod√®le dit "J'ai trouv√© un objet X", quelle est la probabilit√© qu'il ait raison ?
            *   **Ce qu'on veut :** Une courbe qui monte et se stabilise le plus haut possible (proche de 1).
        *   **`metrics/recall` (ou R) : Rappel (ou Sensibilit√©).**
            *   **Ce que √ßa veut dire :** Parmi tous les objets X r√©ellement pr√©sents dans les images, combien le mod√®le a-t-il r√©ussi √† trouver ?
            *   **Ce qu'on veut :** Une courbe qui monte et se stabilise le plus haut possible (proche de 1).
        *   **`metrics/mAP50` (ou `mAP@.50`) : Mean Average Precision √† IoU=0.5.**
            *   **Ce que √ßa veut dire :** C'est une sorte de **score global de performance**. Il combine la pr√©cision et le rappel pour toutes les classes, et consid√®re une d√©tection comme correcte si la bo√Æte pr√©dite chevauche la vraie bo√Æte d'au moins 50% (c'est le "IoU=0.5").
            *   **Ce qu'on veut :** Une courbe qui monte et se stabilise le plus haut possible (proche de 1). C'est souvent la m√©trique principale pour juger la qualit√© globale.
        *   **`metrics/mAP50-95` (ou `mAP@.50:.95`) : mAP moyenn√©e sur plusieurs seuils d'IoU (de 0.5 √† 0.95).**
            *   **Ce que √ßa veut dire :** Similaire √† `mAP50`, mais plus strict car il exige un meilleur placement des bo√Ætes sur une plage de seuils.
            *   **Ce qu'on veut :** Une courbe qui monte. Elle sera g√©n√©ralement plus basse que `mAP50`.

        **Courbes `train/...` vs `val/...` :**
        *   Les courbes avec `train` (ex: `train/box_loss`) montrent comment le mod√®le performe sur les donn√©es qu'il *voit* pendant l'entra√Ænement.
        *   Les courbes avec `val` (ex: `val/box_loss` ou directement les m√©triques comme `metrics/mAP50` qui sont calcul√©es sur le set de validation) montrent comment le mod√®le performe sur des donn√©es *nouvelles* qu'il n'a jamais vues. C'est **CRUCIAL** pour voir si le mod√®le g√©n√©ralise bien ou s'il "apprend par c≈ìur" (sur-apprentissage).
        *   Id√©alement, les courbes `train` et `val` pour les m√©triques (P, R, mAP) doivent √™tre proches et monter ensemble. Si les performances sur `train` sont excellentes mais celles sur `val` sont bien moins bonnes et stagnent ou baissent, c'est un signe de sur-apprentissage.

        **En r√©sum√© pour un non-expert :** Recherchez les courbes de **Pr√©cision, Rappel, et mAP50 (ou mAP@0.5)**. Si elles montent et atteignent des valeurs √©lev√©es (disons, > 0.7 ou 0.8 pour un bon mod√®le, mais cela d√©pend de la difficult√© de la t√¢che), c'est un bon signe ! Si elles stagnent bas, le mod√®le n'apprend pas bien.
        """)
        display(Markdown(explanation_markdown))
    else:
        print("Le graphique principal des r√©sultats (`results.png` ou similaire) n'a pas √©t√© trouv√© dans le dossier d'exp√©rience.")

    # --- 2. Affichage de la Matrice de Confusion (confusion_matrix.png) ---
    confusion_matrix_png_path = os.path.join(latest_experiment_path, 'confusion_matrix.png')
    if os.path.exists(confusion_matrix_png_path):
        display(Markdown("### 2. Matrice de Confusion"))
        display(Image(filename=confusion_matrix_png_path, width=600)) # Ajustez width si besoin

        # Essayer de charger classes.txt pour rendre la matrice de confusion plus lisible
        classes_txt_path = '/content/custom_data/classes.txt' # Chemin vers le fichier classes.txt original
        class_names = []
        if os.path.exists(classes_txt_path):
            with open(classes_txt_path, 'r') as f:
                class_names = [line.strip() for line in f if line.strip()]

        explanation_text_cm = textwrap.dedent("""
        **Comment lire cette matrice ?**

        Cette matrice vous montre quelles classes le mod√®le a tendance √† confondre entre elles.
        *   **Lignes :** Les vraies classes des objets (V√©rit√© Terrain).
        *   **Colonnes :** Les classes pr√©dites par le mod√®le.
        *   **Diagonale (du haut-gauche au bas-droite) :** Les pr√©dictions correctes. Plus les chiffres (et les couleurs plus intenses) sont sur la diagonale, mieux c'est !
        *   **Cases hors diagonale :** Les erreurs de classification. Par exemple, si dans la ligne "Frene" et la colonne "Ble", il y a un chiffre, cela signifie que le mod√®le a parfois confondu un "Frene" avec un "Ble".
        *   **Derni√®re ligne/colonne (`background`) :**
            *   `background` en ligne : Indique les objets r√©els qu'aucune bo√Æte n'a d√©tect√©s (faux n√©gatifs pour cette classe).
            *   `background` en colonne : Indique les bo√Ætes pr√©dites qui ne correspondaient √† aucun objet r√©el (faux positifs).

        **Ce qu'on veut :**
        *   Des valeurs √©lev√©es et des couleurs vives sur la **diagonale principale**.
        *   Des valeurs faibles (proches de 0) et des couleurs claires **partout ailleurs**.
        *   Des valeurs faibles dans la derni√®re ligne/colonne "background" (sauf pour la case background/background si elle existe).
        """)
        if class_names:
            # Concat√©nation de cha√Ænes, textwrap.dedent n'est pas n√©cessaire ici car les f-strings g√®rent bien
            class_list_md = "\n**Vos classes sont (dans l'ordre de la matrice, en commen√ßant par 0) :**\n"
            for i, name in enumerate(class_names):
                class_list_md += f"  {i}: {name}\n"
            explanation_text_cm += class_list_md # Ajouter la liste des classes √† la fin

        display(Markdown(explanation_text_cm))

    else:
        print(f"La matrice de confusion (`confusion_matrix.png`) n'a pas √©t√© trouv√©e dans {latest_experiment_path}.")


## √âTAPE 6 : PR√âPARER ET T√âL√âCHARGER VOTRE MOD√àLE ENTRA√éN√â
Nous allons maintenant cr√©er un package ZIP contenant :
1.  Votre meilleur mod√®le entra√Æn√© (`best.pt` renomm√© en `my_model.pt`).
2.  (Optionnel) Le dossier complet des r√©sultats de l'entra√Ænement.

In [None]:
# Cr√©er un fichier "dofus_AI" pour y mettre les poids et les r√©sultats d'entrainements
!mkdir /content/dofus_AI
!cp /content/runs/detect/train/weights/best.pt /content/dofus_AI/my_model.pt
!cp -r /content/runs/detect/train /content/dofus_AI

# cr√©er le zip "dofus_AI.zip"
%cd dofus_AI
!zip /content/dofus_AI.zip my_model.pt
!zip -r /content/dofus_AI.zip train
%cd /content

In [None]:
from google.colab import files

files.download('/content/dofus_AI.zip')

Une fois le t√©l√©chargement termin√©, vous aurez `dofus_AI.zip` sur votre ordinateur. Ce ZIP contient tout ce dont vous avez besoin pour r√©utiliser votre mod√®le ou analyser plus en d√©tail l'entra√Ænement.

**F√©licitations !** Vous avez entra√Æn√© et packag√© votre propre mod√®le de d√©tection d'objets pour Dofus.