# Entra√Ænement du mod√®le YOLO
## Projet : D√©tection de conflits homme-faune

**√âquipe DIA6 - Novembre 2024**

---

### Instructions d'utilisation

1. **Activer le GPU** : Runtime > Change runtime type > T4 GPU
2. **Ex√©cuter les cellules dans l'ordre** (Shift + Enter)
3. **Dur√©e totale** : ~2 heures (dont 1h30 d'entra√Ænement automatique)
4. **Points de v√©rification** : Apr√®s chaque section, v√©rifier que tout est OK

---

### Pr√©requis

- Dataset upload√© sur Google Drive dans : `MyDrive/ProjetGreenAI/datasets/wildlife_human_final/`
- Connexion internet stable
- Compte Google

---

## Section 1 : V√©rification de l'environnement

**Objectif** : V√©rifier que le GPU est activ√© et que l'environnement est correct

**R√©sultat attendu** : Vous devez voir "GPU : Tesla T4" ou similaire

In [None]:
import sys
import torch

print("Configuration de l'environnement")
print("-" * 50)
print(f"Python version : {sys.version}")
print(f"PyTorch version : {torch.__version__}")
print(f"CUDA disponible : {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"GPU : {torch.cuda.get_device_name(0)}")
    print("\n‚úÖ GPU detecte - Vous pouvez continuer")
else:
    print("\n‚ùå ATTENTION : GPU non detecte !")
    print("Allez dans Runtime > Change runtime type > Selectionnez GPU")
    
print("-" * 50)

## Section 2 : Installation des d√©pendances

**Objectif** : Installer Ultralytics (librairie YOLO)

**Dur√©e** : 1-2 minutes

**Note** : Des messages d'avertissement peuvent appara√Ætre, c'est normal

In [None]:
print("Installation d'Ultralytics...")
!pip install ultralytics -q
print("\n‚úÖ Installation terminee")

# Verification
import ultralytics
print(f"Ultralytics version : {ultralytics.__version__}")
ultralytics.checks()

## Section 3 : Connexion √† Google Drive

**Objectif** : Monter Google Drive pour acc√©der au dataset

**Action requise** : 
1. Une fen√™tre va s'ouvrir
2. Cliquez sur "Connect to Google Drive"
3. S√©lectionnez votre compte Google
4. Cliquez sur "Allow"

**R√©sultat attendu** : "Drive monte avec succes" + "Dataset trouve"

In [None]:
from google.colab import drive
import os

print("Connexion a Google Drive...")
drive.mount('/content/drive')
print("\n‚úÖ Drive monte avec succes")

# Verifier l'acces au dataset
DATASET_PATH = '/content/drive/MyDrive/ProjetGreenAI/datasets/wildlife_human_final'

print(f"\nVerification du dataset...")
if os.path.exists(DATASET_PATH):
    print(f"‚úÖ Dataset trouve")
    print(f"Emplacement : {DATASET_PATH}")
else:
    print(f"‚ùå ERREUR : Dataset non trouve")
    print(f"Emplacement attendu : {DATASET_PATH}")
    print("\nVerifiez :")
    print("1. Que vous avez bien uploade le dossier sur Google Drive")
    print("2. Que le chemin est correct")
    print("3. Que le dossier s'appelle exactement 'wildlife_human_final'")

## Section 4 : V√©rification de la structure du dataset

**Objectif** : V√©rifier que toutes les images et labels sont pr√©sents

**R√©sultat attendu** :
- train  : 1650 images, 1650 labels
- valid  :  205 images,  205 labels
- test   :  208 images,  208 labels

**Si vous voyez "DOSSIER MANQUANT", arr√™tez-vous et v√©rifiez votre Google Drive**

In [None]:
from pathlib import Path

print("\nStructure du dataset")
print("-" * 50)

all_ok = True

for split in ['train', 'valid', 'test']:
    images_dir = Path(DATASET_PATH) / split / 'images'
    labels_dir = Path(DATASET_PATH) / split / 'labels'
    
    if images_dir.exists() and labels_dir.exists():
        n_images = len(list(images_dir.glob('*')))
        n_labels = len(list(labels_dir.glob('*.txt')))
        print(f"‚úÖ {split:6s} : {n_images:4d} images, {n_labels:4d} labels")
    else:
        print(f"‚ùå {split:6s} : DOSSIER MANQUANT")
        all_ok = False
        if not images_dir.exists():
            print(f"   Manque : {images_dir}")
        if not labels_dir.exists():
            print(f"   Manque : {labels_dir}")

print("-" * 50)

if all_ok:
    print("\n‚úÖ Structure du dataset correcte - Vous pouvez continuer")
else:
    print("\n‚ùå Structure incorrecte - Verifiez votre Google Drive")

## Section 5 : V√©rification du fichier data.yaml

**Objectif** : V√©rifier que le fichier de configuration existe et est correct

**Contenu attendu** :
- path: chemin vers le dataset
- train, val, test: chemins relatifs
- names: liste des 5 classes

In [None]:
YAML_PATH = Path(DATASET_PATH) / 'data.yaml'

if YAML_PATH.exists():
    print("\n‚úÖ Fichier data.yaml trouve")
    print("\nContenu du fichier :")
    print("-" * 50)
    with open(YAML_PATH, 'r') as f:
        content = f.read()
        print(content)
    print("-" * 50)
else:
    print("\n‚ùå ERREUR : Fichier data.yaml non trouve")
    print(f"Emplacement attendu : {YAML_PATH}")
    print("\nCreation du fichier...")
    
    yaml_content = f"""path: {DATASET_PATH}
train: train/images
val: valid/images
test: test/images

names:
  0: buffalo
  1: elephant
  2: rhino
  3: zebra
  4: person

nc: 5
"""
    
    with open(YAML_PATH, 'w') as f:
        f.write(yaml_content)
    
    print("‚úÖ Fichier data.yaml cree avec succes")

## Section 6 : Chargement du mod√®le YOLO

**Objectif** : Charger le mod√®le YOLOv8 nano pr√©-entra√Æn√©

**Note** : Le mod√®le (6 MB) se t√©l√©charge automatiquement

In [None]:
from ultralytics import YOLO

print("\nChargement du modele YOLOv8 nano...")
model = YOLO('yolov8n.pt')
print("‚úÖ Modele charge avec succes")
print(f"Taille du modele : ~6 MB")
print(f"Architecture : YOLOv8 nano")
print(f"Pre-entraine sur : COCO dataset (80 classes)")

---
## üöÄ Section 7 : ENTRA√éNEMENT DU MOD√àLE

**‚ö†Ô∏è CETTE CELLULE PREND 1-2 HEURES ‚ö†Ô∏è**

### Param√®tres d'entra√Ænement
- **√âpoques** : 50 (nombre de fois que le mod√®le voit toutes les images)
- **Batch size** : 16 (nombre d'images trait√©es simultan√©ment)
- **Image size** : 640x640 pixels
- **Patience** : 10 (arr√™t automatique si pas d'am√©lioration pendant 10 √©poques)

### Pendant l'entra√Ænement
- Vous verrez d√©filer les √©poques (Epoch 1/50, 2/50, etc.)
- Des m√©triques s'afficheront (mAP, precision, recall)
- **NE FERMEZ PAS LE NAVIGATEUR**
- Vous pouvez minimiser l'onglet et faire autre chose

### Apr√®s l'entra√Ænement
- Le meilleur mod√®le est sauvegard√© automatiquement
- Des graphiques sont g√©n√©r√©s automatiquement

**Pr√™t ? Ex√©cutez la cellule ci-dessous !**

---

In [None]:
print("\n" + "="*50)
print("DEMARRAGE DE L'ENTRAINEMENT")
print("="*50)
print("Duree estimee : 1-2 heures")
print("NE FERMEZ PAS LE NAVIGATEUR")
print("="*50 + "\n")

# Parametres
EPOCHS = 50
BATCH_SIZE = 16
IMAGE_SIZE = 640

# Entrainement
results = model.train(
    data=str(YAML_PATH),
    epochs=EPOCHS,
    imgsz=IMAGE_SIZE,
    batch=BATCH_SIZE,
    patience=10,
    device=0,
    project='runs/detect',
    name='wildlife_conflict',
    exist_ok=True,
    verbose=True,
    plots=True,
    save=True
)

print("\n" + "="*50)
print("‚úÖ ENTRAINEMENT TERMINE")
print("="*50)

## Section 8 : R√©sultats de l'entra√Ænement

**Objectif** : Afficher les m√©triques de performance du mod√®le

**M√©triques importantes** :
- **mAP50** : Pr√©cision moyenne √† 50% de seuil (>0.85 = tr√®s bon)
- **Precision** : % de d√©tections correctes
- **Recall** : % d'objets trouv√©s

In [None]:
print("\nResultats de l'entrainement")
print("-" * 50)

# Metriques
metrics = model.metrics

print(f"mAP50     : {metrics.box.map50:.3f}")
print(f"mAP50-95  : {metrics.box.map:.3f}")
print(f"Precision : {metrics.box.mp:.3f}")
print(f"Recall    : {metrics.box.mr:.3f}")

print("-" * 50)

# Interpretation
if metrics.box.map50 > 0.85:
    print("\n‚úÖ Excellent ! Le modele est tres performant")
elif metrics.box.map50 > 0.75:
    print("\n‚úÖ Bon ! Le modele est performant")
elif metrics.box.map50 > 0.65:
    print("\n‚ö†Ô∏è Moyen - Le modele est correct mais peut etre ameliore")
else:
    print("\n‚ùå Faible - Le modele necessite plus d'entrainement ou plus de donnees")

## Section 9 : Visualisation des r√©sultats

**Objectif** : Afficher les courbes d'entra√Ænement et la matrice de confusion

**Graphiques g√©n√©r√©s** :
- Courbes d'entra√Ænement (loss, mAP, etc.)
- Matrice de confusion (quelles classes sont confondues)
- Exemples de pr√©dictions

In [None]:
from IPython.display import Image, display

results_dir = Path('runs/detect/wildlife_conflict')

# Courbes d'entrainement
results_png = results_dir / 'results.png'
if results_png.exists():
    print("\nCourbes d'entrainement")
    print("-" * 50)
    display(Image(filename=str(results_png)))

# Matrice de confusion
confusion = results_dir / 'confusion_matrix.png'
if confusion.exists():
    print("\nMatrice de confusion")
    print("-" * 50)
    display(Image(filename=str(confusion)))

# Exemples de predictions
val_batch = results_dir / 'val_batch0_pred.jpg'
if val_batch.exists():
    print("\nExemples de predictions sur le validation set")
    print("-" * 50)
    display(Image(filename=str(val_batch)))

## Section 10 : Sauvegarde du mod√®le sur Google Drive

**Objectif** : Sauvegarder le meilleur mod√®le sur Google Drive pour le r√©utiliser

**Emplacement** : `MyDrive/ProjetGreenAI/models/wildlife_best.pt`

In [None]:
import shutil

# Sauvegarder le modele sur Drive
best_model_path = 'runs/detect/wildlife_conflict/weights/best.pt'
save_dir = '/content/drive/MyDrive/ProjetGreenAI/models/'

os.makedirs(save_dir, exist_ok=True)
shutil.copy(best_model_path, os.path.join(save_dir, 'wildlife_best.pt'))

print("‚úÖ Modele sauvegarde sur Google Drive")
print(f"Emplacement : {save_dir}wildlife_best.pt")
print("\nVous pouvez maintenant fermer ce notebook")
print("Le modele est pret a etre utilise !")

---
## üìã R√©sum√© et prochaines √©tapes

### Ce qui a √©t√© fait
‚úÖ Environnement v√©rifi√©  
‚úÖ Dataset charg√© et v√©rifi√©  
‚úÖ Mod√®le YOLO entra√Æn√© pendant 50 √©poques  
‚úÖ R√©sultats g√©n√©r√©s et visualis√©s  
‚úÖ Mod√®le sauvegard√© sur Google Drive  

### Fichiers g√©n√©r√©s
- **Mod√®le entra√Æn√©** : `MyDrive/ProjetGreenAI/models/wildlife_best.pt`
- **R√©sultats** : `runs/detect/wildlife_conflict/`
- **Graphiques** : Dans le dossier results

### Prochaines √©tapes
1. Tester le mod√®le sur les 40 images r√©elles
2. Cr√©er les cartes de densit√© spatiale
3. Identifier les zones de conflit
4. Pr√©parer la pr√©sentation

### Ressources
- Documentation YOLO : https://docs.ultralytics.com
- Repository GitHub : https://github.com/luna-eng-data/wildlife-conflict-detection

---