# ü§ñ Entra√Ænement YOLO pour Invoice ML System

Ce notebook vous permet d'entra√Æner votre mod√®le YOLO sur Google Colab avec GPU gratuit.

## üìã Pr√©requis

1. Avoir annot√© au moins 100 factures dans Label Studio
2. Avoir export√© les annotations (voir README.md)
3. Avoir pr√©par√© le dataset YOLO

## üöÄ Instructions

1. Activer le GPU: Runtime > Change runtime type > GPU
2. Uploader votre dataset (fichier zip du dossier yolo_dataset)
3. Ex√©cuter les cellules dans l'ordre
4. T√©l√©charger le mod√®le entra√Æn√© √† la fin

## 1Ô∏è‚É£ Configuration de l'environnement

In [None]:
# V√©rifier le GPU
!nvidia-smi

In [None]:
# Installer les d√©pendances
!pip install ultralytics==8.0.228 -q

## 2Ô∏è‚É£ Upload du dataset

**Option A: Upload manuel**

Utilisez le panneau de gauche pour uploader votre fichier `yolo_dataset.zip`

**Option B: Depuis Google Drive**

D√©commentez et ex√©cutez la cellule suivante:

In [None]:
# from google.colab import drive
# drive.mount('/content/drive')
# !cp /content/drive/MyDrive/yolo_dataset.zip .

In [None]:
# D√©compresser le dataset
!unzip -q yolo_dataset.zip
!ls -la yolo_dataset/

## 3Ô∏è‚É£ Configuration de l'entra√Ænement

In [None]:
from ultralytics import YOLO
import torch

# Param√®tres
MODEL = 'yolov8n.pt'  # n=nano (rapide), s=small, m=medium, l=large
EPOCHS = 100
BATCH = 16
IMGSZ = 640
DATA_YAML = 'yolo_dataset/data.yaml'

print(f"Device: {'cuda' if torch.cuda.is_available() else 'cpu'}")
print(f"Mod√®le: {MODEL}")
print(f"Epochs: {EPOCHS}")

## 4Ô∏è‚É£ Entra√Ænement du mod√®le

In [None]:
# Charger le mod√®le pr√©-entra√Æn√©
model = YOLO(MODEL)

# Lancer l'entra√Ænement
results = model.train(
    data=DATA_YAML,
    epochs=EPOCHS,
    batch=BATCH,
    imgsz=IMGSZ,
    patience=20,  # Early stopping
    save=True,
    plots=True,
    device=0,  # GPU
    project='invoice_training',
    name='yolo_run',
    verbose=True
)

## 5Ô∏è‚É£ √âvaluation

In [None]:
# √âvaluer sur le set de test
metrics = model.val(split='test')

print(f"\nüìä R√©sultats:")
print(f"   Precision: {metrics.box.p.mean():.3f}")
print(f"   Recall:    {metrics.box.r.mean():.3f}")
print(f"   mAP@0.5:   {metrics.box.map50:.3f}")
print(f"   mAP@0.5:0.95: {metrics.box.map:.3f}")

## 6Ô∏è‚É£ Visualisation des r√©sultats

In [None]:
# Afficher les courbes d'entra√Ænement
from IPython.display import Image, display

display(Image(filename='invoice_training/yolo_run/results.png'))
display(Image(filename='invoice_training/yolo_run/confusion_matrix.png'))

## 7Ô∏è‚É£ Test sur une image

In [None]:
# Charger le meilleur mod√®le
best_model = YOLO('invoice_training/yolo_run/weights/best.pt')

# Tester sur une image
test_image = 'yolo_dataset/test/images/test_image.jpg'  # Remplacer par votre image
results = best_model(test_image)

# Afficher les r√©sultats
results[0].show()

## 8Ô∏è‚É£ T√©l√©charger le mod√®le

In [None]:
# Zipper le mod√®le et les r√©sultats
!zip -r invoice_model.zip invoice_training/yolo_run/weights/

# T√©l√©charger
from google.colab import files
files.download('invoice_model.zip')

print("\n‚úÖ T√©l√©chargement lanc√©!")
print("\nüìù Prochaines √©tapes:")
print("   1. Extraire le mod√®le dans data/models/")
print("   2. Lancer l'API: python api/app.py")
print("   3. Tester: python scripts/test_api.py")

## üéâ Termin√©!

Votre mod√®le est maintenant entra√Æn√©. T√©l√©chargez-le et utilisez-le dans votre projet.

### Conseils pour am√©liorer les performances:

1. **Annotez plus de donn√©es** (200-300 factures)
2. **Utilisez un mod√®le plus grand** (yolov8s ou yolov8m)
3. **Augmentez les epochs** (150-200)
4. **Ajustez les hyperparam√®tres**

### Ressources:

- [YOLO Documentation](https://docs.ultralytics.com/)
- [Guide d'entra√Ænement](https://docs.ultralytics.com/modes/train/)
- [Hyperparameter tuning](https://docs.ultralytics.com/guides/hyperparameter-tuning/)