##**Dataset 1 : COCO128**



**SECTION 0 ‚Äì Setup**

In [8]:

import sys
#sys.path.append('Projet_ML/od-project/src')
sys.path.append('Projet_ML/od-project')


# === Check GPU ===
!nvidia-smi

# === Install Dependencies ===
!pip install -r requirements.txt

# === Imports + Seeds ===
import torch, numpy as np, random
torch.manual_seed(42)
np.random.seed(42)
random.seed(42)
print("Device:", "cuda" if torch.cuda.is_available() else "cpu")

Mon Nov 24 20:19:48 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  Tesla T4                       Off |   00000000:00:04.0 Off |                    0 |
| N/A   46C    P8              9W /   70W |       2MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                

In [5]:
import torch
print("GPU disponible :", torch.cuda.is_available())
print("Nom du GPU :", torch.cuda.get_device_name(0) if torch.cuda.is_available() else "Aucun GPU")

GPU disponible : True
Nom du GPU : Tesla T4


In [6]:
from ultralytics import YOLO
model = YOLO("yolov8n.pt")
model.to('cuda')
print("‚úÖ YOLO est pr√™t")
print("Type de mod√®le :", type(model.model).__name__)
print("Device utilis√© :", model.device)

ModuleNotFoundError: No module named 'ultralytics'

**SECTION 1 ‚Äì Problem Definition**

Objectif du projet : "D√©velopper un mod√®le de d√©tection d‚Äôobjets sur le dataset COCO128"

T√¢che ML : ‚ÄúObject Detection‚Äù

Mod√®le choisi : YOLOv8n (Ultralytics)

Dataset mentionn√© (COCO128 ou ton dataset)

M√©triques utilis√©es : mAP@0.5, pr√©cision, rappel

Contexte m√©tier (autonomous vehicle / drone / inventaire)

Pourquoi c‚Äôest un bon choix pour ce probl√®me

**SECTION 2 ‚Äì Data Validation**

Nom du dataset (COCO128 ou ton dataset custom)

Source : Ultralytics / Kaggle / Google Drive

Nombre d‚Äôimages / classes

Structure YOLO : /images/train, /images/val, /labels/...

Format des labels : class_id x_center y_center width height

Licence, biais √©ventuels

In [None]:
#from PIL import Image
#Image.open("ultralytics/assets/bus.jpg")

In [None]:
from ultralytics import YOLO
import time, json, os

# 1. Charger mod√®le
model = YOLO("yolov8n.pt")
model.to("cuda")  # GPU garanti

# 2. Pr√©diction rapide
print("Running smoke check on GPU...")
t0 = time.time()
results = model.predict(source="https://ultralytics.com/images/bus.jpg", imgsz=640)
elapsed = time.time() - t0

# 3. Sauvegarde des r√©sultats
os.makedirs("outputs", exist_ok=True)
metrics = {
    "model": "yolov8n.pt",
    "device": str(model.device),
    "success": True,
    "elapsed_time": round(elapsed, 2)
}
with open("outputs/smoke_metrics.json", "w") as f:
    json.dump(metrics, f, indent=2)

print("\n‚úÖ Smoke check termin√© avec succ√®s !")
print(metrics)

**SECTION 3 ‚Äì Baseline Training**

In [None]:
from train import main

main("configs/yolo_coco128.yaml")

hyperparam√®tres (epochs, lr, batch, imgsz)

pertes observ√©es, premi√®re mAP obtenue

**SECTION 4 ‚Äì Evaluation & Prediction**

In [None]:
from evaluate import main as eval_main

cfg = "configs/yolo_coco128.yaml"
ckpt = "outputs/train/weights/best.pt"

eval_main(cfg, ckpt)

In [None]:
from predict import main as predict_main

cfg = "configs/yolo_coco128.yaml"
ckpt = "outputs/train/weights/best.pt"
img = "https://ultralytics.com/images/bus.jpg"  # image valide

predict_main(cfg, ckpt, img)

In [None]:
from PIL import Image
Image.open("outputs/pred/vis/bus.jpg")

Analyse des r√©sultats : quelles classes sont bien d√©tect√©es, quelles sont rat√©es ?

**SECTION 5 ‚Äì Ablation Studies**

In [None]:
from ultralytics import YOLO
from utils import load_yaml
import json
from pathlib import Path

def run_experiment(config_path, exp_name, override_params=None):
    """
    Lance un entra√Ænement YOLO avec modifications d'hyperparam√®tres.

    - config_path : chemin vers yolo_coco128.yaml
    - exp_name : nom de l'exp√©rience ("lr_small", "epochs_10", etc.)
    - override_params : dict { "lr0": 0.005, "epochs": 10, ... }
    """
    cfg = load_yaml(config_path)
    override_params = override_params or {}

    # appliquer les modifications
    cfg["train"].update(override_params)

    print(f"üîß Lancement de l'exp√©rience : {exp_name}")
    print("Hyperparam√®tres modifi√©s :", override_params)

    model = YOLO(cfg["model"]["weights"])
    results = model.train(
        data=cfg["data"]["yaml"],
        imgsz=cfg["data"]["imgsz"],
        epochs=cfg["train"]["epochs"],
        batch=cfg["data"]["batch"],
        lr0=cfg["train"]["lr0"],
        weight_decay=cfg["train"]["weight_decay"],
        patience=cfg["train"]["patience"],
        device=cfg.get("device", "auto"),
        project="outputs/ablations",
        name=exp_name,
        verbose=False
    )

    # charger meilleur mod√®le
    best = Path(f"outputs/ablations/{exp_name}/weights/best.pt")
    model = YOLO(str(best))

    # √©valuation
    val = model.val(data=cfg["data"]["yaml"], imgsz=cfg["data"]["imgsz"], verbose=False)

    metrics = {
        "experiment": exp_name,
        "lr0": cfg["train"]["lr0"],
        "epochs": cfg["train"]["epochs"],
        "map50": val.box.map50,
        "map50_95": val.box.map,
        "precision": val.box.mp,
        "recall": val.box.mr,
    }

    return metrics



In [None]:
exp1 = run_experiment(
    "configs/yolo_coco128.yaml",
    exp_name="exp_lr_small",
    override_params={"lr0": 0.005}
)
exp1

In [None]:
exp2 = run_experiment(
    "configs/yolo_coco128.yaml",
    exp_name="exp_epochs10",
    override_params={"epochs": 10}
)
exp2

In [None]:
import json

# Charger les m√©triques de la baseline
with open("outputs/metrics.json", "r") as f:
    baseline_metrics = json.load(f)
baseline_metrics

In [None]:
baseline = {
    "experiment": "baseline",
    "lr0": 0.01,      # valeur par d√©faut dans ton YAML
    "epochs": 5,      # valeur par d√©faut
    "map50": baseline_metrics["metrics"]["map50"],
    "map50_95": baseline_metrics["metrics"]["map"],
    "precision": baseline_metrics["metrics"]["precision"],
    "recall": baseline_metrics["metrics"]["recall"],
}
baseline

In [None]:
import pandas as pd

df = pd.DataFrame([baseline, exp1, exp2])
df




In [None]:
from PIL import Image
import matplotlib.pyplot as plt

def show_image(path, title=""):
    try:
        img = Image.open(path)
        plt.figure(figsize=(6,6))
        plt.imshow(img)
        plt.axis('off')
        plt.title(title)
        plt.show()
    except FileNotFoundError:
        print(f"‚ö†Ô∏è Fichier introuvable : {path}")

In [None]:
show_image("outputs/train/confusion_matrix_normalized.png", "Confusion Matrix ‚Äî Baseline")

show_image("outputs/ablations/exp_lr_small/confusion_matrix_normalized.png", "Confusion Matrix ‚Äî lr0 plus petit")

show_image("outputs/ablations/exp_epochs10/confusion_matrix_normalized.png", "Confusion Matrix ‚Äî 10 epochs")


Commentaires : pourquoi l‚Äôun est meilleur ?

Que conclure sur la sensibilit√© du mod√®le ?

**SECTION 6 ‚Äì Final Results & Conclusion**

In [None]:
import json

with open("outputs/eval.json", "r") as f:
    metrics_final = json.load(f)

metrics_final

In [None]:
from PIL import Image
import matplotlib.pyplot as plt

def show_img(path, title=None):
    img = Image.open(path)
    plt.figure(figsize=(8,6))
    plt.imshow(img)
    plt.axis("off")
    if title:
        plt.title(title)
    plt.show()

show_img("outputs/train/val_batch0_pred.jpg", "Exemple de d√©tection finale")

##**Conclusion**

Dans ce projet, nous avons entra√Æn√© un mod√®le YOLOv8n sur le dataset COCO128.
Malgr√© un nombre d‚Äô√©poques r√©duit (5) et la taille limit√©e du dataset, le mod√®le parvient √† atteindre une performance correcte avec un mAP50 de 0.65, ce qui montre sa capacit√© √† g√©n√©raliser m√™me dans des conditions d‚Äôentra√Ænement limit√©es.

Les hyperparam√®tres utilis√©s sont :

imgsz = 640

batch = 16

epochs = 5

lr0 = 0.01

weight_decay = 0.0005

device = GPU (Tesla T4 via Google Colab)

Le meilleur mod√®le obtenu est sauvegard√© dans :outputs/train/weights/best.pt

**Performance globale**

mAP50 ‚âà 0.65

mAP50‚Äì95 ‚âà 0.48

Pr√©cision ‚âà 0.67

Recall ‚âà 0.58

Pour un mod√®le nano, 5 epochs, et un mini-dataset, ces scores sont totalement coh√©rents.

Les classes les plus simples (personne, bus, animaux visibles) sont d√©tect√©es avec une grande fiabilit√©.
En revanche, les objets petits, peu repr√©sent√©s, ou fortement occlus pr√©sentent des performances faibles.
La confusion matrix met √©galement en √©vidence des confusions logiques entre objets visuellement proches (car ‚Üî truck, handbag ‚Üî person).


**Fausses d√©tections (FP)**

On observe dans la confusion matrix :

plusieurs objets confondus avec person

erreurs sur car ‚Üî truck

erreurs petites classes (mouse, cell phone) ‚ü∂ souvent non d√©tect√©es

Cela est li√© √† la limitation naturelle de YOLOv8n (tr√®s petit mod√®le + 5 epochs)

**Exp√©rience 1 :**

Dans la premi√®re exp√©rience, nous avons r√©duit le learning rate initial.
Cette modification a deux cons√©quences principales :

Le mod√®le apprend plus lentement, ce qui se traduit par une l√©g√®re baisse des m√©triques globales (mAP et pr√©cision).

Le rappel augmente l√©g√®rement, signe que le mod√®le manque moins d‚Äôobjets, mais qu'il produit davantage de fausses d√©tections.

En r√©sum√©, baisser le learning rate rend l‚Äôapprentissage plus prudent, ce qui peut √™tre utile si on augmente le nombre d‚Äôepochs, mais dans notre cas, avec seulement 5 epochs, cela donne un mod√®le globalement moins performant que le baseline.


**Exp√©rience 2:**

Dans la troisi√®me exp√©rience, nous avons simplement doubl√© le nombre d‚Äôepochs, ce qui signifie que le mod√®le a vu le dataset deux fois plus longtemps.

Cette modification am√©liore clairement les performances :

Le mAP50 et le mAP50-95 augmentent.

Le rappel s‚Äôam√©liore √©galement.

La pr√©cision reste globalement similaire √† celle du mod√®le de base.

Ces r√©sultats montrent que le mod√®le n‚Äô√©tait pas encore √† convergence apr√®s 5 epochs, ce qui est logique sur COCO128. Avec plus d‚Äôepochs, le mod√®le apprend davantage de d√©tails, ce qui am√©liore la qualit√© g√©n√©rale des pr√©dictions.


**Conclusion g√©n√©rale**

Les exp√©riences montrent que les hyperparam√®tres influencent fortement la qualit√© d‚Äôun mod√®le YOLO :

R√©duire le learning rate sans augmenter les epochs ralentit trop l‚Äôapprentissage et d√©grade les performances globales.

Augmenter le nombre d‚Äôepochs est un moyen simple et efficace d‚Äôam√©liorer la performance, surtout sur un petit dataset comme COCO128.

Globalement, le mod√®le entra√Æn√© pendant 10 epochs offre les meilleurs r√©sultats parmi les trois, confirmant qu‚Äôun entra√Ænement plus long permet au r√©seau de mieux converger.

##**Dataset 2 : Penn-Fudan Pedestrian**



In [None]:
from train import main as train_main
train_main("configs/yolo_pennfudan.yaml")

In [None]:
from evaluate import main as eval_main

eval_main(
    "configs/yolo_pennfudan.yaml",
    "outputs_pennfudan/train/weights/best.pt"
)

In [None]:
from predict import main as pred_main

pred_main(
    "configs/yolo_pennfudan.yaml",
    "outputs_pennfudan/train/weights/best.pt",
    "datasets/PennFudanPed/images/val"
)

In [None]:
import os
from PIL import Image
import matplotlib.pyplot as plt

# --- 1) Chercher tous les dossiers de pr√©dictions YOLO ---
root = "runs/detect"

candidate_dirs = []
for d in os.listdir(root):
    full = os.path.join(root, d)
    if os.path.isdir(full):
        # On v√©rifie si le dossier contient des images pr√©dictes
        imgs = [f for f in os.listdir(full) if f.lower().endswith((".jpg", ".png"))]
        if len(imgs) > 0:
            candidate_dirs.append(full)

# Si rien trouv√© ‚Üí essayer dans outputs_pennfudan
if len(candidate_dirs) == 0:
    alt = "outputs_pennfudan/pred/vis"
    if os.path.exists(alt):
        candidate_dirs = [alt]

# S√©curit√©
if len(candidate_dirs) == 0:
    raise ValueError("‚ùå Aucun dossier d'images pr√©dictes trouv√©.")

# --- 2) Prendre le plus r√©cent ---
candidate_dirs = sorted(candidate_dirs)
last_pred = candidate_dirs[-1]
print("üìÇ Dossier de pr√©dictions utilis√© :", last_pred)

# --- 3) Lister les images ---
images = sorted([f for f in os.listdir(last_pred) if f.lower().endswith((".jpg", ".png"))])
print("üñº Images trouv√©es :", images[:10])

# --- 4) Fonction d‚Äôaffichage ---
def show_img(path):
    img = Image.open(path)
    plt.figure(figsize=(10, 8))
    plt.imshow(img)
    plt.axis('off')
    plt.show()

# --- 5) Afficher les 5 premi√®res images ---
for img_name in images[:5]:
    print(f"\n‚û°Ô∏è Affichage : {img_name}")
    show_img(os.path.join(last_pred, img_name))