# Étape 3 – Entraînement baseline sur super-images 3×3 (Colab Pro+)

Ce notebook entraîne un classifieur multi-label sur des super-images 3×3 construites à partir de 9 frames par vidéo.
La logique d’entraînement est la même que pour l’Étape 2 (baseline framewise) :

- Le code est dans `/content/qv-pipe-classifier`
- Les données (CSV + super-images) sont sur Google Drive
- Les modèles entraînés et l’historique sont sauvegardés dans `.../models/super_images_convnext`


In [1]:
# Vérifier le GPU Colab disponible
!nvidia-smi

Sat Nov 29 21:36:29 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  NVIDIA A100-SXM4-40GB          Off |   00000000:00:04.0 Off |                    0 |
| N/A   34C    P0             43W /  400W |       0MiB /  40960MiB |      0%      Default |
|                                         |                        |             Disabled |
+-----------------------------------------+------------------------+----------------------+
                                                

In [2]:
# Monter Google Drive (données + sorties des modèles)

from google.colab import drive
drive.mount('/content/drive')


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


## Cloner dépôt dans /content

In [3]:
# Clonage du dépôt dans /content (première fois dans cette session)
%cd /content

!git clone https://github.com/Simon-VDC/qv-pipe-classifier.git
%cd qv-pipe-classifier

!ls


/content
Cloning into 'qv-pipe-classifier'...
remote: Enumerating objects: 359, done.[K
remote: Counting objects: 100% (191/191), done.[K
remote: Compressing objects: 100% (161/161), done.[K
remote: Total 359 (delta 83), reused 106 (delta 22), pack-reused 168 (from 1)[K
Receiving objects: 100% (359/359), 834.98 KiB | 10.31 MiB/s, done.
Resolving deltas: 100% (168/168), done.
/content/qv-pipe-classifier
CONFIG.md      docs		exp	   project_tree.txt  requirements
data	       ENVIRONMENT.md	LICENSE    README.md	     scripts
DATA_NOTES.md  environment.yml	notebooks  reports	     src


In [3]:
# Si le dépôt est déjà cloné, le mettre à jour
%cd /content/qv-pipe-classifier
!git pull

/content/qv-pipe-classifier
Already up to date.


## Installation des dépendances

In [4]:
# Installer les dépendances Step 2
!pip install -r requirements/step3_training.txt




## Configuration des dossiers de données et de modèles

Les données (CSV + super-images) sont stockées sur Google Drive.  
Les modèles entraînés et l’historique pour l’Étape 3 seront sauvegardés dans :

- `models/super_images_convnext/fold_*/best.pth`
- `models/super_images_convnext/fold_*/history.json`

In [5]:
import os

# Dossier racine des données sur Google Drive
DATA_BASE_DIR = "/content/drive/MyDrive/QV Pipe"  # adapter si nécessaire

# CSV des splits pour les super-images (doit contenir : video_stem, superimage_path, labels_str, fold)
SPLITS_CSV = os.path.join(DATA_BASE_DIR, "data/splits/super_images_3x3_folds_colab.csv")

# Dossier de sortie pour les modèles et l'historique (même logique que baseline Étape 2)
MODELS_DIR = os.path.join(DATA_BASE_DIR, "models/super_images_convnext")

print("SPLITS_CSV:", SPLITS_CSV)
print("MODELS_DIR:", MODELS_DIR)


SPLITS_CSV: /content/drive/MyDrive/QV Pipe/data/splits/super_images_3x3_folds_colab.csv
MODELS_DIR: /content/drive/MyDrive/QV Pipe/models/super_images_convnext


## Correction du fichier splits pour colab

In [11]:
import os
import pandas as pd

# Chemin du CSV original (celui que tu utilises actuellement)
DATA_BASE_DIR = "/content/drive/MyDrive/QV Pipe"  # adapte si besoin
ORIG_CSV = os.path.join(DATA_BASE_DIR, "data/splits/super_images_3x3_folds.csv")

df = pd.read_csv(ORIG_CSV)
print("Avant correction:", df.loc[0, "superimage_path"])

# 1) Si les chemins sont relatifs "data/super_images/...."
# 2) Si le vrai dossier sur Drive est "data/super_images_3x3"
#    et que tu veux des chemins ABSOLUS pour Colab

def fix_path(p):
    # remplace le dossier si besoin
    p = str(p).replace("data/super_images/", "data/super_images_3x3/")
    # préfixe par le chemin de base sur le Drive
    full = os.path.join(DATA_BASE_DIR, p)
    return full

df["superimage_path"] = df["superimage_path"].apply(fix_path)

print("Après correction:", df.loc[0, "superimage_path"])
print("Existe sur le disque :", os.path.exists(df.loc[0, "superimage_path"]))

# Sauvegarde dans un nouveau CSV spécifique à Colab
FIXED_CSV = os.path.join(DATA_BASE_DIR, "data/splits/super_images_3x3_folds_colab.csv")
df.to_csv(FIXED_CSV, index=False)

print("CSV corrigé sauvegardé dans :", FIXED_CSV)


Avant correction: data/super_images/2019_3x3.jpg
Après correction: /content/drive/MyDrive/QV Pipe/data/super_images_3x3/2019_3x3.jpg
Existe sur le disque : True
CSV corrigé sauvegardé dans : /content/drive/MyDrive/QV Pipe/data/splits/super_images_3x3_folds_colab.csv


## Vérification rapide du CSV de splits


Vérifier que :
- Le fichier CSV existe
- La colonne `superimage_path` contient des chemins valides vers des fichiers PNG/JPEG stockés sur Google Drive

In [12]:
import pandas as pd

assert os.path.exists(SPLITS_CSV), f"Fichier CSV introuvable : {SPLITS_CSV}"

df = pd.read_csv(SPLITS_CSV)
print("CSV chargé, shape :", df.shape)
print(df.head())

# Optionnel : vérifier le premier chemin d’image
first_path = df.loc[0, "superimage_path"]
print("Exemple de superimage_path :", first_path)
print("Existe sur le disque :", os.path.exists(first_path))


CSV chargé, shape : (2881, 4)
  video_stem                                    superimage_path labels_str  \
0       2019  /content/drive/MyDrive/QV Pipe/data/super_imag...          0   
1        202  /content/drive/MyDrive/QV Pipe/data/super_imag...          0   
2       2022  /content/drive/MyDrive/QV Pipe/data/super_imag...          0   
3       2023  /content/drive/MyDrive/QV Pipe/data/super_imag...          0   
4       2036  /content/drive/MyDrive/QV Pipe/data/super_imag...          0   

   fold  
0     0  
1     4  
2     2  
3     2  
4     0  
Exemple de superimage_path : /content/drive/MyDrive/QV Pipe/data/super_images_3x3/2019_3x3.jpg
Existe sur le disque : True


## Vérifier la disponibilité du GPU

Vérifier que Colab utilise un GPU et afficher son nom.


In [6]:
import torch

print("CUDA disponible :", torch.cuda.is_available())
if torch.cuda.is_available():
    print("GPU :", torch.cuda.get_device_name(0))


CUDA disponible : True
GPU : NVIDIA A100-SXM4-40GB


# Dry run sur 1 fold (test rapide)

Lancer un entraînement court (peu d’epochs, petit batch) sur un seul fold pour valider :
- Le chargement des données depuis `super_images_3x3_folds.csv`
- Le forward/backward du modèle
- Le calcul de la loss et de la mAP
- La sauvegarde du checkpoint et de l’historique dans `MODELS_DIR`

In [7]:
%cd /content/qv-pipe-classifier

!python -m src.train.super_images_baseline \
  --splits_csv "{SPLITS_CSV}" \
  --models_dir "{MODELS_DIR}" \
  --fold 0 \
  --epochs 2 \
  --batch_size 2 \
  --lr 1e-3 \
  --model_name "convnext_base" \
  --num_workers 0 \
  --dry_run


/content/qv-pipe-classifier
[INFO] Using device: cuda
[INFO] Loading splits CSV from /content/drive/MyDrive/QV Pipe/data/splits/super_images_3x3_folds_colab.csv
[INFO] Found 2881 super-images avec labels.
[INFO] Inferred num_classes = 17
[INFO] Fold 0: train samples = 2303, val samples = 578
[INFO] Train batches: 1152, Val batches: 289
[INFO] Creating backbone: convnext_base
[INFO] Running DRY RUN (one batch through the model)...
Batch images shape: torch.Size([2, 3, 448, 448])
Batch labels shape: torch.Size([2, 17])
Logits shape: torch.Size([2, 17])
[INFO] Dry run OK. Exiting.


# Mini entrainement réel

In [8]:
%cd /content/qv-pipe-classifier

!python -m src.train.super_images_baseline \
  --splits_csv "{SPLITS_CSV}" \
  --models_dir "{MODELS_DIR}" \
  --fold 0 \
  --epochs 2 \
  --batch_size 4 \
  --lr 1e-3 \
  --model_name "convnext_base" \
  --num_workers 4


/content/qv-pipe-classifier
[INFO] Using device: cuda
[INFO] Loading splits CSV from /content/drive/MyDrive/QV Pipe/data/splits/super_images_3x3_folds_colab.csv
[INFO] Found 2881 super-images avec labels.
[INFO] Inferred num_classes = 17
[INFO] Fold 0: train samples = 2303, val samples = 578
[INFO] Train batches: 576, Val batches: 145
[INFO] Creating backbone: convnext_base

Epoch 1/2
Epoch 1: train_loss=0.2704, val_loss=0.2686, val_mAP=0.1047, lr=0.000500
New best mAP = 0.1047 → checkpoint saved at /content/drive/MyDrive/QV Pipe/models/super_images_convnext/convnext_base_fold0/best_model.pth

Epoch 2/2
Epoch 2: train_loss=0.2627, val_loss=0.2650, val_mAP=0.1049, lr=0.000000
New best mAP = 0.1049 → checkpoint saved at /content/drive/MyDrive/QV Pipe/models/super_images_convnext/convnext_base_fold0/best_model.pth

Training finished.
Best mAP on fold 0 = 0.1049
Best model saved at: /content/drive/MyDrive/QV Pipe/models/super_images_convnext/convnext_base_fold0/best_model.pth
History saved

# Entrainement des 5 folds sur 20 epoch pour les superimage

Une fois le dry run validé, lancer un entraînement simple sur un fold pour tester le modele.

In [9]:
!python -m src.train.super_images_baseline \
  --splits_csv "{SPLITS_CSV}" \
  --models_dir "{MODELS_DIR}" \
  --fold 0 \
  --epochs 20 \
  --batch_size 4 \
  --lr 1e-3 \
  --model_name "convnext_base" \
  --num_workers 12


[INFO] Using device: cuda
[INFO] Loading splits CSV from /content/drive/MyDrive/QV Pipe/data/splits/super_images_3x3_folds_colab.csv
[INFO] Found 2881 super-images avec labels.
[INFO] Inferred num_classes = 17
[INFO] Fold 0: train samples = 2303, val samples = 578
[INFO] Train batches: 576, Val batches: 145
[INFO] Creating backbone: convnext_base

Epoch 1/20
Epoch 1: train_loss=0.2704, val_loss=0.2686, val_mAP=0.1047, lr=0.000994
New best mAP = 0.1047 → checkpoint saved at /content/drive/MyDrive/QV Pipe/models/super_images_convnext/convnext_base_fold0/best_model.pth

Epoch 2/20
Epoch 2: train_loss=0.2646, val_loss=0.2655, val_mAP=0.1058, lr=0.000976
New best mAP = 0.1058 → checkpoint saved at /content/drive/MyDrive/QV Pipe/models/super_images_convnext/convnext_base_fold0/best_model.pth

Epoch 3/20
Epoch 3: train_loss=0.2631, val_loss=0.2666, val_mAP=0.0959, lr=0.000946

Epoch 4/20
Epoch 4: train_loss=0.2629, val_loss=0.2651, val_mAP=0.1001, lr=0.000905

Epoch 5/20
Epoch 5: train_loss=0

ConvNeXt-Base, super-images 3×3, BCE, lr=1e-3 → mAP ≈ 0.117 sur le fold 0.

## Stagne --> modele qui prend peu de risque



In [10]:
%cd /content/qv-pipe-classifier

NEW_MODELS_DIR = "/content/drive/MyDrive/QV Pipe/models/super_images_convnext_lr3e-3"

!python -m src.train.super_images_baseline \
  --splits_csv "{SPLITS_CSV}" \
  --models_dir "{NEW_MODELS_DIR}" \
  --fold 0 \
  --epochs 20 \
  --batch_size 4 \
  --lr 3e-3 \
  --model_name "convnext_base" \
  --num_workers 12


/content/qv-pipe-classifier
[INFO] Using device: cuda
[INFO] Loading splits CSV from /content/drive/MyDrive/QV Pipe/data/splits/super_images_3x3_folds_colab.csv
[INFO] Found 2881 super-images avec labels.
[INFO] Inferred num_classes = 17
[INFO] Fold 0: train samples = 2303, val samples = 578
[INFO] Train batches: 576, Val batches: 145
[INFO] Creating backbone: convnext_base

Epoch 1/20
Epoch 1: train_loss=0.2731, val_loss=0.2695, val_mAP=0.1017, lr=0.002982
New best mAP = 0.1017 → checkpoint saved at /content/drive/MyDrive/QV Pipe/models/super_images_convnext_lr3e-3/convnext_base_fold0/best_model.pth

Epoch 2/20
Epoch 2: train_loss=0.2651, val_loss=0.2666, val_mAP=0.1063, lr=0.002927
New best mAP = 0.1063 → checkpoint saved at /content/drive/MyDrive/QV Pipe/models/super_images_convnext_lr3e-3/convnext_base_fold0/best_model.pth

Epoch 3/20
Epoch 3: train_loss=0.2638, val_loss=0.2671, val_mAP=0.0968, lr=0.002837

Epoch 4/20
Epoch 4: train_loss=0.2632, val_loss=0.2651, val_mAP=0.0960, lr=

## Fonction de perte : passage de BCE à ASL

Initialement, la baseline utilisait une perte BCEWithLogitsLoss classique, bien adaptée à la classification multi-label mais peu robuste au fort déséquilibre de classes du dataset QV Pipe (beaucoup de zéros, peu de positives par classe).