## Notebook : 03_model_transfer_learning.ipynb
- Objectif : Comparer plusieurs modèles UNet avec backbones pré-entraînés (Transfer Learning)
# 1 - Imports & préparation
## 1.1 - Librairies standards

In [1]:
import os
import sys
from pathlib import Path
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
import tensorflow as tf
from tensorflow.keras import mixed_precision
import mlflow

In [2]:
print("✅ TensorFlow version :", tf.__version__)

✅ TensorFlow version : 2.10.1


In [3]:
print("GPU dispo :", tf.config.list_physical_devices("GPU"))

GPU dispo : [PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]


## 1.2 - Ajout des dossiers src/ et scripts/ au PYTHONPATH

In [4]:
project_root = Path().resolve().parent  # on part du dossier du notebook
src_path = project_root / "src"
scripts_path = project_root / "scripts"

for path in [src_path, scripts_path]:
    if str(path) not in sys.path:
        sys.path.append(str(path))

In [5]:
print("project_root =", project_root)
print("src_path =", src_path)

project_root = C:\Users\motar\Desktop\1-openclassrooms\AI_Engineer\1-projets\P08\P08_segmentation
src_path = C:\Users\motar\Desktop\1-openclassrooms\AI_Engineer\1-projets\P08\P08_segmentation\src


### Lancer, dans une console séparée (windows):
#### - nvidia-smi
- Cela affichera :

    - la charge GPU

    - la mémoire utilisée

    - le nom du process Python en cours

In [6]:
from gpu_setup import enable_gpu_boost
enable_gpu_boost()

✅ TensorFlow version : 2.10.1
🟢 GPU détecté : /physical_device:GPU:0
🔧 GPU utilisé : /device:GPU:0 | Mémoire : 4.5 GB


## 1.3 - Configuration des chemins et environnement
- Chemins relatifs depuis notebooks/, vers data/ à la racine du projet

In [7]:
data_dir = project_root / "data" / "processed" / "augmented"
outputs_dir = project_root / "outputs" / "figures"
logs_dir = project_root / "outputs" / "logs"
models_dir = project_root / "models"

outputs_dir.mkdir(parents = True, exist_ok = True)
logs_dir.mkdir(parents = True, exist_ok = True)

## 1.4 - Chargement du mouchard guardrail pour prévenir les erreurs liées à l'environnement

In [8]:
from utils.guardrail import check_paths_exist, check_imports

check_paths_exist([
    models_dir,
    data_dir / "train.npz",
    data_dir / "val.npz"
])

check_imports([
    "model_training.metrics",
    "utils.viz_utils"
])

✅ Chemin OK : C:\Users\motar\Desktop\1-openclassrooms\AI_Engineer\1-projets\P08\P08_segmentation\models
✅ Chemin OK : C:\Users\motar\Desktop\1-openclassrooms\AI_Engineer\1-projets\P08\P08_segmentation\data\processed\augmented\train.npz
✅ Chemin OK : C:\Users\motar\Desktop\1-openclassrooms\AI_Engineer\1-projets\P08\P08_segmentation\data\processed\augmented\val.npz
✅ Import OK : model_training.metrics
✅ Import OK : utils.viz_utils


## 1.5 - Vérification de la validité des modèles sauvegardés

In [9]:
from model_training.metrics import iou_score, dice_coef
from utils.guardrail import check_models_validity

check_models_validity(models_dir, custom_objects={"iou_score": iou_score, "dice_coef": dice_coef})

⚠️ Aucun fichier modèle .h5 trouvé dans : C:\Users\motar\Desktop\1-openclassrooms\AI_Engineer\1-projets\P08\P08_segmentation\models


# 2 - Chargement des données pré-traitées (.npz)
## 2.1 - Lecture des fichiers .npz

In [10]:
print("[INFO] Chargement des données .npz...")
train = np.load(data_dir / "train.npz")
val   = np.load(data_dir / "val.npz")

X_train, Y_train = train["X"], train["Y"]
X_val, Y_val     = val["X"], val["Y"]

print(f"\n✅ Données chargées : {X_train.shape} / {Y_train.shape}")

[INFO] Chargement des données .npz...

✅ Données chargées : (4000, 256, 256, 3) / (4000, 256, 256)


# 3 - Import du module d'entraînement multi-backbones

In [11]:
from model_training.train_unet_backbones import train_unet_with_backbone

# 4 - Configuration des tests
## 4.1 - Liste des backbones à tester

In [12]:
backbones = ["vgg16", "mobilenetv2", "efficientnetb0"]

## 4.2 - Paramètres communs à tous les modèles

In [13]:
params = {
    'img_size': (256, 256),
    'epochs': 40,
    'batch_size': 4,
    'use_early_stopping': True,
    'force_retrain': True
}

# 5 - Entraînement de tous les modèles + collecte des résultats
## 5.1 - Boucle d'entraînement

In [14]:
from utils.utils import clean_gpu_cache


In [15]:
results = []

In [None]:
for b in backbones:
    print(f"\n🧪 Entraînement du modèle UNet + {b.upper()}...")
    
    # Nettoyage du GPU avant chaque backbone
    clean_gpu_cache()
    print("🧹 Cache GPU nettoyé")
    
    model, history = train_unet_with_backbone(
        backbone_name = b,
        X_train = X_train,
        Y_train = Y_train,
        X_val = X_val,
        Y_val = Y_val,
        **params
    )

    val_iou = max(history["val_iou_score"])
    val_dice = max(history["val_dice_coef"])
    val_acc = max(history["val_accuracy"])
    train_time = len(history["loss"])

    results.append({
        "backbone": b,
        "val_iou": val_iou,
        "val_dice": val_dice,
        "val_accuracy": val_acc,
        "epochs_run": train_time
    })

    # Affichage intermédiaire
    print(f"\n📊 Résumé intermédiaire - {b.upper()} :")
    print(f"IoU max       : {val_iou:.4f}")
    print(f"Dice max      : {val_dice:.4f}")
    print(f"Accuracy max  : {val_acc:.4f}")
    print(f"Epochs effectués : {train_time}")

    plt.figure(figsize=(8, 4))
    plt.plot(history["val_iou_score"], label = "val_iou_score")
    plt.plot(history["val_dice_coef"], label = "val_dice_coef")
    plt.title(f"{b.upper()} - IoU & Dice")
    plt.xlabel("Epochs")
    plt.ylabel("Score")
    plt.grid(True)
    plt.legend()
    plt.tight_layout()
    plt.savefig(outputs_dir / f"curve_iou_dice_{b}.png")
    plt.show()


🧪 Entraînement du modèle UNet + VGG16...
🧹 Cache GPU nettoyé
🔄 Lancement du serveur MLflow local...
✅ Serveur MLflow démarré sur http://127.0.0.1:5000
[LOG] ➤ train_unet_with_backbone appelé
[INFO] Initialisation du modèle UNet avec backbone : vgg16
✅ Serveur MLflow déjà actif sur http://127.0.0.1:5000
[LOG] ➤ build_unet_backbone appelé
Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40

# 6 - Synthèse comparative des performances
## 6.1 - Visualisation tabulaire

In [None]:
results_df = pd.DataFrame(results)
display(results_df.sort_values(by = "val_iou", ascending = False))

## 6.2 - Export CSV + log intermédiaire

In [None]:
results_df.to_csv(logs_dir / "backbones_runs.csv", index = False)

## 6.3 - Visualisation graphique

In [None]:
plt.figure(figsize=(10,5))
plt.bar(results_df["backbone"], results_df["val_iou"], color='cornflowerblue')
plt.title("Comparaison des IoU par backbone")
plt.ylabel("Meilleur IoU")
plt.xlabel("Backbone")
plt.grid(True)
plt.tight_layout()
plt.savefig(outputs_dir / "backbone_comparison_iou.png")
plt.show()

## 6.4 - Heatmap IoU vs Dice

In [None]:
heat_data = results_df.set_index("backbone")[["val_iou", "val_dice"]]
plt.figure(figsize=(6, 4))
sns.heatmap(heat_data, annot=True, cmap="Blues", fmt=".3f")
plt.title("Heatmap : IoU vs Dice")
plt.tight_layout()
plt.savefig(outputs_dir / "heatmap_iou_dice.png")
plt.show()

# 7 - Sélection du meilleur modèle + préparation pour Optuna
## 7.1 - Sélection automatique du backbone le plus performant (IoU)

In [None]:
best_row = results_df.sort_values(by="val_iou", ascending=False).iloc[0]
best_backbone = best_row["backbone"]
print(f"\n🏆 Meilleur backbone sélectionné automatiquement : {best_backbone.upper()}")

## 7.2 - Déclenchement d'un script Optuna personnalisé (prévu dans un fichier externe)

In [None]:
from model_training.optimize_unet_with_optuna import run_optuna_for_backbone
run_optuna_for_backbone(best_backbone, X_train, Y_train, X_val, Y_val)