<img src="./IMTA.png" alt="Logo IMT Atlantique" width="300"/>

##  **Introduction √† PyTorch/MONAI - Structuration d‚Äôun projet de Deep Learning**
## TAF Health - UE B - 2025/2026 

Pierre-Henri.Conze@imt-atlantique.fr - Vincent.Jaouen@imt-atlantique.fr


**Objectifs** 

- Manipuler des images m√©dicales avec MONAI et PyTorch.
-  Comprendre les grandes √©tapes d‚Äôun code d‚Äôapprentissage profond 
   - Pr√©paration des donn√©es (dataloader, transforms)
   - D√©finition du mod√®le
   - Boucle d‚Äôentra√Ænement
   - Validation et inf√©rence
- Mettre en place de bonnes pratiques de d√©veloppement en machine learning : 
   - Utilisation d'environnement virtuel
   - Structuration du code avec des modules r√©utilisables (code factoring)

**Introduction √† MONAI**

[MONAI](https://monai.io/) (Medical Open Network for AI) est une librairie open-source con√ßue pour le **deep learning en imagerie m√©dicale**.  
D√©velopp√©e √† l‚Äôorigine par des √©quipes de NVIDIA et King‚Äôs College London, elle est devenue rapidement la **r√©f√©rence** pour la recherche et le d√©veloppement en IA appliqu√©e √† la sant√©.

MONAI est b√¢tie **au-dessus de [PyTorch](https://pytorch.org/)** :  
- elle h√©rite donc de la flexibilit√© et de la puissance de PyTorch (tensors, GPU, backpropagation, etc.),  
- mais ajoute une surcouche sp√©cialis√©e pour les **besoins sp√©cifiques de l‚Äôimagerie m√©dicale**.

---

### Pourquoi MONAI en IA m√©dicale ?

- **Sp√©cialis√©e pour l‚Äôimagerie 3D** : contrairement aux jeux de donn√©es classiques (ImageNet, photos 2D), l‚Äôimagerie m√©dicale est souvent volumique (IRM, scanner, TEP). MONAI g√®re nativement ces formats.  
- **Transforms d√©di√©s** : des op√©rations adapt√©es (coupes 3D, interpolations m√©dicales, normalisations d‚Äôintensit√©, etc.) qui ne sont pas disponibles dans PyTorch "pur".  
- **Formats standards** : compatibilit√© directe avec les formats de donn√©es cliniques (DICOM, NIfTI, etc.).  
- **Exemples cliniques** : de nombreux mod√®les utilis√©s en imagerie m√©dicale sont disponibles, pour la segmentation de tumeurs, d√©tection de l√©sions, reconstruction, classification.  
- **Communaut√© et adoption** : soutenue par NVIDIA, des h√¥pitaux, des universit√©s et des industriels, MONAI est devenu un standard de facto pour les publications et les projets acad√©miques.

---

### MONAI et PyTorch : un duo compl√©mentaire

- **PyTorch** est le moteur : calcul diff√©rentiable, optimisation, gestion GPU/CPU.  
- **MONAI** est la bo√Æte √† outils sp√©cialis√©e : chargement des images m√©dicales, pr√©traitements adapt√©s, r√©seaux neurones 3D pr√™ts √† l‚Äôemploi, m√©triques m√©dicales.  

En r√©sum√© : **MONAI = PyTorch + expertise m√©dicale int√©gr√©e**.  

## Installation de l‚Äôenvironnement MONAI (CPU-only) local

Pour ce TP, nous cr√©ons un environnement Python **local √† la machine TP** dans `/users/local/monai`.  
Ce r√©pertoire est **en √©criture et rapide** (disque local), contrairement au `$HOME` sur NFS qui est lent.

1. **Cr√©er l‚Äôenvironnement virtuel**
   ```bash
   $ python3 -m venv /users/local/monai

2. **Activer l'environnement**
    ```bash
    $ source /users/local/monai/bin/activate
Votre prompt devrait afficher `(monai)`.

3. **Installer les d√©pendances : pytorch version cpu, monai, tools jupyter**
    ```bash
    $ pip install --index-url https://download.pytorch.org/whl/cpu torch torchvision torchaudio
    $ pip install monai[all]
    $ pip install ipykernel jupyterlab tqdm matplotlib 

4. **Enregistrer le kernel du venv dans Jupyter (utilisateur courant)**
    ```bash
    $ python -m ipykernel install --user --name=monai --display-name "monai"

4. **Lancer JupyterLab et s√©lectionner le bon kernel**
    ```bash
    $ jupyter-lab
Dans JupyterLab, choisissez le kernel Python (monai) pour vos notebooks.

**R√©activation rapide (session suivante)**

√Ä chaque nouvelle session (pas besoin de r√©installer) 
```bash
   $ source /users/local/monai/bin/activate
   $ jupyter-lab
   ```
**D√©sactivation (optionel)**

Pour retourner au shell
```bash
    $ deactivate
```



# Partie 1 ‚Äì Prise en main de MONAI
Commen√ßons par charger une image IRM 3D avec MONAI et faisons des manipulations simples.

In [None]:

import torch
from monai.transforms import LoadImage
import matplotlib.pyplot as plt

# TODO : change path to a NIfTI file
img_path_t1ce = "../datasets/3d_examples/BraTS-GLI-00000-000-t1c.nii.gz"
img_path_t2 = "../datasets/3d_examples/BraTS-GLI-00000-000-t2w.nii.gz"

loader = LoadImage(image_only=True)
img = loader(img_path_t1ce)

print("Shape:", img.shape)

# Display one axial slice
plt.imshow(img[:,:,img.shape[2]//2], cmap="gray")
plt.title("Coupe axiale")
plt.show()


**Exercice 1.1** 

Cette image a √©t√© produite par IRM pond√©r√©e en T1 avec injection de produit contrastant au gadolinium. Le gadolinium est un agent paramagn√©tique particuli√®rement int√©ressant pour l'augmentation du contraste, m√™me si il pr√©sente des inconv√©nients (toxicit√©, polluant √©ternel). 

Elle montre un glioblastome c√©r√©bral dans la zone frontale du cerveau du patient (√† gauche sur cette coupe axiale).

üëâ **Questions** : 
1. Afficher une coupe sagittale et coronale au niveau de cette tumeur
2. Afficher l'image de pond√©ration T2. Pourquoi les contrastes sont invers√©s ?
2. Changer la colormap de l'affichage
3. Donner la valeur du voxel aux coordonn√©es (120,120,76)


## Transforms

### Exercice 1.2 ‚Äî Exploration des intensit√©s et premi√®res transforms

Dans MONAI, on utilise des **`transforms`** pour appliquer des pr√©-traitements sur les images m√©dicales :  
- `LoadImaged` : charge une image depuis le disque,  
- `ScaleIntensityd` : ajuste l‚Äô√©chelle des intensit√©s,  
- `NormalizeIntensityd` : centre et normalise les intensit√©s,  
- `ToTensord` : convertit les donn√©es en tenseurs PyTorch.  

üëâ La documentation compl√®te des transforms est disponible ici : [MONAI Transforms](https://docs.monai.io/en/stable/transforms.html).  

---




In [None]:
from monai.transforms import LoadImaged, ScaleIntensityd, Compose

# Exemple minimal : on d√©finit un pipeline de transforms
transforms = Compose([
    LoadImaged(keys=["t1ce"]),         # Chargement
    ScaleIntensityd(keys=["t1ce"])     # Mise √† l‚Äô√©chelle des intensit√©s
])

# Application de la s√©quence de transforms
data_dict = {"t1ce": img_path_t1ce}
processed = transforms(data_dict)

print("Type apr√®s transform :", type(processed["t1ce"]))
print("Forme de l'image :", processed["t1ce"].shape)

üëâ **Questions** : 

1. Inspirez-vous de l‚Äôexemple ci-dessus pour appliquer un pipeline de transforms qui :
   - charge l‚Äôimage,
   - normalise les intensit√©s (`NormalizeIntensityd`),

2. Affichez l‚Äôhistogramme des intensit√©s **avant et apr√®s normalisation**.  
   *Aide : utilisez `plt.hist(processed["image"].flatten(), bins=100)`.*

3. Quelle est la nouvelle valeur du voxel aux coordonn√©es `(120, 120, 76)` apr√®s normalisation ?

4. Comparez les intensit√©s moyennes entre :
   - tissu c√©r√©bral sain,
   - r√©gion tumorale.  
   *(Indice : s√©lectionnez des r√©gions rectangulaires simples pour l‚Äôinstant.)*


## Dataset et DataLoader

En deep learning, on manipule g√©n√©ralement **un grand nombre de fichiers** (images, labels, masques, etc.).  
Il est donc n√©cessaire d‚Äôavoir une organisation syst√©matique pour :
- **acc√©der aux donn√©es** (charger depuis le disque),
- **appliquer des pr√©-traitements** (normalisation, resize, etc.),
- **les regrouper par lots (batchs)** pour les envoyer au r√©seau de neurones.

PyTorch fournit deux briques essentielles :

- **`Dataset`** : repr√©sente une *collection de donn√©es* (par exemple la liste des couples *image + label*).  
- **`DataLoader`** : enveloppe le dataset et permet d‚Äôit√©rer dessus efficacement par *batchs* (gestion du parall√©lisme, m√©lange al√©atoire, etc.).

---

### Cas de l‚Äôimagerie m√©dicale

En imagerie m√©dicale, les entr√©es sont souvent **coupl√©es** :  
- une **image m√©dicale** (IRM, scanner, etc.),  
- un **label ou masque associ√©** (segmentation, classification).  

Par exemple, pour un probl√®me de segmentation tumorale, chaque **image IRM** est associ√©e √† un **masque de la tumeur**.  

C‚Äôest ce que nous allons mettre en place ici avec MONAI.




## Dataset et DataLoader (version simple)

Avant d‚Äôaller plus loin, cr√©ons un premier **Dataset** qui relie directement :
- le chemin du fichier image (`img_fname`),
- le chemin du fichier de segmentation (`seg_fname`).

Cela correspond √† la mani√®re la plus simple d‚Äôorganiser nos donn√©es pour un probl√®me de **segmentation d‚Äôimages m√©dicales**.

---

### Exemple de JSON de description des donn√©es

Un fichier `dataset.json` contient une liste d‚Äôentr√©es au format :

```json
{
  "training": [
    {
      "img": "/chemin/vers/img1.nii.gz",
      "seg": "/chemin/vers/seg1.nii.gz"
    },
    {
      "img": "/chemin/vers/img2.nii.gz",
      "seg": "/chemin/vers/seg2.nii.gz"
    }
  ]
}

Un exemple de dataset.json d√©j√† construit est disponible dans le dossier ../datasets/MidTumors/ reliant :
- une image `trainA/BraTS_****_3c.nii.gz` 
- √† un masque de segmentation `trainB/BraTS_****_seg.nii.gz`

In [None]:

from monai.transforms import (
    LoadImaged, EnsureChannelFirstd, Resized,
    ScaleIntensityRangePercentilesd, EnsureTyped, Compose
)
from monai.data import Dataset, DataLoader
import os, json

# R√©pertoire des donn√©es (contenant dataset.json et les sous-dossiers trainA/trainB)
data_dir = "../datasets/MidTumors"
with open(os.path.join(data_dir, "dataset.json")) as f:
    data = json.load(f)
    
# D√©finition des transforms de base
from monai.transforms import Compose, LoadImaged, EnsureChannelFirstd, ScaleIntensityRangePercentilesd, EnsureTyped, Lambdad

train_transforms = Compose([
    LoadImaged(keys=["image", "label"]),
    EnsureChannelFirstd(keys=["image", "label"]),   # (H,W,3) ‚Üí (1,H,W,3)
    ScaleIntensityRangePercentilesd(
        keys="image", lower=1, upper=99, b_min=-1.0, b_max=1.0, clip=True
    ),
    # Reorder dimensions: (C=1, H, W, 3) ‚Üí (3, H, W)
    Lambdad(
        keys=["image","label"],
        func=lambda x: x.permute(3,1,2,0).squeeze(-1)   # (1,H,W,3) ‚Üí (3,H,W)
    ),
    EnsureTyped(keys=["image", "label"]),
])

# On cr√©e les chemins complets depuis dataset.json
train_files = [
    {
        "image": os.path.join(data_dir, f["image"]),
        "label": os.path.join(data_dir, f["label"])
    }
    for f in data["training"]   # juste 10 exemples pour l‚Äô√©nonc√©
]

# Cr√©ation Dataset + DataLoader
train_ds = Dataset(data=train_files, transform=train_transforms)
train_loader = DataLoader(train_ds, batch_size=1, shuffle=True)

# Test d‚Äôune it√©ration
batch = next(iter(train_loader))
print(batch["image"].shape, batch["label"].shape)

üëâ **Question** : Analysez l'image charg√©e par le mod√®le : 

- D√©terminez sa dimension. 
- Visualisez les 3 canaux 

En fait d'image tridimensionnelle, ``image`` est la m√™me coupe axiale d'un patient visualis√©e par trois s√©quences IRM diff√©rentes. Il est courant en IRM d'observer plusieurs types de contrastes. 

Un MONAI tensor doit : 
- en 3D, avoir des dimensions $N_{batchsize}\times N_{channels} \times N_x \times N_y\times N_z$
- 2D doit, avoir des dimensions $N_{batchsize}\times N_{channels} \times N_x \times N_y$


## Partie 3 ‚Äì Mod√®le et entra√Ænement

Entra√Ænons d√©sormais un mod√®le de segmentation sur ces trois coupes. 

Nous devons d√©finir un DataLoader d'un Dataset que nous d√©finirons (cf TP pr√©c√©dent)

In [None]:
from monai.networks.nets import UNet
from monai.losses import DiceCELoss
import torch

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# --- Define model ---
model = UNet(
    spatial_dims=2,
    in_channels=3,     # RGB-like input
    out_channels=1,    # binary segmentation
    channels=(16, 32, 64),
    strides=(2, 2),
).to(device)

# --- Loss & optimizer ---
loss_fn = DiceCELoss(sigmoid=True, to_onehot_y=False)
optimizer = torch.optim.Adam(model.parameters(), lr=1e-3)

# --- Training loop ---
max_epochs = 150
for epoch in range(max_epochs):
    model.train()
    epoch_loss = 0
    for batch in train_loader:   # train_loader must yield dicts with "image" & "label"
        inputs = batch["image"].to(device)   # shape (B,3,H,W)
        labels = batch["label"].to(device)   # shape (B,1,H,W)

        # Forward pass
        outputs = model(inputs)              # (B,1,H,W)

        # Loss
        loss = loss_fn(outputs, labels)

        # Backpropagation
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        epoch_loss += loss.item()

    print(f"Epoch {epoch+1}/{max_epochs}, Loss = {epoch_loss/len(train_loader):.4f}")


Voil√†, vous avez un mod√®le de segmentation qui s'entraine sur 3 canaux !

## Partie 4 ‚Äì Structuration du code

Jusqu‚Äô√† pr√©sent, nous avons identifi√© trois composants essentiels d‚Äôun projet de Deep Learning :  
- Les **transforms**, qui assurent le pr√©traitement et la mise en forme des donn√©es.  
- Le **DataLoader**, qui fournit des minibatches pendant l‚Äôentra√Ænement.  
- La **boucle d‚Äôentra√Ænement** (*training loop*), qui met √† jour les poids du r√©seau par r√©tropropagation √† chaque it√©ration.  

√Ä cela, il faut ajouter deux √©l√©ments indispensables dans toute exp√©rimentation s√©rieuse :  
- **L‚Äô√©valuation**, permettant de calculer des m√©triques de validation et de visualiser les r√©sultats interm√©diaires.  
- **La sauvegarde des poids**, afin de conserver le meilleur mod√®le selon un crit√®re de performance choisi.  

---

### Vers une structuration modulaire du code

Pour rendre un code de Deep Learning fonctionnel et flexible, il est n√©cessaire d‚Äôadopter une organisation modulaire.  
Une structuration typique consiste √† factoriser les diff√©rentes parties dans des fichiers distincts :  

- `utils/data_utils.py` : d√©finition des loaders et des transformations.  
- `utils/training.py` : impl√©mentation des boucles d‚Äôentra√Ænement.  
- `utils/evaluation.py` : calcul des m√©triques et visualisation des r√©sultats.  
- `inference/*.py` : scripts permettant d‚Äôappliquer un mod√®le entra√Æn√© √† de nouvelles donn√©es.  

---

### Mise en pratique dans les notebooks

Dans ce cours, nous allons travailler √† partir de trois notebooks factoris√©s :  

- `01_segmentation.ipynb`  
- `02_classification.ipynb`  
- `03_synthesis.ipynb`  

Ces notebooks exploitent tous le dataset **MidTumors**, que nous avons bri√®vement explor√©.  
L‚Äôint√©r√™t de cette factorisation est de permettre, dans un cadre commun, l‚Äôentra√Ænement de mod√®les r√©pondant √† des objectifs vari√©s :  

- **Segmentation** : pr√©diction d‚Äôun masque √† partir des trois contrastes IRM.  
- **Classification** : identification de la modalit√© (T1, T2, ou FLAIR).  
- **Synth√®se** : g√©n√©ration d‚Äôune pseudo-modalit√© T2 √† partir d‚Äôune image T1.  

Naturellement, les architectures de r√©seaux de neurones employ√©es diff√®rent selon la t√¢che, mais la structure de code sous-jacente reste la m√™me.  

üëâ **Question** : Executez ces diff√©rents notebooks et analysez les. Identifiez les sp√©cificit√©s li√©es √† chaque t√¢che : configuration / mod√®les / data loader...

---

### Ouverture

Une telle organisation ouvre la voie √† de nombreuses autres t√¢ches en adaptant les data loaders et les transforms. 

üëâ **Question** : adaptez ce travail √† un autre jeu de labels contenu dans `../datasets/MidTumors_3labels`, o√π les tumeurs sont cette fois d√©crites selon trois zones distinctes :  
- **≈ìd√®me**,  
- **c≈ìur tumoral (n√©crose/partie solide)**,  
- **tumeur rehauss√©e** (*zones pr√©sentant une prise de contraste apr√®s injection de Gadolinium paramagn√©tique*).  

üëâ **Bonus** : adaptez ce travail √† une nouvelle t√¢che (d√©bruitage? d√©floutage?)

#### Exemples possibles
- D√©bruitage
- Defloutage 
- Apprentissage de mod√®les de normalisation inter-patients (r√©duction des biais li√©s aux contrastes).  
