In [1]:
from torch.utils.data import DataLoader
from torchvision import transforms
from progressBar import printProgressBar

import medicalDataLoader
import argparse
from utils import *

from UNet_Base import *
import random
import torch
import pdb

In [2]:
import warnings
warnings.filterwarnings("ignore")

## Architecture du mod√®le (Bas√© sur UNet)
En blanc le mod√®le de base, <span style="color: yellow;">en jaune nos am√©liorations non termin√©es,</span> <span style="color: lightgreen;">en vert les am√©liorations termin√©es</span>

L‚Äôarchitecture baseline suit la structure classique d‚Äôun UNet : *Encoder --> Bottleneck --> Decoder* avec des skip connection skip connections entre blocs sym√©triques.

### Chemin contractant : Encoder

- On prend en entr√©e une image √† 1 canal et on compresse progressivement les features via 4 blocs encoder :
    - `enc1` : 1 --> 4 canaux
    - `enc2` : 4 --> 8 canaux
    - `enc3` : 8 --> 16 canaux
    - `enc4` : 16 --> 32 canaux (avec dropout pour la r√©gularisation)

- Chaque bloc encoder effectue :
    - une convolution 3√ó3
    - une normalisation BatchNorm
    - un ReLU
    - <span style="color: yellow;">un dropout optionnel (ajout pour r√©gularisation)</span>
    - un MaxPool pour r√©duire la r√©solution spatiale

Ces blocs permettent de capturer progressivement des caract√©ristiques de plus en plus complexes tout en compressant l‚Äôinformation.

### Bottleneck : Couche centrale

- On arrive au bottleneck (`center`) 32 --> 64 --> 32.

C‚Äôest la zone o√π l‚Äôimage est repr√©sent√©e de mani√®re la plus compacte avant la reconstruction.

### Bottleneck : Chemin expansif : Decoder

- L‚Äôimage est ensuite reconstruite via 4 blocs decoder :
    - `dec4` : 64 --> 32 --> 16
    - `dec3` : 32 -6> 16 --> 8
    - `dec2` : 16 --> 8 --> 4
    - `dec1` : 2 convolutions 3*3 (4 --> 4 --> 4) 
 
- Chaque bloc decoder effectue : 
    - une convolution 3√ó3
    - une normalisation BatchNorm
    - un ReLU
    - un upsampling avec ConvTranspose2d



### Skip Connections

Les sorties des blocs encoder sont concat√©n√©es aux blocs decoder correspondants. 
- pour r√©injecter des d√©tails locaux provenant de l‚Äôencoder, ce qui limite la perte d'information due au bottleneck

### Couche finale

La couche finale est une convolution 1√ó1 qui produit C logits pour les C classes --> on obtient un tenseur au format [B, C, H, W]

- B	Taille du batch
- C	Nombre de classes 
- H	Hauteur de l‚Äôimage
- W	Largeur 

Pour **B** images, pour i allant de 0 √† B --> la sortie pour [image i] contient **C** matrices (= une matrice par classe) de dimension **H*W**, avec un logit (=output avant le softmax) pour chaque pixel.

In [None]:
def dice_score(pred, target, num_classes, eps=1e-7):
    """
    Calcule le Dice score pour chaque classe

    Parameters
    ----------
    pred : voir le markdown plus haut
    target : format [B, H, W]
        contient une seule valeur (et une seule matrice) par pixel :
        (0=background, 1=classe 1, 2=classe 2, 3=classe 3)
    num_classes : int
        nombre de classes - incluant le background
    eps : float
        petite valeur pour √©viter la division par z√©ro

    Returns
    -------
    dice_per_class : tensor
        tensor contenant le dice score pour chaque classe (dim [num_classes])
    """
    pred_classes = torch.argmax(pred, dim=1)  # retourne une pred par pixel au format [B, H, W]

    dice_per_class = []
    # on itere sur toutes les classes pour
    for c in range(num_classes):
        # cr√©ation de masques binaires pour la classe c pour pred et target
        pred_c = (pred_classes == c).float()
        target_c = (target == c).float() 

        intersection = (pred_c * target_c).sum() # ne donne 1 que si la pr√©dition et  la target correspondent
        union = pred_c.sum() + target_c.sum() # la somme des pixels pr√©dits + la somme des pixels r√©els

        dice = (2 * intersection + eps) / (union + eps)
        dice_per_class.append(dice)

    # retoune un tensor de dimension [num_classes]
    return torch.stack(dice_per_class)

In [None]:
def runTraining():

    print('-' * 40)
    print('~~~~~~~~  Starting the training... ~~~~~~')
    print('-' * 40)

    ## DEFINE HYPERPARAMETERS (batch_size > 1)
    batch_size = 4
    batch_size_val = 4 
    lr = 0.01    # Learning Rate
    epoch = 10 # Number of epochs
    
    root_dir = './Data/'

    print(' Dataset: {} '.format(root_dir))

    ## DEFINE THE TRANSFORMATIONS TO DO AND THE VARIABLES FOR TRAINING AND VALIDATION
    
    transform = transforms.Compose([
        transforms.ToTensor()
    ])

    mask_transform = transforms.Compose([
        transforms.ToTensor()
    ])

    train_set_full = medicalDataLoader.MedicalImageDataset('train',
                                                      root_dir,
                                                      transform=transform,
                                                      mask_transform=mask_transform,
                                                      augment=False,
                                                      equalize=False)

    train_loader_full = DataLoader(train_set_full,
                              batch_size=batch_size,
                              worker_init_fn=np.random.seed(0),
                              num_workers=0,
                              shuffle=True)


    val_set = medicalDataLoader.MedicalImageDataset('val',
                                                    root_dir,
                                                    transform=transform,
                                                    mask_transform=mask_transform,
                                                    equalize=False)

    val_loader = DataLoader(val_set,
                            batch_size=batch_size_val,
                            worker_init_fn=np.random.seed(0),
                            num_workers=0,
                            shuffle=False)

    # definition de la fonction de validation
    def validate(model, loader, criterion, num_classes):
        """
        Evalue les performances du mod√®le sur un ensemble de validation (dice + loss)

        Parameters
        ----------
        model : torch.nn.Module
            Le mod√®le √† √©valuer
        loader : torch.utils.data.DataLoader
            Dataloader avec les images + labels pour la validation
        criterion : callable
            Fonction de perte utilis√©e pour calculer le loss 
        num_classes : int
            Nombre de classes de segmentation pour le dice

        Returns
        -------
        avg_loss : float
            Loss moyen sur l‚Äôensemble du dataset
        dice_mean : numpy.ndarray
            Tableau de dim [num_classes] contenant la moyenne du dice 
        pour chaque classe de segmentation

        """
        model.eval() # passe en mode √©valuation
        total_loss = 0.0
        dice_total = []

        with torch.no_grad(): # pas de calcul de gradient -> pas necessaire ici et plus rapide 
            for images, labels, _ in loader:
                images = to_var(images)
                labels = to_var(labels)

                outputs = model(images) # prediction du mod√®le
                segmentation_classes = getTargetSegmentation(labels)

                loss = criterion(outputs, segmentation_classes)
                total_loss += loss.item()

                dice = dice_score(outputs, segmentation_classes, num_classes)
                dice_total.append(dice.cpu().numpy())

        dice_mean = np.mean(np.array(dice_total), axis=0)  # dice pour chaque classe
        return total_loss / len(loader), dice_mean

    ## INITIALIZE YOUR MODEL
    num_classes = 4 # NUMBER OF CLASSES

    print("~~~~~~~~~~~ Creating the UNet model ~~~~~~~~~~")
    modelName = 'Test_Model'
    print(" Model Name: {}".format(modelName))

    ## CREATION OF YOUR MODEL
    net = UNet(num_classes)

    print("Total params: {0:,}".format(sum(p.numel() for p in net.parameters() if p.requires_grad)))

    # DEFINE YOUR OUTPUT COMPONENTS (e.g., SOFTMAX, LOSS FUNCTION, ETC)
    softMax = torch.nn.Softmax(dim=1)
    CE_loss = torch.nn.CrossEntropyLoss()

    ## PUT EVERYTHING IN GPU RESOURCES    
    if torch.cuda.is_available():
        net.cuda()
        softMax.cuda()
        CE_loss.cuda()

    ## DEFINE YOUR OPTIMIZER
    optimizer = torch.optim.Adam(net.parameters(), lr=lr)

    ### To save statistics ####
    lossTotalTraining = []
    Best_loss_val = 1000
    BestEpoch = 0
    
    directory = 'Results/Statistics/' + modelName

    print("~~~~~~~~~~~ Starting the training ~~~~~~~~~~")
    if os.path.exists(directory)==False:
        os.makedirs(directory)

    ## START THE TRAINING
    
    ## FOR EACH EPOCH
    for i in range(epoch):
        net.train() # mod√®le en mode entrainement
        lossEpoch = []
        DSCEpoch = []
        DSCEpoch_w = []
        num_batches = len(train_loader_full)
        
        ## FOR EACH BATCH
        for j, data in enumerate(train_loader_full):
            ### Set to zero all the gradients
            net.zero_grad()
            optimizer.zero_grad()

            ## GET IMAGES, LABELS and IMG NAMES
            images, labels, img_names = data

            ### From numpy to torch variables
            labels = to_var(labels)
            images = to_var(images)

            ################### Train ###################
            #-- The CNN makes its predictions (forward pass)
            net_predictions = net(images)

            #-- Compute the losses --#
            # THIS FUNCTION IS TO CONVERT LABELS TO A FORMAT TO BE USED IN THIS CODE
            segmentation_classes = getTargetSegmentation(labels)
            
            # COMPUTE THE LOSS
            CE_loss_value = CE_loss(net_predictions, segmentation_classes) # XXXXXX and YYYYYYY are your inputs for the CE
            lossTotal = CE_loss_value

            # DO THE STEPS FOR BACKPROP (two things to be done in pytorch)
            
            # THIS IS JUST TO VISUALIZE THE TRAINING 
            lossEpoch.append(lossTotal.cpu().data.numpy())
            printProgressBar(j + 1, num_batches,
                             prefix="[Training] Epoch: {} ".format(i),
                             length=15,
                             suffix=" Loss: {:.4f}, ".format(lossTotal))

        lossEpoch = np.asarray(lossEpoch)
        lossEpoch = lossEpoch.mean()

        lossTotalTraining.append(lossEpoch)

        # ---- DICE SCORE ---- #
        with torch.no_grad():
            dice = dice_score(net_predictions, segmentation_classes, num_classes)
            DSCEpoch.append(dice.cpu().numpy())


        printProgressBar(num_batches, num_batches,
                             done="[Training] Epoch: {}, LossG: {:.4f}".format(i,lossEpoch))
        
        # VALIDATION PHASE 
        val_loss, val_dice = validate(net, val_loader, CE_loss, num_classes)
        print(f"[Validation] Epoch: {i}, Loss: {val_loss:.4f}, Dice: {val_dice}")

        # SAUVEGARDE DU MEILLEUR MODELE SELON LE LOSS DE VALIDATION
        if val_loss < Best_loss_val:
            Best_loss_val = val_loss
            BestEpoch = i

            if not os.path.exists('./models/' + modelName):
                os.makedirs('./models/' + modelName)

            torch.save(net.state_dict(), './models/' + modelName + '/' + str(i) + '_Epoch')
            print(f"Best model updated at epoch {i} (val_loss={val_loss:.4f})")

    print("\n----------------------------------------")
    print(f"Best model found at epoch {BestEpoch} with validation loss = {Best_loss_val:.4f}")
    print("----------------------------------------\n")


        # ## THIS IS HOW YOU WILL SAVE THE TRAINED MODELS AFTER EACH EPOCH. 
        # ## WARNING!!!!! YOU DON'T WANT TO SAVE IT AT EACH EPOCH, BUT ONLY WHEN THE MODEL WORKS BEST ON THE VALIDATION SET!!
        # if not os.path.exists('./models/' + modelName):
        #         os.makedirs('./models/' + modelName)

        #     torch.save(net.state_dict(), './models/' + modelName + '/' + str(i) + '_Epoch')
            
        # np.save(os.path.join(directory, 'Losses.npy'), lossTotalTraining)


√Ä chaque epoch, le mod√®le passe successivement par :

- une phase d'entra√Ænement (LossG),
- une phase de validation (val_loss),
- une v√©rification si le mod√®le est le meilleur jusqu‚Äôici.

Dans cette fonction, nous avons ajout√© :
<p style="color:lightgreen">
- Une fonction pour √©valuer le mod√®le √† chaque epoch<br>
- Une fonction pour calculer le Dice score
</p>

In [5]:
runTraining()

----------------------------------------
~~~~~~~~  Starting the training... ~~~~~~
----------------------------------------
 Dataset: ./Data/ 
~~~~~~~~~~~ Creating the UNet model ~~~~~~~~~~
 Model Name: Test_Model
Total params: 60,664
~~~~~~~~~~~ Starting the training ~~~~~~~~~~
[Training] Epoch: 0 [DONE]                                 
[Training] Epoch: 0, LossG: 1.8079                                                                           
[Validation] Epoch: 0, Loss: 1.6403, Dice: [0.25092205 0.00207371 0.0196559  0.014097  ]
Best model updated at epoch 0 (val_loss=1.6403)
[Training] Epoch: 1 [DONE]                                 
[Training] Epoch: 1, LossG: 1.8074                                                                           
[Validation] Epoch: 1, Loss: 1.7036, Dice: [0.3067482  0.00233595 0.01749299 0.01859846]
[Training] Epoch: 2 [DONE]                                 
[Training] Epoch: 2, LossG: 1.8084                                                            

On observe que la perte d‚Äôentra√Ænement reste stable autour de 1.07 pour toutes les √©poques :
- Cela indique que le mod√®le baseline apprend tr√®s peu, ou pas du tout.
- Le mod√®le apprend un peu au d√©but (jusqu'√† epoch : 6), puis commence √† stagner ou l√©g√®rement sur-apprendre
- Meilleur mod√®le = epoch 6

A faire ensuite :
- Am√©liore le mod√®le
- faire un dice score
- visualiser les diff√©rentes √©tapes/pr√©dictions

**Selon l'ami le chat :**

üîç Que v√©rifier maintenant ?

Parce que ton loss stable est louche, tu devrais v√©rifier :

‚úî 1. getTargetSegmentation(labels)

Est-ce que √ßa renvoie bien un tenseur [B,H,W] d'entiers (classes) ?

‚úî 2. Les labels contiennent plusieurs classes ?

Si tout est 0 ‚Üí CE ~1.07 est normal.

‚úî 3. Le learning rate

lr = 0.01 est assez agressif pour UNet.
Essaie 0.001 ou 0.0001.

‚úî 4. Visualiser quelques pr√©dictions

Pour v√©rifier que les masques pr√©vus ne sont pas tous pareils.