# üñºÔ∏è 02 - Cr√©ation de masques

### Repr√©sentation des Images sous forme de Donn√©es

Une image, qu'elle soit en noir et blanc ou en couleur, peut √™tre interpr√©t√©e comme une **matrice de donn√©es**. Chaque pixel de l'image est repr√©sent√© par une valeur num√©rique, et l'image enti√®re peut √™tre vue comme une grille de ces pixels dispos√©s selon les dimensions **Largeur (Width) x Hauteur (Height)**.

#### 1. Image en Noir et Blanc
Dans une image en **noir et blanc**, chaque pixel est repr√©sent√© par une **valeur unique** qui indique son niveau de gris, variant de **0 √† 255**.  
- **0** repr√©sente le noir pur,  
- **255** repr√©sente le blanc pur,  
- Les valeurs interm√©diaires correspondent √† des nuances de gris.

L'image en noir et blanc devient ainsi une **matrice 2D**, o√π chaque pixel est assign√© √† une valeur de gris entre 0 et 255.  

**[[  0,  50, 100],  
 [150, 200, 255],  
 [128,  64,  32]]**

#### 2. Image en Couleur (Syst√®me RGB)
Les images en **couleur** sont encod√©es avec le syst√®me **RGB** (Rouge, Vert, Bleu). Chaque pixel de l'image est compos√© de trois valeurs :  
- Une pour le **Rouge (R)**,  
- Une pour le **Vert (G)**,  
- Une pour le **Bleu (B)**.

Chaque composante varie entre **0 et 255**, o√π **0** repr√©sente l'absence de couleur et **255** indique une intensit√© maximale.  
Cela donne une **matrice 3D** o√π chaque pixel est repr√©sent√© par un triplet de valeurs (**R, G, B**) et l'image enti√®re devient une matrice de forme **Largeur x Hauteur x 3**.

**[[[255,   0,   0], [  0, 255,   0], [  0,   0, 255]],  
 [[255, 255,   0], [  0, 255, 255], [255,   0, 255]],  
 [[128, 128, 128], [  0,   0,   0], [255, 255, 255]]]**

Il existe une exemple interactif ici qui permet de visualiser comment une image est encod√©e, et interpret√©e num√©riquement.
https://setosa.io/ev/image-kernels/

---

### Transition vers les Masques Binaires en Segmentation d'Images

Dans le cadre de la **segmentation d'images**, il est essentiel de cr√©er des **masques binaires** qui serviront de **v√©rit√© terrain** pour l'entra√Ænement du mod√®le. Ces masques sont similaires aux images classiques, mais avec une diff√©rence cl√© : ils sont con√ßus pour **identifier des r√©gions sp√©cifiques**, comme les **globules blancs** dans une image.

#### 1. Transformation des Images en Masques Binaires
Un **masque binaire** est une image o√π chaque pixel est soit un **1** (l'objet d'int√©r√™t, comme les globules blancs) soit un **0** (l'arri√®re-plan).  
- **0** repr√©sente l'arri√®re-plan,  
- **1** repr√©sente l'objet d'int√©r√™t.

Les masques binaires ne contiennent que deux valeurs, contrairement aux images classiques o√π chaque pixel contient des informations sur les intensit√©s lumineuses.

#### 2. Utilisation des Masques dans la Segmentation
En **deep learning**, ces **masques binaires** sont utilis√©s pour entra√Æner des mod√®les de **segmentation d'images** (comme des r√©seaux de neurones convolutifs - **CNN**). Le but est que le mod√®le apprenne √† pr√©dire des masques similaires √† partir de nouvelles images. Pendant l'entra√Ænement, le mod√®le utilise les masques comme r√©f√©rence pour ajuster ses pr√©dictions.  
Les masques servent de **guide** pour l'apprentissage supervis√©, et le mod√®le ajuste ses param√®tres afin de pr√©dire au mieux les r√©gions contenant l'objet d'int√©r√™t.

---

### Conclusion

En r√©sum√©, les images sont transform√©es en **matrices num√©riques** qui permettent de les traiter et les analyser. Dans le cadre de la segmentation d'images, ces repr√©sentations sont utilis√©es pour g√©n√©rer des **masques binaires**. Ces masques sont cruciaux pour entra√Æner des mod√®les de deep learning √† identifier et segmenter des objets d'int√©r√™t dans de nouvelles images. üîç‚ú®


In [1]:
import os
import shutil

import json
import numpy as np
from PIL import Image
import labelme

# Paths
annotation_path = ".\IMG"  # Chemin des fichiers d'annotations JSON
output_mask_path = ".\Masks"  # Dossier o√π les masques g√©n√©r√©s seront enregistr√©s

# Supprimer et recr√©er le dossier des masques
if os.path.isdir(output_mask_path):
    shutil.rmtree(output_mask_path)
os.makedirs(output_mask_path, exist_ok=True)

# Fonction pour traiter une annotation
def process_annotation_file(json_path):
    """
    Cette fonction prend en charge le traitement d'un fichier d'annotation JSON g√©n√©r√© par LabelMe.
    Elle effectue les √©tapes suivantes :
    
    1. Chargement du fichier JSON contenant les annotations.
    2. Extraction des dimensions de l'image (hauteur et largeur) depuis le JSON.
    3. R√©cup√©ration des annotations sous forme de formes (shapes).
    4. Cr√©ation d'un dictionnaire associant chaque label √† une valeur binaire (1 pour l'objet annot√©).
    5. Conversion des annotations en une matrice de labels (hauteur x largeur).
    6. Cr√©ation d'un masque binaire o√π les objets sont d√©finis par des pixels de valeur 1 (et le reste 0).
    7. Redimensionnement du masque √† une taille de 256x256 pixels.
    8. Ajout d'une dimension suppl√©mentaire pour obtenir un format de masque compatible avec les r√©seaux neuronaux.
    9. Transformation du masque binaire en une image en niveaux de gris (0 ou 255).
    10. Sauvegarde de l'image de masque dans le dossier sp√©cifi√©, avec le m√™me nom que le fichier JSON mais en format JPG.
    
    Si une erreur se produit √† n'importe quelle √©tape, elle sera captur√©e et un message d'erreur sera affich√© avec les d√©tails de l'erreur.
    
    Arguments:
    - json_path : str : Le chemin du fichier JSON √† traiter (chemin complet, y compris le nom du fichier).
    """

    try:
        # Charger le JSON annotation
        with open(json_path) as f:
            data = json.load(f)

        # Obtenir la hauteur et la largeur de l'image √† partir du JSON
        height = data["imageHeight"]
        width = data["imageWidth"]

        # Extraire les donn√©es des annotations de type polygone que nous avons cr√©√©es avec labelme
        shapes = data["shapes"]  # Liste de toutes les informations d'annotations (label, points, type de forme, etc.)
        
        # Cr√©er un dictionnaire pour associer les noms des labels aux valeurs (binaire : 1 pour l'objet)
        label_name_to_value = {shape['label']: 1 for shape in shapes}  # Nous avons qu'un seul label >> {'globule_blanc': 1}

        # Convertir les annotations de formes (shapes) en une matrice (numpy array) de labels de dimension (height, width),
        # o√π chaque pixel est assign√© √† un label bas√© sur `label_name_to_value` (par exemple, 1 pour "globule_blanc").
        lbl, _ = labelme.utils.shapes_to_label((height, width), shapes, label_name_to_value)

        # Cr√©er un masque binaire en transformant les valeurs √©gales √† 1 (globule_blanc) en 1,
        # et l'arri√®re-plan (valeurs √©gales √† 0) reste √† 0, car il se peut qu'il y ait plusieurs labels.
        # Puis convertit l'array en entiers sur 8 bits (np.uint8), adapt√© pour les images ou masques binaires.
        binary_mask = (lbl > 0).astype(np.uint8)

        # Redimensionner le masque √† (256, 256) si n√©cessaire
        resized_mask = np.array(Image.fromarray(binary_mask).resize((256, 256), Image.NEAREST))

        # Ajouter une dimension de canal pour garantir la forme (256, 256, 1),
        # n√©cessaire pour la compatibilit√© avec des r√©seaux neuronaux o√π TensorFlow s'attend √† une image avec un seul canal (grayscale).
        # Lorsque tu ajoutes une dimension √† une image en niveaux de gris (qui est une matrice 2D), tu ajoutes une liste suppl√©mentaire autour des valeurs de chaque pixel.
        final_mask = np.expand_dims(resized_mask, axis=-1)

        # Transformer le masque binaire en image en niveaux de gris (valeur encod√©e allant de 0 √† 255) avec un seul canal,
        # compatible avec les mod√®les de segmentation (comme TensorFlow).
        output_mask = Image.fromarray((final_mask[:, :, 0] * 255).astype(np.uint8), mode="L")

        # Sauvegarder le masque au format JPG dans le dossier sp√©cifi√© en reprenant le nom de l'image associ√©
        output_image_path = os.path.join(output_mask_path, os.path.basename(json_path).replace(".json", ".jpg"))
        output_mask.save(output_image_path)

        # Afficher la forme du masque pour v√©rification, et le chemin d'enregistrement des Masks
        print('------------------------------------')
        print(f"Fichier annotation trait√© pour : {os.path.basename(json_path)}: {final_mask.shape}")
        print(f"Masque enregistr√© pour {os.path.basename(json_path)} sous : {output_image_path}")

    except Exception as e:
        # Gestion des erreurs : afficher un message d'erreur si un probl√®me survient pendant le traitement
        print(f"Erreur lors du traitement de {os.path.basename(json_path)} : {e}")


# Liste des fichiers JSON √† traiter
json_files = [os.path.join(annotation_path, f) for f in os.listdir(annotation_path) if f.endswith(".json")]

# Traitement de chaque fichier JSON
for json_file in json_files:
    process_annotation_file(json_file)

# Message de fin du processus
print(f"Fin de la g√©n√©ration des Masques. Les masques ont √©t√© enregistr√©s sous : {output_mask_path}")


  annotation_path = ".\IMG"  # Chemin des fichiers d'annotations JSON
  output_mask_path = ".\Masks"  # Dossier o√π les masques g√©n√©r√©s seront enregistr√©s


------------------------------------
Fichier annotation trait√© pour : 20170728_201358.json: (256, 256, 1)
Masque enregistr√© pour 20170728_201358.json sous : .\Masks\20170728_201358.jpg
------------------------------------
Fichier annotation trait√© pour : 20170728_201531.json: (256, 256, 1)
Masque enregistr√© pour 20170728_201531.json sous : .\Masks\20170728_201531.jpg
------------------------------------
Fichier annotation trait√© pour : 20170728_201846.json: (256, 256, 1)
Masque enregistr√© pour 20170728_201846.json sous : .\Masks\20170728_201846.jpg
------------------------------------
Fichier annotation trait√© pour : 20170728_202317.json: (256, 256, 1)
Masque enregistr√© pour 20170728_202317.json sous : .\Masks\20170728_202317.jpg
------------------------------------
Fichier annotation trait√© pour : 20170728_202444.json: (256, 256, 1)
Masque enregistr√© pour 20170728_202444.json sous : .\Masks\20170728_202444.jpg
------------------------------------
Fichier annotation trait√© p