# TP1 : Urgence au bloc opératoire !

L'un des domaines d'applications majeurs du traitement d'images est l'imagerie médicale. A partir de scans du corps humain sous diverses formes, le traitement d'images aide à extraire des informations utiles pour poser un diagnostic. Et c'est ce qu'on va faire aujourd'hui !

Le sujet du jour porte sur l'embolie pulmonaire. Pour cela, nous avons à disposition des scans de poumons, et votre objectif sera de déterminer le rapport entre la surface des vaisseaux et celle des poumons. Si celui-ci est trop élevé, on pourra considérer que le patient a une embolie pulmonaire.

*Note : Je ne suis pas un expert dans le médical, ni même quelqu'un de compétent. Ce TP est un cas exemple. En aucun cas on ne peut réellement déterminer de la pathologie à partir de ce calcul...*

---
## 1) Un peu d'explications du processus de scan du jour

### La tomographie assitée par ordinateur

La tomographie assistée par ordinateur (Computed Tomography en anglais) utilise des faisceaux de rayons X pour obtenir des intensités de pixels en 3D du corps humain. Une cathode chauffée libère des faisceaux à haute énergie (électrons), qui à leur tour libèrent leur énergie sous forme de rayons X. Les rayons X traversent les tissus du corps humain et atteignent un détecteur de l'autre côté. Les tissus denses (par exemple les os) absorbent plus de rayons que les tissus mous (par exemple la graisse). Lorsque les rayons X ne sont pas absorbés par le corps (c'est-à-dire dans la région de l'air à l'intérieur des poumons) et qu'ils atteignent le détecteur, ils apparaissent en noir, comme un film noir. À l'inverse, les tissus denses sont représentés en blanc.

L'imagerie par tomographie est ainsi capable de distinguer les différences de densité et de créer une image en 3D du corps.

![ct-image-example.jpg](attachment:cb264ada-a8fd-40cf-8d21-1a8556920b17.jpg)

---
### Intensité des rayons X et unités Hounsfield
L'absorption des rayons X est mesurée selon l'échelle de Hounsfield. Dans cette échelle, l'intensité de l'air est fixée à -1000 et celle de l'eau à 0. Il est essentiel de comprendre que l'échelle de Hounsfield est une échelle absolue, contrairement à l'IRM où nous avons une échelle relative de 0 à 255.

L'image illustre certains des tissus de base et leurs valeurs d'intensité correspondantes. N'oubliez pas que les images sont bruitées. Les chiffres peuvent varier légèrement dans les images réelles.

![image.png](attachment:83971bd5-b4d2-4cec-9119-cb087b288014.png)

Les os ont une intensité élevée. Nous découpons généralement l'image de manière à ce qu'elle ait une valeur maximale supérieure. Par exemple, la valeur maximale peut être de 1000, pour des raisons pratiques.

Le problème : les bibliothèques de visualisation travaillent sur l'échelle [0,255]. Il ne serait pas très judicieux de visualiser toute l'échelle de Hounsfield (de -1000 à 1000+ ) à 256 échelles pour le diagnostic médical.

Au lieu de cela, nous limitons notre attention à différentes parties de cette échelle et nous nous concentrons sur les tissus sous-jacents.

---
### Visualisation des données de tomographie

La convention d'image médicale pour découper la gamme Housenfield consiste à choisir une intensité centrale, appelée niveau (level), et une fenêtre (window), comme illustré :

![image.png](attachment:e991c816-aa6a-4245-bed3-a2cf643150c6.png)

A partir du niveau et de la fenêtre, on définit ainsi une range min/max de valeurs de la manière suivante : 

$min = level - \frac{window}{2}$

$max = level + \frac{window}{2}$

En fonction des niveaux et fenêtres, on obtient à partir du même scan des images totalement différentes. Voici un tableau avec plusieurs ranges de visualisation en fonction des zones que l'on souhaite observer : 

| Region  | Fenêtre | Niveau |
|:--------|:--------|:-------|
| Cerveau | 80      | 40     |
| Poumons | 1500    | -600   |
| Foie    | 150     | 30     |
| Tissus  | 250     | 50     |
| Os      | 1800    | 40     |

---
## 2) Allez, c'est parti, on code

A vos claviers ! On commence tranquillement avec de la visualisation des données.

### Visualisation des données

Vu que les images sont dans un format assez particulier, le code suivant permettra de charger les données pour les avoir sous format "image".

In [None]:
import os
import numpy as np
import matplotlib.pyplot as plt
import nibabel as nib
import cv2

path = './Images/slice017.nii.gz'

ct_scan = nib.load(path)
ct_img = np.flip(ct_scan.get_fdata(),axis=1).T

**1)** Quelles sont les dimensions de l'image ? Quelle est la range de valeurs de l'image ? Quel est le type de données de l'image ?

In [None]:
# A compléter
# Informations de l'image
...

**_Réponse_ :**

**2)** Affichez l'image en niveaux de gris. Quelle est la range affichée ?

In [None]:
# A compléter
# Affichage de l'image
...

**_Réponse_ :**

**3)** Codez une fonction qui permettra de normaliser le scan selon une range définie via une fenêtre et un niveau. L'image retournée sera de type uint8 (valeurs entières entre 0 et 255). Testez ensuite votre fonction pour la visualisation des poumons (niveau = 200, fenêtre = 2000) et des tissus (niveau = 50, fenêtre = 350) et affichez le résultat. Que constatez vous ?

In [None]:
# A compléter
# Fonction de normalisation
...

# Affichage de l'image normalisée dans la range de visualisation du poumon
...

# Affichage de l'image normalisée dans la range de visualisation des tissus
...

**_Réponse :_**

---
### Segmentation du poumon

On attaque la grosse partie du TP : la segmentation du poumon. Pas de soucis, on va faire ça étape par étape.

**1)** Développez une fonction de binariastion de l'image de scan pour distinguer les poumons du reste. Pour cela, vous utiliserez l'image dans la range de visualisation [-1000,-300]. A vous de déterminer la fenêtre, le niveau et le seuil de binarisation.

In [None]:
# A compléter
# Binarisation de l'image
...

# Affichage de l'image binarisée
...

**2)** Avec votre image binarisée, codez une fonction de détection de contours (ou utilisez en une qui existe dans une certaine librairie connue...). Affichez ensuite l'image avec les contours dessinés. Combien de contours avez-vous trouvé ?

In [None]:
# A compléter
# Détections de contours
...

# Affichage de l'image normalisée avec les contours détectés
...

**3)** Normalement, si tout est ok, vous devriez avoir beaucoup trop de contours (environ une centaine !). Il va falloir maintenant filtrer les contours, selon des conditions que vous allez définir. Développez donc une fonction de filtrage de ces contours pour ne gardez que les contours concernant les poumons (2, parfois 3 contours). Affichez les contours filtrés sur le scan.

*Note : pour vous aider, n'hésitez pas à aller voir les propriétés qu'ont les contours (pour OpenCV : https://docs.opencv.org/3.4/d1/d32/tutorial_py_contour_properties.html). Avec 2 conditions bien définies, vous devriez réussir pour toutes les images.*

In [None]:
# A compléter
# Filtrage des contours
...

# Affichage de l'image normalisée avec les contours filtrés
...

**4)** Créez maintenant un masque binaire à partir des contours filtrés (une image noire avec les contours remplis en blanc). Vous pourrez également enregistrer l'image et comparer le masque par rapport à l'image originale. La segmentation vous paraît-elle bonne ?

In [None]:
# A compléter
# Création du masque binaire des poumons
...

# Affichage du masque
...

**_Réponse :_** 

**5)** Calculez l'aire des poumons (en pixels). Vous pourrez le faire à partir des contours, ou à partir du masque binaire précédemment créé.

In [None]:
# A compléter
# Calcul de l'aire des poumons (en pixels)
...

**6)** Bon, c'est bien beau une aire en pixel, mais dans le domaine métrique, c'est bien mieux ! Ici, les informations des dimensions des pixels se trouvent dans le header du scan original. Voici une fonction qui permet de récupérer les informations qu'on cherche.

In [None]:
def find_pix_dim(ct_img):
    """
    Get the pixdim of the CT image.
    A general solution that get the pixdim indicated from the image
    dimensions. From the last 2 image dimensions we get their pixel dimension.
    Args:
        ct_img: nib image

    Returns: List of the 2 pixel dimensions
    """
    pix_dim = ct_img.header["pixdim"]
    dim = ct_img.header["dim"]
    max_indx = np.argmax(dim)
    pixdimX = pix_dim[max_indx]
    dim = np.delete(dim, max_indx)
    pix_dim = np.delete(pix_dim, max_indx)
    max_indy = np.argmax(dim)
    pixdimY = pix_dim[max_indy]
    return [pixdimX, pixdimY]

print("Dimension d'un pixel du scan : {}".format(", ".join(["{} mm".format(i) for i in find_pix_dim(ct_scan)])))

Calculez maintenant l'aire des poumons en mm². La mesure vous paraît-elle cohérente ?

In [None]:
# A compléter
# Calcul de l'aire des poumons (en mm²)
...

**_Réponse :_**

---

### Segmentation des veines

C'est bon pour les poumons. Mais il nous faut détecter, segmenter et calculer l'aire des veines maintenant ! Ca va être plus compliqué que pour les poumons car elles sont plus difficiles à identifier. Mais si on part du fait qu'on souhaite uniquement segmenter les veines **l'intérieur des poumons**, ça sera en vérité beaucoup plus simple !

**1)** On va considérer qu'un pixel appartient à une veine d'un poumon si :
- il a une valeur supérieure à -500 HU dans le scan original
- il est situé à l'intérieur des poumons (masque binaire créé précedemment)

Développez une fonction pour créer le masque binaire des veines à partir du scan original et du masque des poumons créé précedemment). Que remarquez-vous ?

In [None]:
# A compléter
# Création du masques binaire des vaisseaux
...

# Affichage du masque
...

**_Réponse :_**

**2)** Normalement, vous devriez constater un léger soucis (il n'y a pas que les veines dans votre masque...). Quelle correction pouvez-vous apporter à votre fonction précédente pour ne garder que les veines ?

*Indice : je vous conseille de modifier légèrement le masque des poumons*

**_Réponse :_**

Modifiez votre fonction précédente pour intégrer votre correction. Est-ce que vous avez réussi à ne garder que les veines ?

In [None]:
# A compléter
# Création du masques binaire des vaisseaux (sans les contours des poumons)
...

# Affichage du masque
...

**_Réponse :_**

**3)** Les veines détectées, calculez maintenant l'aire totale des veines en mm²

In [None]:
# A compléter
# Calcul de l'aire des veines (en mm²)
...

**4)** A partir des aires des veines et des poumons, calculez le rapport entre la surface des vaisseaux et celle des poumons

In [None]:
# A compléter
# Calcul du rapport entre la surface des vaisseaux et celle des poumons
...

---

### On regroupe tout !

Vous avez tout développez pour le calcul du rapport entre la surface des vaisseaux et celle des poumons. 

**1)** Pour finir, regroupez tout ce que vous avez développer dans une seule fonction qui calculera le rapport avec en paramètre un seul scan. Vous enregistrez quelque part sur le PC les masques binaires des poumons et vaisseaux créés.

**Important : Commentez votre code svp !!**

In [None]:
# A compléter
# Fonction complète de calcul du rapport entre la surfarface des vaisseaux sur celle des poumons
...

**2)** Appliquez votre fonction sur toutes les slices, et récupérez tous les rapports calculés. 

In [None]:
# A compléter
# Application de la fonction sur toutes les slices (datas)
...

**3)** On va considérer ici qu'il y a une suspicion d'embolie pulmonaire dès qu'on trouve un rapport entre la surface des veines et celle des poumons supérieure ou égale à 5%. Pour quel(s) patient(s) demanderiez-vous des examens supplémentaires ?

In [None]:
# A compléter
# Identification des patients suspects
...

**_Réponse :_**

**4)** Votre diagnostic est-il selon-vous correct ?

*Note : Regardez les résultats de segmentation des poumons et veines pour chaque slice pour guider votre réponse* 

**_Réponse :_**