Segmentation des radiographies de pneumonie pour extraction des poumons à partir du modèle UNET

In [3]:
# Import des modules nécessaires
import os
import matplotlib.pyplot as plt
from tqdm import tqdm
from glob import glob
import cv2
from keras.models import load_model
from keras import backend as keras

In [None]:
# Répertoire contenant le dossier "chest-xray-pneumonia"
INPUT_DIR = os.path.join("..", "input")
# Arborescence contenant les dossiers train, test et val
XRAY_DIR = os.path.join(INPUT_DIR, "chest-xray-pneumonia/chest_xray")
# Dossier contenant le modèle Unet pré-entraîné sur les datasets Montgomery County and Shenzhen Hospital :
# https://ceb.nlm.nih.gov/repositories/tuberculosis-chest-x-ray-image-data-sets/
SEGMENTATION_DIR = os.path.join(INPUT_DIR, "u-net-lung-segmentation-montgomery-shenzhen")
# Nom du fichier du mofèle pré-entrainé
SEGMENTATION_MODEL = os.path.join(SEGMENTATION_DIR, "unet_lung_seg.hdf5")
# Répertoire de sortie des images segmentées
SEGMENTATION_RESULT = "segmentation"
# Répertoires train, test et val ainsi que les sous-dossiers "NORMAL" et "PNEUMONIA" :
# Laisser ainsi pour lire les images du dataset et sauvegarder les images segmentées
# Créer l'arborescence "segmentation/train/NORMAL", "segmentation/train/PNEUMONIA", "segmentation/test/NORMAL"... au préalable
# Ou utiliser la cellule ci-dessous pour créer l'arborescence
TRAIN_DIR = "train"
TEST_DIR = "test"
VAL_DIR = "val"
NORMAL_DIR = "NORMAL"
PNEUMONIA_DIR = "PNEUMONIA"

In [5]:
help(keras.flatten)

Help on function flatten in module tensorflow.python.keras.backend:

flatten(x)
    Flatten a tensor.
    
    Arguments:
        x: A tensor or variable.
    
    Returns:
        A tensor, reshaped into 1-D
    
    Example:
    
        >>> b = tf.constant([[1, 2], [3, 4]])
        >>> b
        <tf.Tensor: shape=(2, 2), dtype=int32, numpy=
        array([[1, 2],
               [3, 4]], dtype=int32)>
        >>> tf.keras.backend.flatten(b)
        <tf.Tensor: shape=(4,), dtype=int32,
            numpy=array([1, 2, 3, 4], dtype=int32)>



In [None]:
# Création des répertoires segmentation
for i in [TRAIN_DIR, TEST_DIR, VAL_DIR]:
    dir_sup = SEGMENTATION_RESULT + '\\' + str(i) + '\\'
    if not exists(dir_sup):
        mkdir(dir_sup)
    for j in [NORMAL_DIR, PNEUMONIA_DIR]:
        dir_inf = dir_sup + '\\' + str(j) + '\\'
        if not exists(dir_inf):
            mkdir(dir_inf)

In [None]:
# Chargement du modèle

def dice_coef(y_true, y_pred):
    y_true_f = keras.flatten(y_true)
    y_pred_f = keras.flatten(y_pred)
    intersection = keras.sum(y_true_f * y_pred_f)
    return (2. * intersection + 1) / (keras.sum(y_true_f) + keras.sum(y_pred_f) + 1)

def dice_coef_loss(y_true, y_pred):
    return -dice_coef(y_true, y_pred)

segmentation_model = load_model(SEGMENTATION_MODEL, \
                                custom_objects={'dice_coef_loss': dice_coef_loss, \
                                                'dice_coef': dice_coef})

segmentation_model.summary()

In [None]:
# Fonctions utilitaires pour l'entraînement et la génération de l'image segmentée

def image_to_train(img):
    npy = img / 255
    npy = np.reshape(npy, npy.shape + (1,))
    npy = np.reshape(npy,(1,) + npy.shape)
    return npy

def train_to_image(npy):
    img = (npy[0,:, :, 0] * 255.).astype(np.uint8)
    return img

In [None]:
# Fonction de segmentation de l'image et de sauvegarde de l'image segmentée

def segment_image(pid, img, save_to):
    img = cv2.resize(img, (512, 512))
    segm_ret = segmentation_model.predict(image_to_train(img), \
                                          verbose=0)
    img = cv2.bitwise_and(img, img, mask=train_to_image(segm_ret))    
    cv2.imwrite(os.path.join(save_to, "%s.png" % pid), img)

In [None]:
# Génération des images segmentées (Attention, long et coûteux en ressources)

for i in [TRAIN_DIR, TEST_DIR, VAL_DIR]:
    for j in [NORMAL_DIR, PNEUMONIA_DIR]:
        for filename in tqdm(glob(os.path.join(XRAY_DIR, i, j, "*.jpeg"))):
            pid, fileext = os.path.splitext(os.path.basename(filename))
            im = cv2.imread(filename, cv2.IMREAD_GRAYSCALE)
            segment_image(pid, im, os.path.join(SEGMENTATION_RESULT, i, j))