In [1]:
import numpy as np
import matplotlib.pyplot as plt
import cv2
import os
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.callbacks import ReduceLROnPlateau, EarlyStopping
from sklearn.model_selection import KFold
from sklearn.metrics import classification_report, confusion_matrix, roc_curve, auc
import seaborn as sns
import time

In [2]:
print("Vérification GPU...")
if tf.config.list_physical_devices('GPU'):
    print("GPU détecté.")
else:
    print("Aucun GPU détecté, l'entraînement se fera sur le CPU.")

Vérification GPU...
Aucun GPU détecté, l'entraînement se fera sur le CPU.


In [3]:
img_size = 128
batch_size = 32
epochs = 10
n_folds = 10
filter_numbers = [128, 256, 512, 1024]
data_dir1 = '../../../chest_xray/train/PNEUMONIA'
data_dir2 = '../../../chest_xray/train/NORMAL'

In [4]:
def load_data(data_dir1, data_dir2, limit=100):
    print("Chargement des données...")
    data = []
    labels = ['PNEUMONIA', 'NORMAL']
    for dir in [data_dir1, data_dir2]:
        path = os.path.join(dir)
        if not os.path.exists(path):
            print(f"Le répertoire {path} n'existe pas")
            continue
        label = os.path.basename(dir)
        class_num = labels.index(label)
        for i, img in enumerate(os.listdir(path)):
            if i >= limit:
                break
            try:
                img_arr = cv2.imread(os.path.join(path, img), cv2.IMREAD_GRAYSCALE)
                if img_arr is None:
                    print(f"Échec de la lecture de {img}. Passage au suivant.")
                    continue
                resized_arr = cv2.resize(img_arr, (img_size, img_size))
                data.append([resized_arr, class_num])
            except Exception as e:
                print(e)
    print("Chargement des données terminé.")
    return np.array(data, dtype=object)

train_data = load_data(data_dir1, data_dir2, limit=100)

Chargement des données...
Chargement des données terminé.


In [9]:
# Prétraitement des images
def preprocess_image(image):
    if len(image.shape) == 2:
        image = np.expand_dims(image, axis=-1)
    image = tf.image.resize(image, [img_size, img_size])
    image = image / 255.0  # Normalisation
    return image

# Prétraitement des données
def preprocess_data(data):
    print("Prétraitement des données...")
    processed_data = []
    for idx, (img, label) in enumerate(data):
        print(f"Traitement de l'image {idx+1}/{len(data)}")
        img = preprocess_image(img)
        processed_data.append([img, label])
    return np.array(processed_data, dtype=object)

train_data = preprocess_data(train_data)

Prétraitement des données...
Traitement de l'image 1/200
Traitement de l'image 2/200
Traitement de l'image 3/200
Traitement de l'image 4/200
Traitement de l'image 5/200
Traitement de l'image 6/200
Traitement de l'image 7/200
Traitement de l'image 8/200
Traitement de l'image 9/200
Traitement de l'image 10/200
Traitement de l'image 11/200
Traitement de l'image 12/200
Traitement de l'image 13/200
Traitement de l'image 14/200
Traitement de l'image 15/200
Traitement de l'image 16/200
Traitement de l'image 17/200
Traitement de l'image 18/200
Traitement de l'image 19/200
Traitement de l'image 20/200
Traitement de l'image 21/200
Traitement de l'image 22/200
Traitement de l'image 23/200
Traitement de l'image 24/200
Traitement de l'image 25/200
Traitement de l'image 26/200
Traitement de l'image 27/200
Traitement de l'image 28/200
Traitement de l'image 29/200
Traitement de l'image 30/200
Traitement de l'image 31/200
Traitement de l'image 32/200
Traitement de l'image 33/200
Traitement de l'image 3

In [11]:
def separate_features_labels(data):
    images = np.array([item[0] for item in data])
    labels = np.array([item[1] for item in data])
    return images, labels

x_train, y_train = separate_features_labels(train_data)
x_train = x_train.reshape(-1, img_size, img_size, 1)
x_train = np.concatenate([x_train, x_train, x_train], axis=-1) 

In [None]:
def create_model(n_filters):
    print(f"Définition du modèle avec {n_filters} filtres...")
    model = Sequential([
        Conv2D(n_filters, (3, 3), activation='relu', input_shape=(img_size, img_size, 3)),
        MaxPooling2D((2, 2)),
        Conv2D(n_filters*2, (3, 3), activation='relu'),
        MaxPooling2D((2, 2)),
        Conv2D(n_filters*4, (3, 3), activation='relu'),
        MaxPooling2D((2, 2)),
        Conv2D(n_filters*8, (3, 3), activation='relu'),
        MaxPooling2D((2, 2)),
        Flatten(),
        Dense(512, activation='relu'),
        Dropout(0.5),
        Dense(1, activation='sigmoid')
    ])
    print("Modèle défini.")
    model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), 
                  loss='binary_crossentropy', 
                  metrics=['accuracy'])
    print("Modèle compilé")
    return model

# Validation croisée K-Fold
for n_filters in filter_numbers:
    print(f"Évaluation avec {n_filters} filtres")
    kf = KFold(n_splits=n_folds, shuffle=True, random_state=42)
    fold = 1
    fold_accuracies = []
    training_times = []

    for train_index, val_index in kf.split(x_train):
        x_train_fold, x_val_fold = x_train[train_index], x_train[val_index]
        y_train_fold, y_val_fold = y_train[train_index], y_train[val_index]

        print(f"Traitement du pli {fold}/{n_folds}")
        datagen = ImageDataGenerator(zoom_range=0.1, shear_range=0.1)
        datagen.fit(x_train_fold)
        
        model = create_model(n_filters)
        
        reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=3, min_lr=0.0001)
        early_stop = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)
        
        start_time = time.time()
        history = model.fit(datagen.flow(x_train_fold, y_train_fold, batch_size=batch_size),
                            epochs=epochs,
                            validation_data=(x_val_fold, y_val_fold),
                            callbacks=[reduce_lr, early_stop])
        end_time = time.time()
        
        training_time = end_time - start_time
        training_times.append(training_time)
        
        # Évaluation du pli
        scores = model.evaluate(x_val_fold, y_val_fold, verbose=0)
        print(f"Précision de validation pour le pli {fold}: {scores[1]*100:.2f}%")
        fold_accuracies.append(scores[1])

Évaluation avec 128 filtres
Traitement du pli 1/10
Définition du modèle avec 128 filtres...


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Modèle défini.
Modèle compilé
Epoch 1/10


  self._warn_if_super_not_called()


[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m46s[0m 6s/step - accuracy: 0.4446 - loss: 0.8337 - val_accuracy: 0.5000 - val_loss: 0.6919 - learning_rate: 0.0010
Epoch 2/10
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m32s[0m 5s/step - accuracy: 0.4958 - loss: 0.6963 - val_accuracy: 0.5000 - val_loss: 0.6899 - learning_rate: 0.0010
Epoch 3/10
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m33s[0m 5s/step - accuracy: 0.4423 - loss: 0.6940 - val_accuracy: 0.5000 - val_loss: 0.6868 - learning_rate: 0.0010
Epoch 4/10
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m36s[0m 6s/step - accuracy: 0.5281 - loss: 0.6884 - val_accuracy: 0.5000 - val_loss: 0.6816 - learning_rate: 0.0010
Epoch 5/10
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m34s[0m 5s/step - accuracy: 0.6357 - loss: 0.6737 - val_accuracy: 0.5000 - val_loss: 0.6558 - learning_rate: 0.0010
Epoch 6/10
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m34s[0m 5s/step - accuracy: 0.5964 

In [None]:
def plot_learning_curves(history):
        plt.figure(figsize=(12, 6))
        plt.subplot(1, 2, 1)
        plt.plot(history.history['loss'], label='Perte d\'entraînement')
        plt.plot(history.history['val_loss'], label='Perte de validation')
        plt.xlabel('Époques')
        plt.ylabel('Perte')
        plt.legend()

        plt.subplot(1, 2, 2)
        plt.plot(history.history['accuracy'], label='Précision d\'entraînement')
        plt.plot(history.history['val_accuracy'], label='Précision de validation')
        plt.xlabel('Époques')
        plt.ylabel('Précision')
        plt.legend()

        plt.tight_layout()
        plt.show()

plot_learning_curves(history)