# CNN pour la classification d'images

Ce notebook est conçu pour classifier les images de spectrogrammes de moteurs sains et défectueux à l'aide d'un réseau de neurones convolutifs (CNN). Le modèle s'appuiera sur un réseau pré-entraîné comme base pour l'apprentissage par transfert.

In [20]:
# Importer les bibliothèques nécessaires
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Dropout, Conv2D, MaxPooling2D
from tensorflow.keras.applications import VGG16
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import os
import numpy as np
from PIL import Image

# Définir le chemin de base
base_dir = "../../data/05_cnn_input"

# Fonction pour charger et empiler les 3 images (X, Y, Z) en un seul tableau
# Chaque image est redimensionnée à une taille uniforme (224x224)
def load_and_stack_images(image_paths):
    images = [np.array(Image.open(path).resize((224, 224))) for path in image_paths]
    return np.stack(images, axis=-1)  # Empiler les images le long de l'axe des canaux

print("Base dir =" + base_dir)


Base dir =../../data/05_cnn_input


In [22]:
# Diviser les données en trois groupes : entraînement, validation et test
from sklearn.model_selection import train_test_split
import shutil

# Chemins des dossiers d'entrée
input_balourd = os.path.join(base_dir, 'balourd')
print("input_balourd = " + input_balourd)
input_sain = os.path.join(base_dir, 'sain')
print("input_sain = " + input_sain)

# Afficher le contenu des dossiers d'entrée pour vérification
print("Contenu du dossier balourd :", os.listdir(input_balourd))
print("Contenu du dossier sain :", os.listdir(input_sain))



# Créer les dossiers pour les ensembles divisés
for group in ['train', 'val', 'test']:
    for category in ['balourd', 'sain']:
        os.makedirs(os.path.join(base_dir, group, category), exist_ok=True)

# Fonction pour diviser et copier les fichiers
# Mise à jour pour gérer les 3 images (X, Y, Z) par donnée

def split_and_copy(input_dir, output_dirs, split_ratios):
    files = os.listdir(input_dir)
    print(f"Fichiers dans {input_dir} : {files}")  # Vérification des fichiers d'entrée
    grouped_files = {}

    # Grouper les fichiers par préfixe (X, Y, Z)
    for file in files:
        prefix = file.rsplit('_', 1)[0]  # Supposer que les fichiers sont nommés comme "nom_X.ext"
        if prefix not in grouped_files:
            grouped_files[prefix] = []
        grouped_files[prefix].append(file)

    # Vérifier que chaque groupe a exactement 3 fichiers
    grouped_files = {k: v for k, v in grouped_files.items() if len(v) == 3}
    print(f"Groupes détectés dans {input_dir} : {grouped_files}")  # Vérification des groupes

    # Vérifier si des groupes valides existent
    if not grouped_files:
        raise ValueError(f"Aucun groupe valide trouvé dans {input_dir}. Vérifiez les fichiers.")

    # Diviser les groupes en ensembles d'entraînement, validation et test
    prefixes = list(grouped_files.keys())
    train_prefixes, temp_prefixes = train_test_split(prefixes, test_size=(1 - split_ratios[0]))
    val_prefixes, test_prefixes = train_test_split(temp_prefixes, test_size=(split_ratios[2] / (split_ratios[1] + split_ratios[2])))

    # Copier les fichiers dans les dossiers correspondants
    for prefixes, output_dir in zip([train_prefixes, val_prefixes, test_prefixes], output_dirs):
        print(f"Copie des fichiers vers {output_dir}")  # Vérification des chemins de destination
        for prefix in prefixes:
            for file in grouped_files[prefix]:
                shutil.copy(os.path.join(input_dir, file), output_dir)



# Diviser les fichiers pour chaque catégorie
split_and_copy(input_balourd, [
    os.path.join(base_dir, 'train', 'balourd'),
    os.path.join(base_dir, 'val', 'balourd'),
    os.path.join(base_dir, 'test', 'balourd')
], [0.7, 0.2, 0.1])

split_and_copy(input_sain, [
    os.path.join(base_dir, 'train', 'sain'),
    os.path.join(base_dir, 'val', 'sain'),
    os.path.join(base_dir, 'test', 'sain')
], [0.7, 0.2, 0.1])

input_balourd = ../../data/05_cnn_input/balourd
input_sain = ../../data/05_cnn_input/sain
Contenu du dossier balourd : ['spec_rgb_0551.png', 'spec_rgb_0552.png', 'spec_rgb_0553.png', 'spec_rgb_0554.png', 'spec_rgb_0555.png', 'spec_rgb_0556.png', 'spec_rgb_0557.png', 'spec_rgb_0558.png', 'spec_rgb_0559.png', 'spec_rgb_0560.png', 'spec_rgb_0561.png', 'spec_rgb_0562.png', 'spec_rgb_0563.png', 'spec_rgb_0564.png', 'spec_rgb_0565.png', 'spec_rgb_0566.png', 'spec_rgb_0567.png', 'spec_rgb_0568.png', 'spec_rgb_0569.png', 'spec_rgb_0570.png', 'spec_rgb_0571.png', 'spec_rgb_0572.png', 'spec_rgb_0573.png', 'spec_rgb_0574.png', 'spec_rgb_0575.png', 'spec_rgb_0576.png', 'spec_rgb_0577.png', 'spec_rgb_0578.png', 'spec_rgb_0579.png', 'spec_rgb_0580.png', 'spec_rgb_0581.png', 'spec_rgb_0582.png', 'spec_rgb_0583.png', 'spec_rgb_0584.png', 'spec_rgb_0585.png', 'spec_rgb_0586.png', 'spec_rgb_0587.png', 'spec_rgb_0588.png', 'spec_rgb_0589.png', 'spec_rgb_0590.png', 'spec_rgb_0591.png', 'spec_rgb_0592.png'

ValueError: Aucun groupe valide trouvé dans ../../data/05_cnn_input/balourd. Vérifiez les fichiers.

In [None]:
# Charger le modèle VGG16 pré-entraîné sans la couche supérieure
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# Geler les couches du modèle de base
for layer in base_model.layers:
    layer.trainable = False

# Construire le modèle CNN
model = Sequential([
    base_model,
    Flatten(),
    Dense(256, activation='relu'),
    Dropout(0.5),
    Dense(1, activation='sigmoid')
])

# Compiler le modèle
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Afficher le résumé du modèle
model.summary()

In [None]:
# Entraîner le modèle uniquement avec le train set
history = model.fit(
    train_data,
    epochs=10,
    validation_data=val_data
)

# Sauvegarder le modèle
model_dir = os.path.join(os.path.dirname(os.path.abspath(__file__)), '..', '..', 'model')
os.makedirs(model_dir, exist_ok=True)
model_path = os.path.join(model_dir, 'cnn_model.h5')
model.save(model_path)
print(f"Modèle sauvegardé à : {model_path}")

In [None]:
# Évaluer le modèle sur les données de test
eval_loss, eval_acc = model.evaluate(test_data)
print(f"Perte sur les données de test : {eval_loss}")
print(f"Précision sur les données de test : {eval_acc}")