- Exploration et analyse préliminaire des données
- Découpage des données en train/test
- Prétraitement en les convertissant en tenseurs
- Augmentation des données
- Définition des hyperparamètres
- Conception du modèle de CNN
- Compilation
- Entraînement
- Validation croisée
- Évaluation
- Affinement du modèle
- Test final

## Importation des bibliotheques

In [23]:
import os
import re
import random
import shutil
from collections import defaultdict
from sklearn.model_selection import train_test_split
import tensorflow as tf
from keras import models, layers
import numpy as np
from sklearn.metrics import classification_report, confusion_matrix
import matplotlib.pyplot as plt
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.callbacks import EarlyStopping


## Affichage du nombre d'images par classes

In [3]:
# Chemin du dossier train_data
dossier_train_data = r"C:\Users\Christian\Desktop\UE Projet\Dataset\train_data"

# Dictionnaire pour stocker le nombre d'images par classe
nombre_images_par_classe = defaultdict(int)

# Parcourir tous les fichiers dans le dossier train_data
for file_name in os.listdir(dossier_train_data):
    # Utiliser une expression régulière pour extraire la partie avant le nombre
    match = re.match(r"^(.*?)(\d+)\.jpeg$", file_name)
    if match:
        class_name = match.group(1)
        nombre_images_par_classe[class_name] += 1

# Afficher les résultats
print("Nombre d'images par classe dans train_data :")
for classe, nombre in nombre_images_par_classe.items():
    print(f"{classe} : {nombre}")


Nombre d'images par classe dans train_data :
Actiniaria_ : 37
Actinoptilum_molle_ : 12
Actinoscyphia_plebeia_ : 12
Actinostola_capensis_ : 11
Aequorea_spp_ : 24
Africolaria_rutila_ : 10
Alcyonacea_ : 13
Amalda_bullioides_ : 25
Anthoptilum_grandiflorum_ : 22
Aphelodoris_sp__ : 12
Aphrodita_alta_ : 12
Aristeus_varidens_ : 28
Armina_sp__ : 16
Ascidiacea_ : 14
Astropecten_irregularis_pontoporeus_ : 43
Athleta_abyssicola_ : 31
Athleta_lutosa_ : 28
Bolocera_kerguelensis_ : 28
Brissopsis_lyrifera_capensis_ : 32
Bryozoa_ : 17
Cavernularia_spp_ : 19
Cephalodiscus_gilchristi_ : 10
Ceramaster_patagonicus_euryplax_ : 12
Charonia_lampas_ : 13
Cheilostomatida_ : 12
Cheiraster_hirsutus_ : 25
Chondraster_elattosis_ : 10
Chrysaora_fulgida_ : 23
Chrysaora_spp_ : 16
Comanthus_wahlbergii_ : 16
Comitas_saldanhae_ : 45
Comitas_stolida_ : 11
Cosmasterias_felipes_ : 30
Crossaster_penicillatus_ : 24
Cypraeovula_iutsui_ : 17
Diplopteraster_multipes_ : 14
Dipsacaster_sladeni_capensis_ : 16
Echinus_gilchristi_ : 

## Decoupage en train/test (80/20)

In [4]:
# Chemin du dossier train_data
dossier_train_data = r"C:\Users\Christian\Desktop\UE Projet\Dataset\train_data"
dossier_train = os.path.join(dossier_train_data, '..', 'train')
dossier_test = os.path.join(dossier_train_data, '..', 'test')


In [5]:
# Créer les dossiers train et test
os.makedirs(dossier_train, exist_ok=True)
os.makedirs(dossier_test, exist_ok=True)


In [6]:
# Dictionnaire pour stocker les fichiers par classe
fichiers_par_classe = {}

# Parcourir tous les fichiers dans le dossier train_data
for file_name in os.listdir(dossier_train_data):
    # Utiliser une expression régulière pour extraire la classe
    match = re.match(r"^(.*?)(\d+)\.jpeg$", file_name)
    if match:
        class_name = match.group(1)
        if class_name not in fichiers_par_classe:
            fichiers_par_classe[class_name] = []
        fichiers_par_classe[class_name].append(file_name)
        

In [7]:
fichiers_par_classe

{'Actiniaria_': ['Actiniaria_1.jpeg',
  'Actiniaria_10.jpeg',
  'Actiniaria_11.jpeg',
  'Actiniaria_12.jpeg',
  'Actiniaria_13.jpeg',
  'Actiniaria_14.jpeg',
  'Actiniaria_15.jpeg',
  'Actiniaria_16.jpeg',
  'Actiniaria_17.jpeg',
  'Actiniaria_18.jpeg',
  'Actiniaria_19.jpeg',
  'Actiniaria_2.jpeg',
  'Actiniaria_20.jpeg',
  'Actiniaria_21.jpeg',
  'Actiniaria_22.jpeg',
  'Actiniaria_23.jpeg',
  'Actiniaria_24.jpeg',
  'Actiniaria_25.jpeg',
  'Actiniaria_26.jpeg',
  'Actiniaria_27.jpeg',
  'Actiniaria_28.jpeg',
  'Actiniaria_29.jpeg',
  'Actiniaria_3.jpeg',
  'Actiniaria_30.jpeg',
  'Actiniaria_31.jpeg',
  'Actiniaria_32.jpeg',
  'Actiniaria_33.jpeg',
  'Actiniaria_34.jpeg',
  'Actiniaria_35.jpeg',
  'Actiniaria_36.jpeg',
  'Actiniaria_37.jpeg',
  'Actiniaria_4.jpeg',
  'Actiniaria_5.jpeg',
  'Actiniaria_6.jpeg',
  'Actiniaria_7.jpeg',
  'Actiniaria_8.jpeg',
  'Actiniaria_9.jpeg'],
 'Actinoptilum_molle_': ['Actinoptilum_molle_1.jpeg',
  'Actinoptilum_molle_10.jpeg',
  'Actinoptilum_mol

In [8]:
# Diviser les fichiers pour chaque classe
for class_name, fichiers in fichiers_par_classe.items():
    train_files, test_files = train_test_split(fichiers, test_size=0.2, random_state=42)
    
    # Copier les fichiers d'entraînement
    for file_name in train_files:
        src = os.path.join(dossier_train_data, file_name)
        dst = os.path.join(dossier_train, file_name)
        shutil.copy2(src, dst)
    
    # Copier les fichiers de test
    for file_name in test_files:
        src = os.path.join(dossier_train_data, file_name)
        dst = os.path.join(dossier_test, file_name)
        shutil.copy2(src, dst)

print("Les fichiers ont été divisés en ensembles d'entraînement et de test avec succès.")


Les fichiers ont été divisés en ensembles d'entraînement et de test avec succès.


In [9]:
# Chemin du dossier train_data
dossier_train_data = r"C:\Users\Christian\Desktop\UE Projet\Dataset\train"

# Organiser les images en sous-dossiers
for file_name in os.listdir(dossier_train_data):
    # Utiliser une expression régulière pour extraire la classe
    match = re.match(r"^(.*?)(\d+)\.jpeg$", file_name)
    if match:
        class_name = match.group(1)
        class_dir = os.path.join(dossier_train_data, class_name)
        
        # Créer le sous-dossier si nécessaire
        if not os.path.exists(class_dir):
            os.makedirs(class_dir)
        
        # Déplacer l'image dans le sous-dossier
        src_path = os.path.join(dossier_train_data, file_name)
        dst_path = os.path.join(class_dir, file_name)
        shutil.move(src_path, dst_path)

print("Images réorganisées en sous-dossiers par classe.")


Images réorganisées en sous-dossiers par classe.


In [10]:
# Chemin du dossier test_data
dossier_test_data = r"C:\Users\Christian\Desktop\UE Projet\Dataset\test"

# Organiser les images en sous-dossiers
for file_name in os.listdir(dossier_test_data):
    # Utiliser une expression régulière pour extraire la classe
    match = re.match(r"^(.*?)(\d+)\.jpeg$", file_name)
    if match:
        class_name = match.group(1)
        class_dir = os.path.join(dossier_test_data, class_name)
        
        # Créer le sous-dossier si nécessaire
        if not os.path.exists(class_dir):
            os.makedirs(class_dir)
        
        # Déplacer l'image dans le sous-dossier
        src_path = os.path.join(dossier_test_data, file_name)
        dst_path = os.path.join(class_dir, file_name)
        shutil.move(src_path, dst_path)

print("Images de test réorganisées en sous-dossiers par classe.")


Images de test réorganisées en sous-dossiers par classe.


## Creation d'un dataset a partir des données d'entrainement et de test pour le passage dans le modele et augmentation de la données

In [11]:
dossier_train = r"C:\Users\Christian\Desktop\UE Projet\Dataset\train"
dossier_test = r"C:\Users\Christian\Desktop\UE Projet\Dataset\test"

# Définir les paramètres
IMG_SIZE = (128, 128)
BATCH_SIZE = 32

# Créer un dataset à partir des fichiers d'entraînement
train_dataset = tf.keras.preprocessing.image_dataset_from_directory(
    directory=dossier_train,
    labels='inferred',
    label_mode='int',
    batch_size=BATCH_SIZE,
    image_size=IMG_SIZE,
    shuffle=True
)

# Créer un dataset à partir des fichiers de test
test_dataset = tf.keras.preprocessing.image_dataset_from_directory(
    directory=dossier_test,
    labels='inferred',
    label_mode='int',
    batch_size=BATCH_SIZE,
    image_size=IMG_SIZE,
    shuffle=False
)

# Normaliser les images
normalization_layer = tf.keras.layers.Rescaling(1./255)

# Appliquer la normalisation aux datasets
#train_dataset = train_dataset.map(lambda x, y: (normalization_layer(x), y))
test_dataset = test_dataset.map(lambda x, y: (normalization_layer(x), y))

# Afficher la structure des datasets
for images, labels in train_dataset.take(1):
    print(images.shape)  # Afficher la forme des tenseurs d'images
    print(labels.shape)  # Afficher la forme des tenseurs de labels


Found 2437 files belonging to 137 classes.
Found 674 files belonging to 137 classes.
(32, 128, 128, 3)
(32,)


In [12]:
# Chemin des dossiers train et test
dossier_train = r"C:\Users\Christian\Desktop\UE Projet\Dataset\train"
dossier_test = r"C:\Users\Christian\Desktop\UE Projet\Dataset\test"

# Définir les paramètres
IMG_SIZE = (128, 128)
BATCH_SIZE = 32

# Créer un générateur d'images avec augmentation pour l'entraînement
train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

# Appliquer le générateur aux données d'entraînement
train_generator = train_datagen.flow_from_directory(
    directory=dossier_train,
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='sparse'  # Utiliser 'sparse' pour les étiquettes entières
)

# Créer un générateur de données de validation sans augmentation, juste rescalage
test_datagen = ImageDataGenerator(rescale=1./255)
test_generator = test_datagen.flow_from_directory(
    directory=dossier_test,
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='sparse',
    shuffle=False
)

# Afficher la structure des datasets
for images, labels in train_generator:
    print(images.shape)  # Afficher la forme des tenseurs d'images
    print(labels.shape)  # Afficher la forme des tenseurs de labels
    break  # Pour éviter d'afficher toutes les images


Found 2437 images belonging to 137 classes.
Found 674 images belonging to 137 classes.
(32, 128, 128, 3)
(32,)


In [13]:
# Chemin du dossier train
dossier_train = r"C:\Users\Christian\Desktop\UE Projet\Dataset\train"

# Vérifier le contenu du répertoire
print("Contenu du répertoire 'train' :")
for file_name in os.listdir(dossier_train):
    print(file_name)


Contenu du répertoire 'train' :
Actiniaria_
Actinoptilum_molle_
Actinoscyphia_plebeia_
Actinostola_capensis_
Aequorea_spp_
Africolaria_rutila_
Alcyonacea_
Amalda_bullioides_
Anthoptilum_grandiflorum_
Aphelodoris_sp__
Aphrodita_alta_
Aristeus_varidens_
Armina_sp__
Ascidiacea_
Astropecten_irregularis_pontoporeus_
Athleta_abyssicola_
Athleta_lutosa_
Bolocera_kerguelensis_
Brissopsis_lyrifera_capensis_
Bryozoa_
Cavernularia_spp_
Cephalodiscus_gilchristi_
Ceramaster_patagonicus_euryplax_
Charonia_lampas_
Cheilostomatida_
Cheiraster_hirsutus_
Chondraster_elattosis_
Chrysaora_fulgida_
Chrysaora_spp_
Comanthus_wahlbergii_
Comitas_saldanhae_
Comitas_stolida_
Cosmasterias_felipes_
Crossaster_penicillatus_
Cypraeovula_iutsui_
Diplopteraster_multipes_
Dipsacaster_sladeni_capensis_
Echinus_gilchristi_
Eleutherobia_variable_
Euspira_napus_
Exodromidia_spinosa_
Exodromidia_spinosissima_
Flabellum_(Ulocyathus)_messum_
Funchalia_woodwardi_
Fusinus_africanae_
Fusinus_hayesi_
Fusitriton_magellanicus_
Fus

## Second model : definition, compilation et entrainement

In [14]:
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(128, 128, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(256, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
#model.add(layers.Conv2D(512, (3, 3), activation='relu'))
#model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
#model.add(layers.Dense(512, activation='relu'))
#model.add(layers.Dropout(0.5))
model.add(layers.Dense(256, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(137, activation='softmax'))


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [15]:
model.summary()


In [16]:
model.compile(optimizer = "adam",
              loss = "sparse_categorical_crossentropy",
              metrics = ["accuracy"])


In [17]:
# Définir un callback pour l'early stopping 
early_stopping = EarlyStopping(monitor='val_loss', patience=5)

# Entraîner le modèle avec data augmentation et early stopping
history = model.fit(
    train_generator,
    epochs=10,
    #validation_data=test_generator,
    callbacks=[early_stopping]
)


  self._warn_if_super_not_called()


Epoch 1/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m70s[0m 876ms/step - accuracy: 0.0163 - loss: 4.8968
Epoch 2/10


  current = self.get_monitor_value(logs)


[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m47s[0m 606ms/step - accuracy: 0.0280 - loss: 4.7939
Epoch 3/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m49s[0m 628ms/step - accuracy: 0.0332 - loss: 4.7692
Epoch 4/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m46s[0m 590ms/step - accuracy: 0.0390 - loss: 4.6957
Epoch 5/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 574ms/step - accuracy: 0.0359 - loss: 4.6644
Epoch 6/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m42s[0m 550ms/step - accuracy: 0.0570 - loss: 4.5129
Epoch 7/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m47s[0m 611ms/step - accuracy: 0.0728 - loss: 4.3680
Epoch 8/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m46s[0m 591ms/step - accuracy: 0.0548 - loss: 4.3254
Epoch 9/10
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m43s[0m 560ms/step - accuracy: 0.0729 - loss: 4.2165
Epoch 10/10
[1m77/77[0m [32m━━━━━━━━━━━━

In [18]:
# Récupérer les noms des classes
class_names = train_generator.class_indices
class_names = {v: k for k, v in class_names.items()}  # Inverser le dictionnaire pour obtenir les noms des classes

# Affichage des noms des classes 
print("Classes et indices correspondants :")
for idx, class_name in class_names.items():
    print(f"Indice {idx} : {class_name}")


Classes et indices correspondants :
Indice 0 : Actiniaria_
Indice 1 : Actinoptilum_molle_
Indice 2 : Actinoscyphia_plebeia_
Indice 3 : Actinostola_capensis_
Indice 4 : Aequorea_spp_
Indice 5 : Africolaria_rutila_
Indice 6 : Alcyonacea_
Indice 7 : Amalda_bullioides_
Indice 8 : Anthoptilum_grandiflorum_
Indice 9 : Aphelodoris_sp__
Indice 10 : Aphrodita_alta_
Indice 11 : Aristeus_varidens_
Indice 12 : Armina_sp__
Indice 13 : Ascidiacea_
Indice 14 : Astropecten_irregularis_pontoporeus_
Indice 15 : Athleta_abyssicola_
Indice 16 : Athleta_lutosa_
Indice 17 : Bolocera_kerguelensis_
Indice 18 : Brissopsis_lyrifera_capensis_
Indice 19 : Bryozoa_
Indice 20 : Cavernularia_spp_
Indice 21 : Cephalodiscus_gilchristi_
Indice 22 : Ceramaster_patagonicus_euryplax_
Indice 23 : Charonia_lampas_
Indice 24 : Cheilostomatida_
Indice 25 : Cheiraster_hirsutus_
Indice 26 : Chondraster_elattosis_
Indice 27 : Chrysaora_fulgida_
Indice 28 : Chrysaora_spp_
Indice 29 : Comanthus_wahlbergii_
Indice 30 : Comitas_sald

## Evaluation du premier modele

In [19]:
# Évaluer le modèle
test_loss, test_acc = model.evaluate(test_dataset)
print(f'Précision sur le dataset de test: {test_acc}')


[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 214ms/step - accuracy: 0.0691 - loss: 4.1187
Précision sur le dataset de test: 0.11721068620681763


In [25]:
"""# Normalisation des images
normalization_layer = tf.keras.layers.Rescaling(1./255)
train_dataset = train_dataset.map(lambda x, y: (normalization_layer(x), y))
test_dataset = test_dataset.map(lambda x, y: (normalization_layer(x), y))

# Évaluation et rapport de classification
y_pred = np.concatenate([model.predict(images) for images, _ in test_dataset])
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = np.concatenate([labels for _, labels in test_dataset])

# Générer le rapport de classification
print(classification_report(y_true, y_pred_classes, target_names=class_names))
"""

# Assure-toi que class_names est une liste de chaînes de caractères
class_names = [str(i) for i in range(137)]  # Remplace ceci par tes vrais noms de classes si disponibles

# Évaluation et rapport de classification
y_pred = np.concatenate([model.predict(images) for images, _ in test_dataset])
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = np.concatenate([labels for _, labels in test_dataset])

# Générer le rapport de classification
print(classification_report(y_true, y_pred_classes, target_names=class_names, zero_division=0))


TypeError: 'str' object cannot be interpreted as an integer

NameError: name 'test' is not defined

In [24]:
# Affichage des images bien classés.
for i, (true_class, pred_class) in enumerate(zip(y_true, y_pred_classes)):
    if true_class == pred_class:
        print(f'Image {i}: Vraie classe = {class_names[true_class]}, Prédite = {class_names[pred_class]}')


Image 493: Vraie classe = 105, Prédite = 105
Image 494: Vraie classe = 105, Prédite = 105
Image 495: Vraie classe = 105, Prédite = 105
Image 496: Vraie classe = 105, Prédite = 105
Image 497: Vraie classe = 105, Prédite = 105
Image 498: Vraie classe = 105, Prédite = 105
Image 499: Vraie classe = 105, Prédite = 105
Image 500: Vraie classe = 105, Prédite = 105
Image 501: Vraie classe = 105, Prédite = 105
Image 502: Vraie classe = 105, Prédite = 105
Image 503: Vraie classe = 105, Prédite = 105
Image 504: Vraie classe = 105, Prédite = 105
Image 505: Vraie classe = 105, Prédite = 105
Image 506: Vraie classe = 105, Prédite = 105
Image 507: Vraie classe = 105, Prédite = 105
Image 508: Vraie classe = 105, Prédite = 105
Image 509: Vraie classe = 105, Prédite = 105
Image 510: Vraie classe = 105, Prédite = 105
Image 511: Vraie classe = 105, Prédite = 105
Image 512: Vraie classe = 105, Prédite = 105


## Utilisation du modele EfficientNetB0

In [20]:
from tensorflow.keras.applications import EfficientNetB0

# Définir le nombre de classes
num_classes = 137

# Charger le modèle pré-entraîné EfficientNetB0
base_model = EfficientNetB0(weights='imagenet', include_top=False, input_shape=(128, 128, 3))

# Ajouter des couches personnalisées
x = base_model.output
x = tf.keras.layers.GlobalAveragePooling2D()(x)
x = tf.keras.layers.Dense(512, activation='relu')(x)
x = tf.keras.layers.Dropout(0.5)(x)  # Dropout pour éviter le surapprentissage
predictions = tf.keras.layers.Dense(num_classes, activation='softmax')(x)

# Créer le modèle final
model = tf.keras.models.Model(inputs=base_model.input, outputs=predictions)

# Compiler le modèle
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Entraîner le modèle avec early stopping
early_stopping = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=5)
history = model.fit(train_generator, epochs=10, callbacks=[early_stopping])


Epoch 1/10
[1m45/77[0m [32m━━━━━━━━━━━[0m[37m━━━━━━━━━[0m [1m1:19[0m 2s/step - accuracy: 0.0424 - loss: 4.8451

KeyboardInterrupt: 

# Evaluation de EfficientNetB0

In [None]:
test_loss, test_acc = model.evaluate(test_generator) 
print(f'Précision sur le dataset de test: {test_acc}')

## Utilisations d'un ViTf

In [39]:
import torch
import torch.nn as nn
import torchvision.transforms as transforms
import torchvision.datasets as datasets
from torch.utils.data import DataLoader
from timm import create_model

# Chemin du dataset
data_dir = r'C:\Users\Christian\Desktop\UE Projet\Dataset\train'

# Préparer les transformations et le DataLoader
transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

train_dataset = datasets.ImageFolder(root=data_dir, transform=transform)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)

# Charger le modèle ViT pré-entraîné depuis timm
model = create_model('vit_base_patch16_224', pretrained=True)
model.head = nn.Linear(model.head.in_features, 137)

# Définir l'optimiseur et la fonction de perte
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=1e-4)

avec affichage de la précision
for epoch in range(10):  # Nombre d'époques à ajuster selon besoin
    correct_train = 0
    total_train = 0
    for images, labels in train_loader:
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        _, predicted = torch.max(outputs.data, 1)
        total_train += labels.size(0)
        correct_train += (predicted == labels).sum().item()
    
    train_accuracy = 100 * correct_train / total_train
    print(f"Epoch [{epoch+1}/10], Loss: {loss.item():.4f}, Train Accuracy: {train_accuracy:.2f}%")


Epoch [1/10], Loss: 0.9425
Epoch [2/10], Loss: 0.0345
Epoch [3/10], Loss: 0.0059
Epoch [4/10], Loss: 0.3984
Epoch [5/10], Loss: 0.0097
Epoch [6/10], Loss: 0.0057
Epoch [7/10], Loss: 0.0036
Epoch [8/10], Loss: 0.0004
Epoch [9/10], Loss: 0.0007
Epoch [10/10], Loss: 0.0009


In [40]:
# Préparer les données de test
test_data_dir = r'C:\Users\Christian\Desktop\UE Projet\Dataset\test'  # Assure-toi que le chemin est correct
test_dataset = datasets.ImageFolder(root=test_data_dir, transform=transform)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

# Évaluation du modèle
model.eval()
correct_test = 0
total_test = 0
all_preds = []
all_labels = []

with torch.no_grad():
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total_test += labels.size(0)
        correct_test += (predicted == labels).sum().item()
        
        all_preds.append(predicted.cpu().numpy())
        all_labels.append(labels.cpu().numpy())

test_accuracy = 100 * correct_test / total_test
print(f'Test Accuracy: {test_accuracy:.2f}%')


Test Accuracy: 79.82%


In [41]:
# Générer le rapport de classification
from sklearn.metrics import classification_report
y_pred_classes = np.concatenate(all_preds)
y_true = np.concatenate(all_labels)
class_names = [str(i) for i in range(137)]  # Assure-toi que ce sont des chaînes de caractères
print(classification_report(y_true, y_pred_classes, target_names=class_names, zero_division=0))


              precision    recall  f1-score   support

           0       0.83      0.62      0.71         8
           1       0.75      1.00      0.86         3
           2       1.00      1.00      1.00         3
           3       0.67      0.67      0.67         3
           4       0.83      1.00      0.91         5
           5       0.00      0.00      0.00         2
           6       1.00      0.67      0.80         3
           7       0.83      1.00      0.91         5
           8       1.00      0.80      0.89         5
           9       1.00      1.00      1.00         3
          10       1.00      1.00      1.00         3
          11       0.75      1.00      0.86         6
          12       1.00      0.50      0.67         4
          13       1.00      0.33      0.50         3
          14       0.82      1.00      0.90         9
          15       1.00      1.00      1.00         7
          16       1.00      1.00      1.00         6
          17       0.80    

In [42]:
# Évaluation et rapport de classification
model.eval()
all_preds = []
all_labels = []
with torch.no_grad():
    for images, labels in train_loader:
        outputs = model(images)
        _, preds = torch.max(outputs, 1)
        all_preds.append(preds.cpu().numpy())
        all_labels.append(labels.cpu().numpy())

# Convertir les listes en arrays
y_pred_classes = np.concatenate(all_preds)
y_true = np.concatenate(all_labels)

# Générer le rapport de classification
from sklearn.metrics import classification_report
class_names = [str(i) for i in range(137)]  # Assure-toi que ce sont des chaînes de caractères
print(classification_report(y_true, y_pred_classes, target_names=class_names, zero_division=0))


KeyboardInterrupt: 

In [43]:
import matplotlib.pyplot as plt

# Calculer la matrice de confusion
conf_matrix = confusion_matrix(y_true, y_pred_classes)

# Afficher les erreurs de classification
for i, (true_class, pred_class) in enumerate(zip(y_true, y_pred_classes)):
    if true_class != pred_class:
        # Afficher les informations sur l'erreur
        print(f'Image {i}: Vraie classe = {class_names[true_class]}, Prédite = {class_names[pred_class]}')
        

Image 0: Vraie classe = 0, Prédite = 27
Image 1: Vraie classe = 0, Prédite = 124
Image 3: Vraie classe = 0, Prédite = 52
Image 16: Vraie classe = 3, Prédite = 0
Image 22: Vraie classe = 5, Prédite = 81
Image 23: Vraie classe = 5, Prédite = 81
Image 24: Vraie classe = 6, Prédite = 54
Image 32: Vraie classe = 8, Prédite = 86
Image 50: Vraie classe = 12, Prédite = 20
Image 52: Vraie classe = 12, Prédite = 82
Image 53: Vraie classe = 13, Prédite = 54
Image 54: Vraie classe = 13, Prédite = 64
Image 79: Vraie classe = 17, Prédite = 111
Image 80: Vraie classe = 17, Prédite = 81
Image 91: Vraie classe = 19, Prédite = 24
Image 92: Vraie classe = 19, Prédite = 24
Image 93: Vraie classe = 19, Prédite = 87
Image 94: Vraie classe = 19, Prédite = 24
Image 108: Vraie classe = 24, Prédite = 19
Image 135: Vraie classe = 30, Prédite = 46
Image 141: Vraie classe = 31, Prédite = 50
Image 144: Vraie classe = 32, Prédite = 1
Image 147: Vraie classe = 32, Prédite = 95
Image 157: Vraie classe = 35, Prédite = 

In [44]:
# Affichage des images bien classés.
for i, (true_class, pred_class) in enumerate(zip(y_true, y_pred_classes)):
    if true_class == pred_class:
        print(f'Image {i}: Vraie classe = {class_names[true_class]}, Prédite = {class_names[pred_class]}')


Image 2: Vraie classe = 0, Prédite = 0
Image 4: Vraie classe = 0, Prédite = 0
Image 5: Vraie classe = 0, Prédite = 0
Image 6: Vraie classe = 0, Prédite = 0
Image 7: Vraie classe = 0, Prédite = 0
Image 8: Vraie classe = 1, Prédite = 1
Image 9: Vraie classe = 1, Prédite = 1
Image 10: Vraie classe = 1, Prédite = 1
Image 11: Vraie classe = 2, Prédite = 2
Image 12: Vraie classe = 2, Prédite = 2
Image 13: Vraie classe = 2, Prédite = 2
Image 14: Vraie classe = 3, Prédite = 3
Image 15: Vraie classe = 3, Prédite = 3
Image 17: Vraie classe = 4, Prédite = 4
Image 18: Vraie classe = 4, Prédite = 4
Image 19: Vraie classe = 4, Prédite = 4
Image 20: Vraie classe = 4, Prédite = 4
Image 21: Vraie classe = 4, Prédite = 4
Image 25: Vraie classe = 6, Prédite = 6
Image 26: Vraie classe = 6, Prédite = 6
Image 27: Vraie classe = 7, Prédite = 7
Image 28: Vraie classe = 7, Prédite = 7
Image 29: Vraie classe = 7, Prédite = 7
Image 30: Vraie classe = 7, Prédite = 7
Image 31: Vraie classe = 7, Prédite = 7
Image 3

In [67]:
# Normalisation des images
normalization_layer = tf.keras.layers.Rescaling(1./255)
train_dataset = train_dataset.map(lambda x, y: (normalization_layer(x), y))
test_dataset = test_dataset.map(lambda x, y: (normalization_layer(x), y))

# Évaluation et rapport de classification
y_pred = np.concatenate([model.predict(images) for images, _ in test_dataset])
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = np.concatenate([labels for _, labels in test_dataset])

# Générer le rapport de classification
print(classification_report(y_true, y_pred_classes, target_names=class_names))


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 669ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 154ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 138ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 146ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 174ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 214ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 230ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 164ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 148ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 208ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 155ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 167ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 157ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m 

  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))


TypeError: object of type 'int' has no len()