# **Elaboration d'un modèle personnel**

## **Import des packages**

In [1]:
!pip install scikeras
!pip install scikit-learn
!pip install tensorflow

Collecting scikeras
  Downloading scikeras-0.13.0-py3-none-any.whl (26 kB)
Collecting keras>=3.2.0 (from scikeras)
  Downloading keras-3.4.1-py3-none-any.whl (1.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.1/1.1 MB[0m [31m16.3 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting scikit-learn>=1.4.2 (from scikeras)
  Downloading scikit_learn-1.5.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (13.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.4/13.4 MB[0m [31m27.9 MB/s[0m eta [36m0:00:00[0m
Collecting namex (from keras>=3.2.0->scikeras)
  Downloading namex-0.0.8-py3-none-any.whl (5.8 kB)
Collecting optree (from keras>=3.2.0->scikeras)
  Downloading optree-0.12.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (347 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m347.7/347.7 kB[0m [31m8.5 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: namex, optree, scikit-learn, keras, sciker

In [13]:
import os
import shutil
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
from scikeras.wrappers import KerasClassifier
from tensorflow.keras.models import Sequential
from tensorflow.keras.optimizers import Adam, SGD
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay
from sklearn.model_selection import train_test_split, GridSearchCV, ParameterGrid
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

## **Téléchargement des données**

In [3]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [4]:
# Chemin vers le dossier contenant toutes les images
images_folder = '/content/drive/MyDrive/transformed_images'

# Chemins vers les dossiers de sortie sans augmentation
train_dir_no_aug = '/content/drive/MyDrive/train_no_aug'
val_dir_no_aug = '/content/drive/MyDrive/validation_no_aug'
test_dir_no_aug = '/content/drive/MyDrive/test_no_aug'

# Chemins vers les dossiers de sortie avec augmentation
train_dir_aug = '/content/drive/MyDrive/train_aug'
val_dir_aug = '/content/drive/MyDrive/validation_aug'
test_dir_aug = '/content/drive/MyDrive/test_aug'

# Créer les dossiers de sortie s'ils n'existent pas
for directory in [train_dir_no_aug, val_dir_no_aug, test_dir_no_aug, train_dir_aug, val_dir_aug, test_dir_aug]:
    os.makedirs(directory, exist_ok=True)

## **Selection des races pour l'entrainement**

In [5]:
selected_classes = ['n02106662-German_shepherd', 'n02093428-American_Staffordshire_terrier', 'n02116738-African_hunting_dog']

## **Séparation des données pour l'entrainement, la validation et le test**

In [6]:
def split_data(class_name, files, train_dir, val_dir, test_dir, train_ratio=0.7, val_ratio=0.2, test_ratio=0.1):
    np.random.shuffle(files)
    train_split = int(train_ratio * len(files))
    val_split = int((train_ratio + val_ratio) * len(files))

    train_files = files[:train_split]
    val_files = files[train_split:val_split]
    test_files = files[val_split:]

    for f in train_files:
        shutil.copy(f, os.path.join(train_dir, class_name, os.path.basename(f)))
    for f in val_files:
        shutil.copy(f, os.path.join(val_dir, class_name, os.path.basename(f)))
    for f in test_files:
        shutil.copy(f, os.path.join(test_dir, class_name, os.path.basename(f)))

for class_name in selected_classes:
    class_folder = os.path.join(images_folder, class_name)
    if os.path.isdir(class_folder):
        for directory in [train_dir_no_aug, val_dir_no_aug, test_dir_no_aug, train_dir_aug, val_dir_aug, test_dir_aug]:
            os.makedirs(os.path.join(directory, class_name), exist_ok=True)

        files = [os.path.join(class_folder, f) for f in os.listdir(class_folder) if os.path.isfile(os.path.join(class_folder, f))]
        split_data(class_name, files, train_dir_no_aug, val_dir_no_aug, test_dir_no_aug)
        split_data(class_name, files, train_dir_aug, val_dir_aug, test_dir_aug)

In [None]:
for class_name in selected_classes:
    class_folder = os.path.join(images_folder, class_name)
    if os.path.isdir(class_folder):
        os.makedirs(os.path.join(train_dir, class_name), exist_ok=True)
        os.makedirs(os.path.join(val_dir, class_name), exist_ok=True)
        os.makedirs(os.path.join(test_dir, class_name), exist_ok=True)

        files = [os.path.join(class_folder, f) for f in os.listdir(class_folder) if os.path.isfile(os.path.join(class_folder, f))]
        split_data(class_name, files, train_dir, val_dir, test_dir)

## **Normalisation et Data augmentation**

In [7]:
# Data Augmentation pour l'entraînement
train_datagen_aug = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

# Normalisation pour validation et test
val_test_datagen = ImageDataGenerator(rescale=1./255)

# Générateurs de données pour les données avec augmentation
train_generator_aug = train_datagen_aug.flow_from_directory(
    train_dir_aug,
    target_size=(128, 128),
    batch_size=32,
    class_mode='categorical'
)

val_generator_aug = val_test_datagen.flow_from_directory(
    val_dir_aug,
    target_size=(128, 128),
    batch_size=32,
    class_mode='categorical'
)

test_generator_aug = val_test_datagen.flow_from_directory(
    test_dir_aug,
    target_size=(128, 128),
    batch_size=32,
    class_mode='categorical',
    shuffle=False
)

# Générateurs de données pour les données sans augmentation
train_datagen_no_aug = ImageDataGenerator(
    rescale=1./255
)

train_generator_no_aug = train_datagen_no_aug.flow_from_directory(
    train_dir_no_aug,
    target_size=(128, 128),
    batch_size=32,
    class_mode='categorical'
)

val_generator_no_aug = val_test_datagen.flow_from_directory(
    val_dir_no_aug,
    target_size=(128, 128),
    batch_size=32,
    class_mode='categorical'
)

test_generator_no_aug = val_test_datagen.flow_from_directory(
    test_dir_no_aug,
    target_size=(128, 128),
    batch_size=32,
    class_mode='categorical',
    shuffle=False
)

Found 1467 images belonging to 3 classes.
Found 420 images belonging to 3 classes.
Found 213 images belonging to 3 classes.
Found 1467 images belonging to 3 classes.
Found 420 images belonging to 3 classes.
Found 213 images belonging to 3 classes.


## **Modélisation sans Data augmentation**

### **Recherche des meilleurs hyperparamètres**

In [8]:
def create_model(optimizer='adam', init_mode='uniform', dropout_rate=0.0):
    model = Sequential([
        Conv2D(32, (3, 3), activation='relu', input_shape=(128, 128, 3)),
        MaxPooling2D(pool_size=(2, 2)),
        Conv2D(64, (3, 3), activation='relu'),
        MaxPooling2D(pool_size=(2, 2)),
        Conv2D(128, (3, 3), activation='relu'),
        MaxPooling2D(pool_size=(2, 2)),
        Flatten(),
        Dense(128, activation='relu', kernel_initializer=init_mode),
        Dropout(dropout_rate),
        Dense(3, activation='softmax')
    ])
    model.compile(optimizer=optimizer,
                  loss='categorical_crossentropy',
                  metrics=['accuracy'])
    return model

# Définir les hyperparamètres à tester
param_grid = {
    'batch_size': [10, 20, 40],
    'epochs': [10, 20],
    'optimizer': ['adam', 'sgd'],
    'init_mode': ['uniform', 'he_normal'],
    'dropout_rate': [0.0, 0.5]
}

# Convertir le param_grid en liste de dictionnaires
param_list = list(ParameterGrid(param_grid))

# Initialiser les meilleures performances et paramètres
best_accuracy = 0
best_params = None

# Boucle pour rechercher les meilleurs hyperparamètres
for params in param_list:
    print(f"Entraînement avec les paramètres : {params}")

    # Créer le modèle avec les hyperparamètres actuels
    model = create_model(optimizer=params['optimizer'], init_mode=params['init_mode'], dropout_rate=params['dropout_rate'])

    # Entraîner le modèle
    history = model.fit(
        train_generator_no_aug,
        steps_per_epoch=train_generator_no_aug.samples // params['batch_size'],
        epochs=params['epochs'],
        validation_data=val_generator_no_aug,
        validation_steps=val_generator_no_aug.samples // params['batch_size'],
        verbose=1
    )

    # Obtenir les meilleures performances de validation
    val_accuracy = max(history.history['val_accuracy'])

    # Mettre à jour les meilleures performances et paramètres si nécessaire
    if val_accuracy > best_accuracy:
        best_accuracy = val_accuracy
        best_params = params

print(f"Meilleurs Hyperparamètres : {best_params}")
print(f"Meilleure Précision de Validation : {best_accuracy}")

Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.0, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 20, 'dropout_rate': 0.5, 'epochs': 20, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/20



Entraînement avec les paramètres : {'batch_size': 40, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Entraînement avec les paramètres : {'batch_size': 40, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Entraînement avec les paramètres : {'batch_size': 40, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'adam'}
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Entraînement avec les paramètres : {'batch_size': 40, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'he_normal', 'optimizer': 'sgd'}
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Entraînement avec 

### **Entraînement du modèle avec les meilleurs hyperparamètres**

In [9]:
model = create_model(optimizer=best_params['optimizer'], init_mode=best_params['init_mode'], dropout_rate=best_params['dropout_rate'])
history = model.fit(
    train_generator_no_aug,
    steps_per_epoch=train_generator_no_aug.samples // best_params['batch_size'],
    epochs=best_params['epochs'],
    validation_data=val_generator_no_aug,
    validation_steps=val_generator_no_aug.samples // best_params['batch_size'],
    verbose=1
)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


### **Evaluation du modèle**

In [10]:
# Prédictions sur l'ensemble de test
y_pred = model.predict(test_generator_no_aug)
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = test_generator_no_aug.classes

# Évaluation du modèle sur les données de test
test_loss, test_accuracy = model.evaluate(test_generator_no_aug, verbose=2)

# Afficher la précision du modèle sur les données de test
print(f'Précision sur les données de test : {test_accuracy*100:.2f}%')

7/7 - 2s - loss: 0.1998 - accuracy: 0.9531 - 2s/epoch - 312ms/step
Précision sur les données de test : 95.31%




## **Modélisation avec Data augmentation**



### **Recherche des meilleurs hyperparamètres**

In [12]:
def create_model(optimizer='adam', init_mode='uniform', dropout_rate=0.0):
    model = Sequential([
        Conv2D(32, (3, 3), activation='relu', input_shape=(128, 128, 3)),
        MaxPooling2D(pool_size=(2, 2)),
        Conv2D(64, (3, 3), activation='relu'),
        MaxPooling2D(pool_size=(2, 2)),
        Conv2D(128, (3, 3), activation='relu'),
        MaxPooling2D(pool_size=(2, 2)),
        Flatten(),
        Dense(128, activation='relu', kernel_initializer=init_mode),
        Dropout(dropout_rate),
        Dense(3, activation='softmax')
    ])
    model.compile(optimizer=optimizer,
                  loss='categorical_crossentropy',
                  metrics=['accuracy'])
    return model

# Définir les hyperparamètres à tester
param_grid = {
    'batch_size': [10, 20, 40],
    'epochs': [10, 20],
    'optimizer': ['adam', 'sgd'],
    'init_mode': ['uniform', 'he_normal'],
    'dropout_rate': [0.0, 0.5]
}

# Convertir le param_grid en liste de dictionnaires
param_list = list(ParameterGrid(param_grid))

# Initialiser les meilleures performances et paramètres
best_accuracy = 0
best_params = None

# Boucle pour rechercher les meilleurs hyperparamètres
for params in param_list:
    print(f"Entraînement avec les paramètres : {params}")

    # Créer le modèle avec les hyperparamètres actuels
    model = create_model(optimizer=params['optimizer'], init_mode=params['init_mode'], dropout_rate=params['dropout_rate'])

    # Entraîner le modèle
    history = model.fit(
        train_generator_aug,
        steps_per_epoch=train_generator_aug.samples // params['batch_size'],
        epochs=params['epochs'],
        validation_data=val_generator_aug,
        validation_steps=val_generator_aug.samples // params['batch_size'],
        verbose=1
    )

    # Obtenir les meilleures performances de validation
    val_accuracy = max(history.history['val_accuracy'])

    # Mettre à jour les meilleures performances et paramètres si nécessaire
    if val_accuracy > best_accuracy:
        best_accuracy = val_accuracy
        best_params = params

print(f"Meilleurs Hyperparamètres : {best_params}")
print(f"Meilleure Précision de Validation : {best_accuracy}")

Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'adam'}
Epoch 1/10



Entraînement avec les paramètres : {'batch_size': 10, 'dropout_rate': 0.0, 'epochs': 10, 'init_mode': 'uniform', 'optimizer': 'sgd'}
Epoch 1/10
 30/146 [=====>........................] - ETA: 2:13 - loss: 1.1049 - accuracy: 0.3602

KeyboardInterrupt: 

### **Entraînement du modèle avec les meilleurs hyperparamètres**

In [None]:
model_aug = create_model(optimizer=best_params['optimizer'], init_mode=best_params['init_mode'], dropout_rate=best_params['dropout_rate'])
history = model.fit(
    train_generator_aug,
    steps_per_epoch=train_generator_aug.samples // best_params['batch_size'],
    epochs=best_params['epochs'],
    validation_data=val_generator_aug,
    validation_steps=val_generator_aug.samples // best_params['batch_size'],
    verbose=1
)

## **Evaluation du modèle avec Data augmentation**

In [None]:
# Prédictions sur l'ensemble de test
y_pred = model.predict(test_generator_aug)
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = test_generator_aug.classes

# Évaluation du modèle sur les données de test
test_loss, test_accuracy = model.evaluate(test_generator_aug, verbose=2)

# Afficher la précision du modèle sur les données de test
print(f'Précision sur les données de test : {test_accuracy*100:.2f}%')


## **Affichage de la matrice de confusion du meilleur modèle**

In [None]:
# Matrice de confusion
cm = confusion_matrix(y_true, y_pred_classes)
cm_display = ConfusionMatrixDisplay(cm, display_labels=test_generator_aug.class_indices.keys())
cm_display.plot(xticks_rotation='vertical')
plt.title('Matrice de confusion')
plt.show()