### Résumé des étapes dans ce notebook 02 :
- Importer les bibliothèques.
- Charger les données prétraitées.
- Prétraiter les images avec un générateur.
- Construire un modèle CNN basé sur VGG16.
- Entraîner les couches supérieures du CNN.
- Sauvegarder le modèle.
- Visualiser les courbes de perte.

In [92]:
# Importer les bibliothèques
import os
import numpy as np
import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam
from PIL import Image
import matplotlib.pyplot as plt
import pickle


In [93]:
# Charger les données prétraitées
with open("../datasets/flickr8k/train_data.pkl", "rb") as f:
    train_data = pickle.load(f)

with open("../datasets/flickr8k/test_data.pkl", "rb") as f:
    test_data = pickle.load(f)

# Extraire les chemins des images
train_images = [data[0] for data in train_data]
test_images = [data[0] for data in test_data]

print(f"Nombre d'images d'entraînement : {len(train_images)}")
print(f"Nombre d'images de test : {len(test_images)}")


Nombre d'images d'entraînement : 6472
Nombre d'images de test : 1619


In [94]:
# Fonction pour charger et prétraiter une image
def preprocess_image(image_path, target_size=(224, 224)):
    try:
        image = Image.open(image_path).resize(target_size)  # Redimensionner l'image
        image = np.array(image)  # Convertir en tableau numpy
        if image.shape[-1] == 4:  # Si l'image a un canal alpha, on le supprime
            image = image[..., :3]
        image = image / 255.0  # Normaliser les pixels (entre 0 et 1)
        return image
    except Exception as e:
        print(f"Erreur lors du chargement de l'image {image_path} : {e}")
        return None

# Charger et prétraiter toutes les images d'entraînement
train_images_array = np.array([preprocess_image(img) for img in train_images if preprocess_image(img) is not None])
print(f"Dimensions des données d'entraînement : {train_images_array.shape}")

# Charger et prétraiter toutes les images de test
test_images_array = np.array([preprocess_image(img) for img in test_images if preprocess_image(img) is not None])
print(f"Dimensions des données de test : {test_images_array.shape}")


Dimensions des données d'entraînement : (6472, 224, 224, 3)
Dimensions des données de test : (1619, 224, 224, 3)


In [95]:
# Charger le modèle VGG16 pré-entraîné
base_model = VGG16(weights="imagenet", include_top=False, input_shape=(224, 224, 3))

# Ajouter des couches fully connected
x = base_model.output
x = Flatten()(x)
x = Dense(256, activation="relu")(x)
x = Dropout(0.5)(x)
predictions = Dense(128, activation="relu")(x)  # Extraction de 128 caractéristiques

# Construire le modèle final
cnn_model = Model(inputs=base_model.input, outputs=predictions)

# Geler les couches du modèle pré-entraîné
for layer in base_model.layers:
    layer.trainable = False

# Compiler le modèle
cnn_model.compile(optimizer=Adam(learning_rate=0.0001), loss="mse")
cnn_model.summary()


In [96]:
# Créer des données fictives pour simuler une perte (par exemple, un tableau d'entiers)
y_train_dummy = np.zeros((train_images_array.shape[0], 128))
y_test_dummy = np.zeros((test_images_array.shape[0], 128))

# Entraîner le modèle
history = cnn_model.fit(
    train_images_array, y_train_dummy,
    validation_data=(test_images_array, y_test_dummy),
    epochs=10,
    batch_size=32
)

print("Entraînement terminé.")


Epoch 1/10
[1m203/203[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1173s[0m 6s/step - loss: 0.0202 - val_loss: 7.3142e-08
Epoch 2/10
[1m 99/203[0m [32m━━━━━━━━━[0m[37m━━━━━━━━━━━[0m [1m11:44[0m 7s/step - loss: 5.6276e-09

KeyboardInterrupt: 

In [None]:
# Sauvegarder le modèle
cnn_model.save("../models/cnn_model.h5")
print("Modèle CNN sauvegardé.")


In [None]:
# Visualiser les courbes de perte
plt.plot(history.history["loss"], label="Train Loss")
plt.plot(history.history["val_loss"], label="Validation Loss")
plt.title("Courbes de perte")
plt.xlabel("Époques")
plt.ylabel("Loss")
plt.legend()
plt.show()


  self._warn_if_super_not_called()


Epoch 1/10
Erreur de valeur lors de l'entraînement : None values not supported.


ValueError: None values not supported.