In [None]:
#On spécifie le chemin d'accès des fichiers : train et test100
train_dir = "../input/dogs-vs-cats/train.zip"
test_dir = "../input/test100/test100"

In [None]:
# On Importe le module zipfile qui permet de manipuler des fichiers ZIP.
import zipfile

#On extrait notre fichier zip train:
with zipfile.ZipFile(train_dir,'r') as z:
    z.extractall()

#Après l'extraction des données, on obtient un dossier stocké dans l'output.

In [None]:
#on importe le module os qui permet d'intéragir avec le système d'exploitation
import os

#On crée une liste "images" qui contient le nom de tous les fichiers dans le dossier "train"
images = os.listdir("./train")

#On crée une liste "test_images" qui contient le nom de tous les fichiers dans le dossier "test100"
test_images = os.listdir(test_dir)

#On importe la bibliothèque pandas permettant la manipulation et l'analyse des données.
import pandas as pd

#On utilise la fonction DataFrame() qui organise les données en lignes et en colonnes:
data = pd.DataFrame(images)
test_data = pd.DataFrame(test_images)

#On change le nom de la colonne pour data et test data de "0" à, respectivement, "image" et "test image":
data = data.rename(columns = {0:'image'})
test_data = test_data.rename(columns = {0: 'test image'})

#On ajoute le chemin d'accès avant le nom de chaque element dans chaque colonne de nos deux données:
data['image'] = data['image'].apply(lambda x: './train/' + x)
test_data['test image']= test_data['test image'].apply(lambda x: test_dir + "/"+ x)

#Notons que la colonne "image"/"test image" contient le chemin d'accès de chaque image !

#On crée une nouvelle variable "label" qui prend les valeurs "dog" ou "cat" selon x:
data['label'] = data['image'].apply(lambda x: 'cat' if 'cat' in x else 'dog')
test_data['label'] = test_data['test image'].apply(lambda x: 'cat' if 'cat' in x else 'dog')

#On observe les 5 premières lignes de notre data:
display(data.head())
display(test_data.head())

In [None]:
# Data contient 25000 observations (lignes) et 2 variables (colonnes)
display(data.shape)

# Test data contient 100 observations (lignes) et 2 variables (colonnes)
display(test_data.shape)

In [None]:
#On scinde notre data en deux sous-ensembles de données:

#Données d'entraînement : 80% de lignes (20000) et 2 colonnes
train_data = data.iloc[0:20000, 0:2]
print(train_data.shape)

#Données de validation: 20% de lignes (5000) et 2 colonnes
validation_data = data.iloc[20000:25000, 0:2]
print(validation_data.shape)

In [None]:
# On importe le module ImageDataGenerator qui génère des lots de données d'images tensorielles avec une augmentation des données en temps réel.
from tensorflow.keras.preprocessing.image import ImageDataGenerator

In [None]:
#Comme 255 est la valeur maximale d'un pixel, on change l'echelle de ces valeurs en divisant par 255 afin qu'elles prennent de nouvelles valeurs allant de 0 à 1.
train_datagen =  ImageDataGenerator(rescale=1/255)
validation_datagen =  ImageDataGenerator(rescale=1/255)
test_datagen = ImageDataGenerator(rescale=1/255)

In [None]:
#Transformer nos dataframes en batches d'images uniformisées:

train_genarator = train_datagen.flow_from_dataframe(train_data, target_size=(150,150),
                                                    x_col='image',y_col='label',class_mode='binary',batch_size = 32)

validation_genarator = validation_datagen.flow_from_dataframe(validation_data,target_size=(150,150),
                                                         x_col='image',y_col='label',class_mode='binary',batch_size= 32)

test_generator = test_datagen.flow_from_dataframe(test_data,target_size=(150,150),
                                                        x_col='test image',y_col='label',class_mode='binary',batch_size= 32)

In [None]:
#Importer tous les bibliothèques et les modules nécéssaire à la construction de notre modèle:

import tensorflow as tf 

from tensorflow import keras

from keras.models import Sequential

from keras.models import load_model

from keras.layers import Conv2D, MaxPooling2D, Dense, Dropout, Flatten

from keras import optimizers

from tensorflow.keras import regularizers

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from tqdm import tqdm

In [None]:
#On spécifie un modèle sequentiel : empilement simple de couches où chaque couche a exactement un tenseur d'entrée et un de sortie
model = Sequential()

#On définit quatres couches de convolution, chacune suivie d'une couche de maxpooling de dimension 2x2

#La première couche contient 32 filtres, de dimension 3x3 et avec la fonction d'activation "relu". 
#Notons qu'elle prenne des élements d'entrée de dimension 150x150x3 !
model.add(Conv2D(filters=32, kernel_size=(3,3), input_shape=(150, 150, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=2))

#En passant à la deuxième couche, on a augmenté le nombre des filtres à 64.
model.add(Conv2D(filters=64, kernel_size=(3,3), activation = 'relu'))
model.add(MaxPooling2D(pool_size=2))

#Et finalement, les deux dernières couches contiennent 128 filtres chacune. 
model.add(Conv2D(filters=128, kernel_size=(3,3), activation = 'relu'))
model.add(MaxPooling2D(pool_size=2))

model.add(Conv2D(filters=128, kernel_size=(3,3), activation = 'relu'))
model.add(MaxPooling2D(pool_size=2))

#On utilise la fonction Flatten pour applatir les tenseurs d'entrée multidimensionnels en une seule dimension.
model.add(Flatten())

#La couche Dense transforme la matrice d'entrée en vecteur ligne, elle performe aussi des opérations de simplification.
model.add(Dense(512, activation='relu', kernel_regularizer=keras.regularizers.l2(l=0.01)))

#La couche Dropout donne de manière aléatoire la valeur 0 aux elements d'entrée avec une fréquence de 0.25 à chaque étape pendant la durée de l'entrainement.
model.add(Dropout(0.25))

#Cette couche dense génère un seul nombre et utilise la fonction d'activation "sigmoid".
model.add(Dense(1, activation='sigmoid'))

In [None]:
#Un aperçu syntéthique de notre modèle et ses couches:
from tensorflow.keras.utils import plot_model
plot_model(model, to_file='cnn_model.png', show_shapes=True, show_layer_names=True)

In [None]:
#On utilise l'optimisateur Adam avec un pas d'apprentissage de 0.001: 
opt = keras.optimizers.Adam(learning_rate=0.001)

#On configure le modèle pour l'entrainement: la fontion loss, l'optimisateur et la fonction metrics permettant d'évaluer le modèle.
model.compile(loss='binary_crossentropy', optimizer=opt, metrics=['accuracy'])

In [None]:
#Un résumé utile du modèle, qui comprend : Le nom et le type de toutes les couches du modèle. Forme de sortie pour chaque couche.
model.summary()
#On remarque une réduction de l'image (dimension de la matrice) et augmentation de la profondeur de la matrice.

In [None]:
#Pour libérer de la mémoire et accélérer le processus:
import gc
gc.collect()

In [None]:
#On spécifie la mesure de performance à monitorer, le déclencheur, et une fois déclenché, il arrêtera le processus d'entrainement.

#Aussi, On réduit le pas d'apprentissage lorsqu'une métrique a cessé de s'améliorer.
cb = [tf.keras.callbacks.EarlyStopping(monitor = 'val_loss', patience=5, 
                                              restore_best_weights=True),
             tf.keras.callbacks.ReduceLROnPlateau(monitor = 'val_loss' , patience=3)]

#Une fois le modèle spécifié, on commence l'entrainement avec 100 époque:
history = model.fit(train_genarator, epochs =100, validation_data= validation_genarator,
                    callbacks = cb)

In [None]:
#On génère les predictions du modèle par rapport aux données de test:
predict = model.predict_generator(test_generator)

predict = pd.DataFrame(predict)

predict = predict.rename(columns = {0:'Cat probability'})

predict['Dog probability'] = 1 - predict['Cat probability']

display(predict)

In [None]:
#Importation des modules:
from sklearn.metrics import confusion_matrix, classification_report
import seaborn as sns

#Si la probabilité dépasse 0.5, la prédiction renvoie "cat":
predictions = (model.predict(test_generator) >= 0.5).astype(np.int)

#On génère la matrice de confusion fournissant une comparaison de la classes prédite et la classe actuelle:
cm = confusion_matrix(test_generator.labels, predictions, labels=[0, 1])

plt.figure(figsize=(6, 6))
sns.heatmap(cm, annot=True, fmt='g', vmin=0, cmap='Blues', cbar=False)
plt.xticks(ticks=[0.5, 1.5], labels=["cat", "dog"])
plt.yticks(ticks=[0.5, 1.5], labels=["cat", "dog"])
plt.xlabel("Predicted")
plt.ylabel("Actual")
plt.title("Confusion Matrix")
plt.show()

In [None]:
#Rapport de classification:
clr = classification_report(test_generator.labels, predictions, labels=[0, 1], target_names=["cat", "dog"])
print(clr)

In [None]:
#On crée un répértoire de travail où on va enregistrer notre modèle
os.makedirs("./Saved_Models")

#Ensuite, on enregistre le modèle 
from keras.models import load_model
model.save('./Saved_Models/model_cat_dog.h5')

In [None]:
#On observe l'évolution des valeurs de perte et de précision selon les époques :
history_df = pd.DataFrame(history.history)
print(history_df)

In [None]:
#Le graphique de la fonction de perte:
history_df.loc[:, ['loss', 'val_loss']].plot();
print("Minimum validation loss: {}".format(history_df['val_loss'].min()))

In [None]:
#Le graphique de la fonction de précision:
history_df.loc[:, ['accuracy', 'val_accuracy']].plot();
print("Maximum validation accuracy : {}".format(history_df['val_accuracy'].max()))