# Fine-tuning  d'un réseau à l'aide de l'API Keras

L'un des plus grands avantages de l'apprentissage par transfert est peut-être sa capacité à saisir le vent arrière produit par les connaissances encodées dans des réseaux pré-formés. En échangeant simplement les couches les moins profondes dans l'un de ces réseaux, nous pouvons obtenir des performances remarquables sur de nouveaux ensembles de données non liés, même si nos données sont petites. Pourquoi? Parce que les informations contenues dans les couches inférieures sont pratiquement universelles : elles codent des formes et des formes de base qui s'appliquent à presque tous les problèmes de vision par ordinateur.

Dans cette recette, nous allons affiner un réseau VGG16 pré-entraîné sur un petit ensemble de données, en obtenant un score de haute précision par ailleurs improbable

Nous utiliserons un ensemble de données appelé 17 Category Flower Dataset, disponible ici : http://www.robots.ox.ac.uk/~vgg/data/flowers/17. Une version organisée en sous-dossiers par classe est disponible ici : https://github.com/PacktPublishing/Tensorflow-2.0-Computer-Vision-Cookbook/tree/master/ch3/recipe3/flowers17.zip. Téléchargez-le et décompressez-le à l'emplacement de votre choix.

In [3]:
!cp /content/drive/MyDrive/probabilité/flowers17.zip /content/
!unzip flowers17.zip

Archive:  flowers17.zip
   creating: flowers17/
   creating: flowers17/images/
   creating: flowers17/images/bluebell/
  inflating: flowers17/images/bluebell/image_0241.jpg  
  inflating: flowers17/images/bluebell/image_0242.jpg  
  inflating: flowers17/images/bluebell/image_0243.jpg  
  inflating: flowers17/images/bluebell/image_0244.jpg  
  inflating: flowers17/images/bluebell/image_0245.jpg  
  inflating: flowers17/images/bluebell/image_0246.jpg  
  inflating: flowers17/images/bluebell/image_0247.jpg  
  inflating: flowers17/images/bluebell/image_0248.jpg  
  inflating: flowers17/images/bluebell/image_0249.jpg  
  inflating: flowers17/images/bluebell/image_0250.jpg  
  inflating: flowers17/images/bluebell/image_0251.jpg  
  inflating: flowers17/images/bluebell/image_0252.jpg  
  inflating: flowers17/images/bluebell/image_0253.jpg  
  inflating: flowers17/images/bluebell/image_0254.jpg  
  inflating: flowers17/images/bluebell/image_0255.jpg  
  inflating: flowers17/images/bluebell/im

Le fine tuning est facile ! Suivez ces étapes pour terminer cette recette

**1.** Importez les dépendances nécessaires :

In [4]:
import os
import pathlib
from glob import glob

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelBinarizer
from tensorflow.keras import Model
from tensorflow.keras.applications import VGG16
from tensorflow.keras.layers import *
from tensorflow.keras.optimizers import *
from tensorflow.keras.preprocessing.image import *

**2.** Définissez la graine aléatoire :

In [5]:
SEED = 999

**3.** Défnir une fonction qui construira un nouveau réseau à partir d'un modèle pré-entraîné, où les couches supérieures entièrement connectées seront toutes nouvelles et adaptées au problème à résoudre

In [6]:
def build_network(base_model, classes):
    x = Flatten()(base_model.output)
    x = Dense(units=256)(x)
    x = ReLU()(x)
    x = BatchNormalization(axis=-1)(x)
    x = Dropout(rate=0.5)(x)

    x = Dense(units=classes)(x)
    output = Softmax()(x)

    return output

**4.** Définir une fonction qui chargera les images et les étiquettes dans l'ensemble de données en tant que tableaux NumPy

In [7]:
def load_images_and_labels(image_paths,
                           target_size=(256, 256)):
    images = []
    labels = []

    for image_path in image_paths:
        image = load_img(image_path, target_size=target_size)
        image = img_to_array(image)

        label = image_path.split(os.path.sep)[-2]

        images.append(image)
        labels.append(label)

    return np.array(images), np.array(labels)

**5.** Chargez les chemins des images et extrayez-en l'ensemble des classes :

In [8]:
dataset_path = pathlib.Path('/content/flowers17') 
files_pattern = (dataset_path / 'images' / '*' / '*.jpg')
image_paths = [*glob(str(files_pattern))]
CLASSES = {p.split(os.path.sep)[-2] for p in image_paths}

**6.** Chargez les images et normalisez-les, encodez à one-hot les étiquettes avec LabelBinarizer() et divisez les données en sous-ensembles pour l'entraînement (80%) et les tests (20%) :

In [9]:
X, y = load_images_and_labels(image_paths)
X = X.astype('float') / 255.0
y = LabelBinarizer().fit_transform(y)
(X_train, X_test, y_train, y_test) = train_test_split(X, y,
                                     test_size=0.2,
                                     random_state=SEED)

**7.** Instanciez un VGG16 pré-entraîné, sans les couches supérieures. Spécifiez une forme d'entrée de 256x256x3

In [10]:
base_model = VGG16(weights='imagenet',
                   include_top=False,
                   input_tensor=Input(shape=(256, 256, 3)))

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg16/vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5


In [11]:
#Gelez toutes les couches du modèle de base. Nous le faisons parce que nous ne voulons pas les recycler, mais utiliser leurs connaissances existantes
for layer in base_model.layers:
    layer.trainable = False

**8.** Construisez le réseau complet avec un nouvel ensemble de couches au-dessus en utilisant build_network() (défini à l'étape 3)

In [12]:
model = build_network(base_model, len(CLASSES))
model = Model(base_model.input, model)

**9.** Déﬁnissez la taille du lot et un ensemble d'augmentations à appliquer via ImageDataGenerator() :

In [13]:
BATCH_SIZE = 64
augmenter = ImageDataGenerator(rotation_range=30,
                               horizontal_flip=True,
                               width_shift_range=0.1,
                               height_shift_range=0.1,
                               shear_range=0.2,
                               zoom_range=0.2,
                               fill_mode='nearest')
train_generator = augmenter.flow(X_train, y_train, BATCH_SIZE)

**10.** Réchauffez le réseau. Cela signifie que nous n'entraînerons les nouvelles couches (les autres sont gelées) que pendant 20 époques, en utilisant RMSProp avec un taux d'apprentissage de 0,001. Enfin, nous évaluerons le réseau sur l'ensemble de test :

In [14]:
WARMING_EPOCHS = 20
model.compile(loss='categorical_crossentropy',
              optimizer=RMSprop(lr=1e-3),
              metrics=['accuracy'])
history = model.fit(train_generator,
                    steps_per_epoch=len(X_train) // BATCH_SIZE,
                    validation_data=(X_test, y_test),
                    epochs=WARMING_EPOCHS)

  "The `lr` argument is deprecated, use `learning_rate` instead.")


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [15]:
result = model.evaluate(X_test, y_test)
print(f'Test accuracy: {result[1]}')

Test accuracy: 0.7977941036224365


**11.** Maintenant que le réseau a été réchauffé, nous allons affiner les couches finales du modèle de base, en particulier à partir du 16 (rappelez-vous, l'indexation zéro), ainsi que les couches entièrement connectées, pour 50 époques, en utilisant SGD avec un taux d'apprentissage de 0,001 :

In [16]:
EPOCHS = 50
model.compile(loss='categorical_crossentropy',
              optimizer=SGD(lr=1e-3),
              metrics=['accuracy'])
history = model.fit(train_generator,
                    steps_per_epoch=len(X_train) // BATCH_SIZE,
                    validation_data=(X_test, y_test),
                    epochs=EPOCHS)
result = model.evaluate(X_test, y_test)
print(f'Test accuracy: {result[1]}')

  "The `lr` argument is deprecated, use `learning_rate` instead.")


Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Test accuracy: 0.9117646813392639


Après le préchauffage, le réseau a atteint une précision de 79,77 % sur l'ensemble de test. Ensuite, lorsque nous l'avons affiné, après 50 époques, la précision est passée à 91,17% sur l'ensemble de test. Nous verrons comment tout cela fonctionne dans la section suivante.

Nous avons réussi à exploiter les connaissances d'un VGG16 pré-entraîné sur l'énorme base de données ImageNet. En remplaçant les couches supérieures, entièrement connectées et chargées de la classification proprement dite (les autres faisant office d'extracteurs de caractéristiques), par notre propre ensemble de couches profondes adaptées à notre problème, nous avons réussi à obtenir un 91,7 % de précision sur l'ensemble de test.

Ce résultat est une démonstration de la puissance de l'apprentissage par transfert, d'autant plus que nous n'avons que 81 images par classe dans l'ensemble de données (81x17 = 1 377 au total), une quantité insuffisante pour former un modèle d'apprentissage en profondeur performant à partir de zéro.

Vous pouvez en savoir plus sur les modèles pré-entraînés Keras ici : https://www.tensorflow.org/api_docs/python/tf/keras/applications