# Chargement des modules

In [1]:
# Sequential permet d'assembler le réseau.
from keras import Sequential
# Pour importer les données directement de Keras.
from keras.datasets import mnist
# Pour encoder les étiquettes.
from keras.utils import to_categorical
# Les 5 types de couches pour construire le réseau.
from keras.layers import Dense, Conv2D, Dropout, Flatten, Input, MaxPooling2D
# Le module de base pour manipuler des données.
import numpy as np
# Le module habituel pour tracer des graphiques.
import matplotlib.pyplot as plt

# Préparation des données

In [2]:
# Il y a 10 classes différentes.
num_classes = 10
# Les images sont petites et en niveaux de gris.
input_shape = (28, 28, 1)
# Les données MNIST sont comprises dans Keras.
# x_train est l'image et y_train l'étiquette correspondante.
(x_train_brut, y_train), (x_test_brut, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 0us/step


In [3]:
print(x_train_brut.__dir__)

<built-in method __dir__ of numpy.ndarray object at 0x7b89344ce790>


In [4]:
print(f"Dimensions de l'ensemble des images d'entraînement : {x_train_brut.shape}")
print(f"Dimensions de l'ensemble des étiquettes d'entraînement : {y_train.shape}")

Dimensions de l'ensemble des images d'entraînement : (60000, 28, 28)
Dimensions de l'ensemble des étiquettes d'entraînement : (60000,)


In [5]:
# La douzième image du jeu de données est le chiffre 3.
x_train_brut[12]

In [6]:
# La douzième étiquette est 3 : ce n'est pas un vecteur.
y_train[12]

3

In [7]:
x_train_brut[1].shape

(28, 28)

In [8]:
# Les données doivent toujours est normalisées (varier entre 0 et 1).
x_train = x_train_brut.astype("float32") / 255
x_test = x_test_brut.astype("float32") / 255

In [9]:
x_train[1].shape

(28, 28)

In [10]:
x_train_brut[1,12,7]

7

In [11]:
x_train[1,12,7]

0.02745098

In [12]:
7/255

0.027450980392156862

In [13]:
# Transformation des images dans le format approprié.
# Il faut ajouter une dimension afin que les images soient des tenseurs.
x_train = np.expand_dims(x_train, -1)
x_test = np.expand_dims(x_test, -1)
print("x_train dimensions:", x_train.shape)
print(x_train.shape[0], "échantillons entraînement")
print(x_test.shape[0], "échantillons test")

x_train dimensions: (60000, 28, 28, 1)
60000 échantillons entraînement
10000 échantillons test


In [14]:
x_train[1,12].shape

(28, 1)

In [15]:
x_train[1,12]

array([[0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.02745098],
       [0.69803923],
       [0.9882353 ],
       [0.9411765 ],
       [0.2784314 ],
       [0.07450981],
       [0.10980392],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.99215686],
       [0.9882353 ],
       [0.7647059 ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ],
       [0.        ]], dtype=float32)

# Création des étiquettes

In [16]:
# La méthode to_categorical permet l'encodage «one-hot».
# La méthode est valable si les catégories sont représentées par des entiers.
a = to_categorical([0, 1, 2, 3], num_classes=4)
print(a)

[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]


In [17]:
y_train = to_categorical(y_train, num_classes)
y_test = to_categorical(y_test, num_classes)

In [18]:
y_train[12]

array([0., 0., 0., 1., 0., 0., 0., 0., 0., 0.])

# Construction du réseau

In [19]:
# L'API Sequential rend possible l'assemblage d'un réseau de neurones.
# À ce stade, seulement le réseau est défini ; l'entraînement s'accomplira plus tard.
# Il est possible d'éviter le pooling et de la remplacer par un stride.
modele = Sequential(
    [
        Input(shape=input_shape),
        Flatten(),
        Dense(128, activation="relu"),
        Dropout(0.2),
        Dense(num_classes, activation="softmax"),
    ]
)

# La méthode summary affiche un résumé du réseau.
modele.summary()

# Entraînement du réseau

In [None]:
# L'entraînement sera en calculant une moyenne sur 128 échantillon.
# 15 passage seront effectués sur les paramètres du réseau.
batch_size = 128
epochs = 15
# Le modèle doit être compilé avant d'être entraîné.
modele.compile(loss="categorical_crossentropy", optimizer="adam", metrics=["accuracy"])
# Fit effectue l'entraînement.
# validation_split=0.1 met de côté 10% des données pour effectuer la validation.
# validation_data=(x_test, y_test) aurait permis d'employer les données prévues à cet effet.
histoire = modele.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, validation_split=0.1)

Epoch 1/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 4ms/step - accuracy: 0.7971 - loss: 0.7096 - val_accuracy: 0.9528 - val_loss: 0.1743
Epoch 2/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - accuracy: 0.9367 - loss: 0.2159 - val_accuracy: 0.9662 - val_loss: 0.1227
Epoch 3/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - accuracy: 0.9542 - loss: 0.1596 - val_accuracy: 0.9707 - val_loss: 0.1071
Epoch 4/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step - accuracy: 0.9616 - loss: 0.1303 - val_accuracy: 0.9743 - val_loss: 0.0933
Epoch 5/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 4ms/step - accuracy: 0.9693 - loss: 0.1059 - val_accuracy: 0.9788 - val_loss: 0.0794
Epoch 6/15
[1m422/422[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 4ms/step - accuracy: 0.9745 - loss: 0.0891 - val_accuracy: 0.9797 - val_loss: 0.0742
Epoch 7/15
[1m422/422[0m 

KeyboardInterrupt: 

In [None]:
def plot_hist(hist):
    plt.plot(hist.history["accuracy"])
    plt.plot(hist.history["val_accuracy"])
    plt.title("Précision du modèle")
    plt.ylabel("précision")
    plt.xlabel("epoch")
    plt.legend(["train", "validation"], loc="upper left")
    plt.show()


plot_hist(histoire)

In [None]:
def plot_lost(hist):
    plt.plot(hist.history["loss"])
    plt.plot(hist.history["val_loss"])
    plt.title("Perte du modèle")
    plt.ylabel("perte")
    plt.xlabel("époque")
    plt.legend(["entraînement", "validation"], loc="upper left")
    plt.show()


plot_lost(histoire)

# Validation du réseau

In [None]:
# evaluate valide le réseau sur des données inutilisées pour l'entraînement.
modele.evaluate(x_test, y_test, batch_size=batch_size)