<a href="https://colab.research.google.com/github/ochekroun/labs/blob/master/IFAGE_Cours_1_MNIST_avec_Keras.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🔢 Reconnaitre des chiffres avec Keras

Dans ce premier "vrai" notebook, nous allons entrainer un modèle pour reconnaitre les chiffres du dataset MNIST.

Tiré de https://keras.io/examples/vision/mnist_convnet/

## Installation de Keras

In [None]:
!pip install -U keras

In [None]:
# utilisons pytorch plutôt que tensorflow
import os
os.environ["KERAS_BACKEND"] = "torch"

## Exploration du jeu de donnée

In [None]:
# importons la librairie keras et numpy
import keras
import numpy as np

In [None]:
# le jeu de donnée MNIST est disponible directement depuis Keras
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

In [None]:
x_train.shape

In [None]:
y_train.shape

In [None]:
y_train

In [None]:
import matplotlib.pyplot as plt

In [None]:
x_train[0]

In [None]:
plt.imshow(x_train[1], cmap="gray")

## Normalisation des données

In [None]:
# Normalise les données pour être entre 0.0 et 1.0
x_train = x_train.astype("float32") / 255
x_test = x_test.astype("float32") / 255

In [None]:
x_train.shape

In [None]:
x_train[0]

## Mise en forme des labels

In [None]:
y_train[0]

In [None]:
from keras.utils import to_categorical

# nombre de classe de notre modèle
num_classes = 10

# on mets les données en forme avec l'encodage "one-hot"
y_train = to_categorical(y_train, num_classes)
y_test = to_categorical(y_test, num_classes)

In [None]:
y_train[0]

## 🧠 Construction du modèle

In [None]:
from keras import layers

model = keras.Sequential(
    [
        layers.Flatten(input_shape=(28, 28)),
        layers.Dense(200, activation="relu"),
        layers.Dense(100, activation="relu"),
        layers.Dense(75, activation="relu"),
        layers.Dense(num_classes, activation="softmax"),
    ]
)

In [None]:
28*28*200

In [None]:
# "résumé" de notre modèle
model.summary()

In [None]:
model.compile(
    loss="categorical_crossentropy",
    optimizer="adam",
    metrics=["accuracy"]
)

In [None]:
model.fit(
    x_train, y_train,
    batch_size=128,
    epochs=3,
    validation_split=0.1
)

In [None]:
model.evaluate(x_test, y_test, verbose=0)

In [None]:
score = model.evaluate(x_test, y_test, verbose=0)
print("Test loss:", score[0])
print("Test accuracy:", score[1])

In [None]:
for weigths in model.get_weights():
  print(weigths.size)

## Evaluation sur un example spécifique

In [None]:
plt.imshow(x_test[0], cmap="gray")

In [None]:
# ceci ne marche pas - le modèle travaille sur plusieurs entrées à la fois !
#prediction = model.predict(x_test[0])

In [None]:
# une des façons possible d'ajouter une dimension
np.expand_dims(x_test[0], 0).shape

In [None]:
# une autre façon
np.array([x_test[0]]).shape

In [None]:
# en utilisant l'une ou l'autre solution, on peut maintenant obtenir une prédiction
prediction = model.predict(np.array([x_test[0]]))

In [None]:
prediction

In [None]:
import matplotlib.pyplot as plt

plt.bar(range(10), prediction[0], color='blue')
plt.title('Prediction')
plt.xticks(range(10))
plt.xlabel('Digit')
plt.ylabel('Probability')

## Calculons la perte selon le label

In [None]:
cce = keras.losses.CategoricalCrossentropy()

In [None]:
y_true = np.array([[0,0,0,0,0,0,0,1,0,0]])

In [None]:
cce(prediction, y_true).item()