# Fashion Classifier

> Utilisation du jeu de données "Fashion MNIST" to entraîner un classificateur de vétêments de mode avec Keras / Tensorflow

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

from matplotlib_inline.backend_inline import set_matplotlib_formats
from tensorflow import keras

set_matplotlib_formats("svg")

## Chargement du jeu de données

Chargeons le jeu de données depuis Keras :

In [None]:
(X_train_full, y_train_full), (X_test, y_test) = keras.datasets.fashion_mnist.load_data()

In [None]:
X_train_full.shape

In [None]:
X_test.shape

In [None]:
y_test.shape

Normalisons les pixels des images entre 0 et 1 :

In [None]:
X_train = X_train_full / 255.0
X_test = X_test / 255.0

X_train = X_train[..., np.newaxis]
X_test = X_test[..., np.newaxis]

Ajoutons les noms des classes au jeu de données (source : https://keras.io/api/datasets/fashion_mnist/) :

In [None]:
class_names = [
    "T-shirt/top",
    "Trouser",
    "Pullover",
    "Dress",
    "Coat",
    "Sandal",
    "Shirt",
    "Sneaker",
    "Bag",
    "Ankle boot",
]

In [None]:
plt.figure(figsize=(12, 10))
for i in range(40):
    ax = plt.subplot(4, 10, i + 1)
    plt.imshow(X_train[i,:,:,0], cmap="binary")
    plt.title(class_names[y_train_full[i]])
    plt.axis("off")

## Construction du modèle

In [None]:
model = keras.models.Sequential([
    keras.layers.Conv2D(64, 7, activation=keras.activations.relu, padding="same", input_shape=[28, 28, 1]),
    keras.layers.MaxPooling2D(pool_size=2),
    keras.layers.Conv2D(128, 3, activation=keras.activations.relu, padding="same"),
    keras.layers.Conv2D(128, 3, activation=keras.activations.relu, padding="same"),
    keras.layers.MaxPooling2D(pool_size=2),
    keras.layers.Conv2D(256, 3, activation=keras.activations.relu, padding="same"),
    keras.layers.Conv2D(256, 3, activation=keras.activations.relu, padding="same"),
    keras.layers.MaxPooling2D(pool_size=2),
    keras.layers.Flatten(),
    keras.layers.Dense(128, activation=keras.activations.relu),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(64, activation=keras.activations.relu),
    keras.layers.Dropout(0.5),
    keras.layers.Dense(10, activation=keras.activations.softmax),
])

In [None]:
model.summary()

In [None]:
model.compile(
    loss=keras.losses.sparse_categorical_crossentropy,
    optimizer=keras.optimizers.SGD(),
    metrics=[keras.metrics.sparse_categorical_accuracy],
)

## Entraînement du modèle

In [None]:
history = model.fit(X_train, y_train_full, epochs=10, validation_split=0.1)

In [None]:
pd.DataFrame(history.history).plot()
plt.grid(True)

In [None]:
model.evaluate(X_test, y_test)

## Prédictions du modèle

In [None]:
y_pred_proba = model.predict(X_test[:3])
y_pred = np.argmax(y_pred_proba, axis=1)

In [None]:
y_pred_proba

In [None]:
y_pred

In [None]:
plt.figure(figsize=(5, 1))
for i in range(3):
    ax = plt.subplot(1, 3, i + 1)
    plt.imshow(X_test[i,:,:,0], cmap="binary")
    plt.title(class_names[y_pred[i]])
    plt.axis("off")

## Questions

- De quel ordre de grandeur est la différence de temps d'exécution du processus d'entraînement du réseau de neurones convolutif entre architecture CPU et GPU ?
- Même question pour le processus d'inférence ?
- Qu'en pensez-vous ? En déduisez vous des problèmes potentiels ?