# Un exemple de Computer Vision

Dans le notebook précédent, vous avez créé un réseau de neurones capable de prédire le prix d'une maison. Bien sûr, cela a été exagéré car il aurait été plus simple d'ecrire la fonction Y = 50x + 50 directement, au lieu de créer un modèle de Machine Learning. 

Mais que se passt-t-il si les règles qui définissent un dataset sont plus compliquées, comme un problème de computer vision par exemple ? Imaginez vous le scénario où vous pouvez reconnaître différents types de vêtements, entraînés depuis un dataset contenant 10 types différents.

Pour cela, nous utiliserons le dataset Fashion MNIST. https://www.kaggle.com/zalando-research/fashionmnist


## C'est parti pour le code !

Commencez par importer Tensorflow. Il vous faudra la version 2.0

In [None]:
import tensorflow as tf
print(tf.__version__)

Le jeu de donnés Fashion MNIST est disponible directement depuis l'API de Keras tf.keras. Vous pouvez le charger de la façon suivante:

In [None]:
mnist = tf.keras.datasets.fashion_mnist

Faire appel à la méthode load_data sur cet objet vous donnera 2 sets de 2 lists. Il s'agit des valeurs de train et de test correspondant aux images de vêtements et leurs labels.


In [None]:
(train_X, train_Y), (test_X, test_Y) = mnist.load_data()

A quoi ressemblent ces valeurs ? Affichez une image de train et son label pour voir. 
Expérimentez en changeant les indices des tableaux. Par exemple, vous pouvez voir l'index 42... il s'agit d'une botte différente de celle de l'index 0.

In [None]:
import matplotlib.pyplot as plt
plt.imshow(train_X[0])
print(train_Y[0])
print(train_X[0])

Vous allez remarquer que toutes les valeurs de l'array sont des nombres compris entre 0 et 255. Il va falloir les normaliser de la façon suivante:

In [None]:
train_X  = train_X / 255.0
test_X = test_X / 255.0

Certains se demandent peut-être pourquoi il y a 2 jeux de données différents. Si vous ne connaissez pas la réponse, nous vous invitons à faire/refaire les workshops précédents.

Vous pouvez maintenant créer votre modèle. Il y a quelques nouveaux concepts ici, mais ne vous inquiétez pas, nous allons vous les expliquer un par un.

In [None]:
model = tf.keras.models.Sequential([tf.keras.layers.Flatten(), 
                                    tf.keras.layers.Dense(128, activation=tf.nn.relu), 
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

**Sequential**: Ceci définit une SEQUENCE de layers(=couches) dans le réseau de neurones.

**Flatten**: Vous vous rappelez que vos images correspondaient à une matrice carrée, quand vous les avez affichées ? Flatten va juste récupérer cette matrice et la convertir en 1D. 

**Dense**: Ajoute une couche de neurones

Chaque couche de neurone a besoin d'une **fonction d'activation**. Idem si vous ne connaissez pas son fonctionnement et son utilité, revenez sur les workshops précedents. 

**Relu** est une fonction qui signifie "Si X>0 alors return X, sinon return 0" -- donc ce qu'elle fait elle va uniquement passer les valeurs supérieures ou égales à 0 dans la prochaine couche du réseau.

**Softmax** récupère un set de valeurs, et sélectionne le plus grand nombre. Par exemple, si l'output du dernier layer ressemble à [0.1, 0.1, 0.05, 0.1, 9.5, 0.1, 0.05, 0.05, 0.05], il va chercher la plus grande valeur et convertir l'output en [0,0,0,0,1,0,0,0,0].

La prochaine chose à faire, maintenant que le modèle est défini, est de le construire. Vous pouvez le faire en faisant appel à la méthode compile et en définissant un optimizer et une fonction de loss, puis vous l'entraînez en appelant **model.fit**.

In [None]:
model.compile(optimizer = 'Adam',
              loss = 'sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_X, train_Y, epochs=5)

Une fois que l'entraînement a été réalisé, vous devriez voir l'accuracy à la fin de chaque epoch. Cela devrait ressembler à une valeur comme 0.9091. Cela signifie que votre réseau de neurones peut classifier vos données de train avec une précision d'environ 91%. Ce n'est pas le meilleur résultat qu'on peut avoir, mais c'est plutôt pas mal au vu du nombre d'epochs faible qui a été défini et de la rapidité de l'entraînement.

Mais quelle performance le modèle a-t-il atteint sur des données inconnues. C'est pour cela que nous avons les images de test. Vous pouvez faire appel à model.evaluate pour évaluer votre modèle sur votre jeu de données de test.

In [None]:
model.evaluate(test_X, test_Y)

Pour nous, ça a retourné un accurary de 0.8759, ce qui signifie qu'il est précis à environ 88%. Comme prévu, il est moins précis sur des données qu'il n'a jamais vu.

Pour comprendre davantage les différents paramètres, essayez les exercices d'exploration suivants:

# Exercices d'exploration

Ces exercices ne vous demandent pas vraiment de coder. Juste changer parfois quelques valeurs afin que vous comprennez davantages les différents paramètres données aux fonctions.

### Exercice 1:

Pour ce premier exercice, exécutez la cellule suivante: elle crée un set de classifications pour chaque image du jeu de données de test. Affichez ensuite la première entrée de classifications. L'output correpond à une liste de valeurs. Qu'en pensez-vous ? A votre avis, qu'est-ce que ces valeurs représentent ?

In [None]:
classifications = model.predict(test_X)

print(classifications[0])

Indice: essayer d'exécuter `print(test_Y[0])`, et vous aurez un 9. Est-ce que cela vous aide à comprendre l'utilité de cette liste ?

In [None]:
print(test_Y[0])

### Quiz: Qu'est ce que cette liste représente ?


1. Il s'agit de 10 valeurs random
2. Il s'agit des 10 premières classifications que l'ordinateur a fait
3. Il s'agit de la probabilité que l'item soit dans chacune des 10 classes

#### Réponse:
La réponse correcte est la 3.

L'output du modèle est une liste de 10 nombres. Ces nombres correspondent aux probabilités que la valeur qui est en train d'être classifiée corresponde à la classe. La première valeur de la liste est la probabilité que l'image corresponde à la classe 0, la suivante à un 1, etc.

Pour notre cas, la valeur qui nous est affichée est un 9 car il possède la probabilité la plus forte.

### Comment savez-vous comment cette liste vous dit que l'item que vous prédisez est une botte ?


1.   Il n'y a pas assez d'information pour répondre à cette question
2.   Le 10ème élément de la liste est le plus grand, et la botte est représentée par le label 9
3.   La botte est labellée par 9, et il y a 0->9 élements dans la liste.

### Réponse

La réponse correcte est la 2. Chaque liste commence par l'index 0, et le label 9 correspondant à la botte signifie qu'il s'agit de la 10ème classe. La liste contenant la plus grande valeur à son dixième élément signifie que le réseau de neurones a prédit que l'item donné en entrée etait classifiée en tant que botte. 

## Exercice 2: 

Regardez maintenant les couches du modèles. Expérimentez différentes valeurs pour le dense layer avec 512 neurones.
Quels résultats différents obtenez vous pour la loss, le temps d'entraînement etc. ? Pourquoi pensez-vous qu'il y a ces différences ?

In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(train_X, train_Y) ,  (test_X, test_Y) = mnist.load_data()

train_X = train_X/255.0
test_X = test_X/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(train_X, train_Y, epochs=5)

model.evaluate(test_X, test_Y)

classifications = model.predict(test_X)

print(classifications[0])
print(test_Y[0])

### Question 1. Augmentez le à 1024 neurones, quel est l'impact ? 

1. L'entraînement prend plus de temps, mais est plus précis
2. L'entraînement prend plus de temps, mais n'a pas d'impact sur la précision
3. L'entraînement prend le même temps, mais est plus précis

#### Réponse

La réponse correcte est la réponse 1. En ajoutant plus de neurones, nous avons davantage de calculs, ce qui augmente le temps d'entraînement. Mais dans ce cas là vous avez une meilleure précision. Par contre, cela ne signifie pas que 'plus, c'est meilleur'. Vous l'aurez l'occasion de comprendre cela plus tard.

## Exercice 3: 

Que se passe-t-il si vous retirez le layer Flatten() ? A votre avis, qu'est ce que l'entraînement vous donnera comme résultat ?

Vous aurez une erreur sur le shape des données. En effet, une couche ne peut pas contenir des neurones de 28x28, il faut plutôt la flatten, de façon à ce que ce 28x28 soit converti en 784x1. Au lieu d'écrire tout le code vous même, vous pouvez directement faire appel à Flatten() au tout début.

In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(train_X, train_Y) ,  (test_X, test_Y) = mnist.load_data()

train_X = train_X/255.0
test_X = test_X/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(train_X, train_Y, epochs=5)

model.evaluate(test_X, test_Y)

classifications = model.predict(test_X)

print(classifications[0])
print(test_Y[0])

## Exercice 4: 

Analysez la couche finale (couche d'output). Pourquoi doit elle contenir 10 neurones ? Que se passe-t-il si vous mettez un nombre différent de 10 ? Essayez par exemple avec 5

Vous obtenez directement une erreur. En effet, vos labels correspondent à 10 classes.

In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(train_X, train_Y) ,  (test_X, test_Y) = mnist.load_data()

train_X = train_X/255.0
test_X = test_X/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(train_X, train_Y, epochs=5)

model.evaluate(test_X, test_Y)

classifications = model.predict(test_X)

print(classifications[0])
print(test_Y[0])

## Exercice 5: 

Essayez maintenant d'ajouter des couches supplémentaires dans le réseau. Que se passe-t-il si vous ajouter une autre couche entre celle contenant 512 neurones et celles en contenant 10 ?

Réponse: Il n'y pas d'impact significatif, car il s'agit de données plutôt simples. Pour des données plus complexes, ajouter une couche de neurones peut s'avérer utile (rappelez vous votre jeu de données "fleur")

In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(train_X, train_Y) ,  (test_X, test_Y) = mnist.load_data()

train_X = train_X/255.0
test_X = test_X/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(train_X, train_Y, epochs=5)

model.evaluate(test_X, test_Y)

classifications = model.predict(test_X)

print(classifications[0])
print(test_Y[0])

# Exercice 6: 

Essayez d'entraîner vos données avec plus ou moins d'epochs. Que pensez-vous du résultat ?

Essayez avec 15 epochs: vous aurez sûrement un modèle avec une meilleure loss que celui avec 5 epoch

Essayez avec 30 epochs: vous verrez que la loss cesse de diminuer, et qu'elle augmente parfois. Il s'agit de l'overfitting. Suivez votre entraînement, cela ne sert à rien de continuer à entraîner un modèle s'il a déjà atteint ses meilleures performances, n'est ce pas ? ;) 

In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(train_X, train_Y) ,  (test_X, test_Y) = mnist.load_data()

train_X = train_X/255.0
test_X = test_X/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(train_X, train_Y, epochs=5)

model.evaluate(test_X, test_Y)

classifications = model.predict(test_X)

print(classifications[34])
print(test_Y[34])

### Exercice 7: 

Avant votre entraînement, vous aviez normalisé vos données de façon à ce que vos valeurs 0-255 passent à 0-1.Que se passerait-il si vous retirez cette étape ? Essayez le code suivant. A votre avis, pourquoi vous obtenez des résultats différents ?

In [None]:
import tensorflow as tf
print(tf.__version__)

mnist = tf.keras.datasets.fashion_mnist

(train_X, train_Y) ,  (test_X, test_Y) = mnist.load_data()

train_X = train_X/255.0
test_X = test_X/255.0

model = tf.keras.models.Sequential([tf.keras.layers.Flatten(),
                                    tf.keras.layers.Dense(512, activation=tf.nn.relu),
                                    tf.keras.layers.Dense(10, activation=tf.nn.softmax)])

model.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy')

model.fit(train_X, train_Y, epochs=5)

model.evaluate(test_X, test_Y)

classifications = model.predict(test_X)

print(classifications[0])
print(test_Y[0])

### Exercice 8: 

Tout à l'heure, vous avez entraîné votre modèle avec trop d'epochs et votre loss ne changeait pas. Vous aviez dû attendre pour obtenir le résultat final, et vous vous dîtes que ce serait bien si vous pouviez interrompre l'entraînement dès qu'une certaine valeur a été atteinte. Par exemple, vous estimez qu'un accuracy à 95% vous suffit et si vous arrivez à l'obtenir au bout de 3 epochs, pouquoi en attendre encore plus ? Donc commment faire pour stopper l'entraînement ? Vous avez ... les callbacks ! Regardons les en action.

In [None]:
import tensorflow as tf
print(tf.__version__)

class myCallback(tf.keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs={}):
    if(logs.get('loss')<0.4):
      print("\nAtteint 60% d'accuracy donc on coupe l'entraînement !")
      self.model.stop_training = True

callbacks = myCallback()
mnist = tf.keras.datasets.fashion_mnist
(train_X, train_Y), (test_X, test_Y) = mnist.load_data()
train_X=train_X/255.0
test_X=test_X/255.0
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(512, activation=tf.nn.relu),
  tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')
model.fit(train_X, train_Y, epochs=5, callbacks=[callbacks])