### **Cours Deep Learning T. Masrour 2021 - Filière GI-IADS.**







# Exemple  : Prédire les degrès celsius en fonction des degrès Fahrenheit




###**Position du problème**
Nous essaierons de garder les choses simples ici et de n'introduire que des concepts de base. Les Colabs ultérieurs couvriront des problèmes plus avancés.

Le problème que nous allons résoudre est de convertir des degrés Celsius en degrés Fahrenheit, où la formule approximative est :

$$ fahrenheit = celsius \times 1.8 + 32 $$


Bien sûr, il serait assez simple de créer une fonction Python conventionnelle qui effectue directement ce calcul, mais ce ne serait pas du machine learning.


Au lieu de cela, nous allons donner à TensorFlow quelques exemples de valeurs Celsius (0, 8, , 10, 15, 22, 30, 38) et leurs valeurs Fahrenheit correspondantes (32, 46, 50, 59, 72, 86, 100).

Ensuite, nous formerons un modèle qui comprend la formule ci-dessus tout au long du processus de formation.

## Import des libraries 
Tout d'abord, importez TensorFlow. Ici, nous l'appelons « tf » pour plus de facilité d'utilisation. Nous lui disons également de n'afficher que les erreurs.

Ensuite, import [NumPy](http://www.numpy.org/) as `np`. Numpy nous aide à représenter nos données sous forme de listes hautement performantes.

In [None]:
import tensorflow as tf
print("La Version actuelle de tensorflow est ", tf.__version__)

In [None]:
import numpy as np
import logging
logger = tf.get_logger()
logger.setLevel(logging.ERROR)

## Configurer le data d'entraînement

Étant donné que la tâche de ce Codelab est de créer un modèle qui peut donner la température en degrés Fahrenheit lorsque les degrés Celsius sont donnés, nous créons deux listes `x_celsius` et `y_fahrenheit` que nous pouvons utiliser pour entraîner notre modèle.

In [None]:
x_celsius    = np.array([-40, -10,  0,  8, 10, 15, 22, 30,  38],  dtype=float)
y_fahrenheit = np.array([-40,  14, 32, 46, 50, 59, 72, 86, 100],  dtype=float)

for i,c in enumerate(x_celsius):
  print("{} degrés Celsius = {} degrés Fahrenheit".format(c, y_fahrenheit[i]))

### Visualisons notre jeu de Données

In [None]:
# ----- On peut aussi dessiner le jeu de données via matplotlib
import matplotlib.pyplot as plt
plt.xlabel('Celsius')
plt.ylabel("Fahrenheit")
plt.scatter(x_celsius, y_fahrenheit)
plt.show()

### Rappel de la terminologie

 - **Feature** — Les entrées (***input***) de notre modèle. Dans ce cas, une seule valeur — les degrés Celsius.

 - **Labels** — Les sorties (***output*** que notre modèle va prédire. Dans ce cas, une seule valeur — les degrés en Fahrenheit.

 - **Example** ou bien **Sample**— Une paire input/output utilisée durant l'entraînement. Dans notre cas un couple formé d'une valeur de la liste  `x_celsius` et la valeur qui lui correspond dans `y_fahrenheit` càd à un certain indice spécifique, par exemple : `(15,59)`.


## Création du modèle

Ensuite, créez le modèle. Nous utiliserons le modèle le plus simple possible, un réseau dense. Le problème étant simple, ce réseau ne nécessitera qu'une seule couche, avec un seul neurone.

### Construire une couche

Nous appellerons la couche "l0" et la créerons en instanciant "tf.keras.layers.Dense" avec la configuration suivante :

*   `input_shape=[1]` — Ceci spécifie que l'entrée de cette couche est une valeur unique. C'est-à-dire que la forme est un tableau à une dimension avec un membre. Comme il s'agit de la première (et unique) couche, cette forme d'entrée est la forme d'entrée de l'ensemble du modèle. La valeur unique est un nombre à virgule flottante, représentant les degrés Celsius.

*   `units=1` — Ceci spécifie le nombre de neurones dans la couche. Le nombre de neurones définit combien de variables internes la couche doit essayer d'apprendre à résoudre le problème (plus tard). Puisqu'il s'agit de la couche finale, il s'agit également de la taille de la sortie du modèle - une seule valeur flottante représentant les degrés Fahrenheit. (Dans un réseau multicouche, la taille et la forme de la couche devraient correspondre à la "forme d'entrée" de la couche suivante.)


In [None]:
l0 = tf.keras.layers.Dense(units=1, input_shape=[1])

### Assembler les couches dans le modèle

Une fois les couches définies, elles doivent être assemblées dans un modèle. La définition de modèle séquentiel prend une liste de couches comme argument, spécifiant l'ordre de calcul de l'entrée à la sortie.

Ce modèle n'a qu'une seule couche, l0.

In [None]:
model = tf.keras.Sequential([l0])

**Remarque**

Vous verrez souvent les couches définies à l'intérieur de la définition du modèle, plutôt qu'avant. Comme ceci :

```python
model = tf.keras.Sequential([
  tf.keras.layers.Dense(units=1, input_shape=[1])
])
```

## Compiler le modèle, avec la fonction erreur (loss) et l'optimiseur (Optimizer)

Avant l'entraînement, il faut compiler le modèle. Une fois compilé, le modèle dispose de :

- **Loss function** — La façon de mesurer à quel point les prédictions sont éloignées du résultat souhaité. (La différence mesurée est appelée la "perte", l' "erreur"  ou encore "Loss".)

- **Optimizer function** — La manière d'ajuster les valeurs internes afin de réduire l'erreur (le loss).


In [None]:
model.compile(loss='mean_squared_error',
              optimizer=tf.keras.optimizers.Adam(0.1))

Ceux-ci sont utilisés pendant l'entraînement (`model.fit()`, ci-dessous) pour d'abord calculer le loss à chaque point, puis l'améliorer. En fait, le fait de calculer l'erreur actuelle (actual loss) d'un modèle, puis de l'améliorer, c'est précisément ce qu'est l'entraînement ou l'apprentissage.

Pendant l'apprentissage, la fonction d'optimisation est utilisée pour calculer les ajustements des variables internes du modèle. L'objectif est d'ajuster les variables internes jusqu'à ce que le modèle (qui est vraiment une fonction mathématique) reflète l'équation réelle pour convertir Celsius en Fahrenheit.

TensorFlow utilise une analyse numérique pour effectuer ce réglage, et toute cette complexité est cachée. Ce qu'il est utile de savoir sur ces paramètres sont :

La fonction de perte ([Mean_squared_error][erreur_quadratique_moyenne](https://en.wikipedia.org/wiki/Mean_squared_error)) et l'optimiseur ([Adam](https://machinelearningmastery.com/adam-optimization-algorithm-for-deep-learning/)) utilisés ici sont standard pour des modèles simples comme celui-ci, mais de nombreux autres sont disponibles. 

Une partie de l'optimiseur à laquelle vous devrez peut-être penser lors de la création de vos propres modèles est le taux d'apprentissage **Learning rate** (`0.1` dans le code ci-dessus). Il s'agit de la taille de pas prise lors de l'ajustement des valeurs dans le modèle. Si la valeur est trop petite, il faudra trop d'itérations pour entraîner le modèle. Trop grand et la précision diminue. Trouver une bonne valeur implique souvent des essais et des erreurs, mais la plage est généralement comprise entre 0,001 (par défaut) et 0,1

### On peut visualiser le modèle de differentes manières:

In [None]:
print(model.summary())

In [None]:
from keras.utils.vis_utils import plot_model
plot_model(model, to_file='model_plot.png', show_shapes=True, show_layer_names=True)

## Entraînement du modèle

Entraînez le modèle en appelant la méthode `fit`.

Pendant l'entraînement, le modèle prend des valeurs Celsius, effectue un calcul à l'aide des variables internes actuelles (appelées «poids» ou «paramètres ») et génère des valeurs qui sont censées être l'équivalent en Fahrenheit. Étant donné que les poids sont initialement définis de manière aléatoire, la sortie ne sera pas proche de la valeur correcte. La différence entre la sortie réelle et la sortie souhaitée est calculée à l'aide de la fonction de perte, et la fonction d'optimisation indique comment les poids doivent être ajustés.

Ce cycle de calcul, comparaison, ajustement est contrôlé par la méthode « fit ». Le premier argument correspond aux entrées, le deuxième argument correspond aux sorties souhaitées. L'argument `epochs` spécifie combien de fois ce cycle doit être exécuté, et l'argument `verbose` contrôle la quantité de sortie produite par la méthode.

In [None]:
history = model.fit(x_celsius, y_fahrenheit, epochs=500, verbose=False)
print("L'entraînement du modèle est terminé")

## Afficher les statistiques d'entraînement

La méthode `fit` renvoie un objet d'historique. Nous pouvons utiliser cet objet pour tracer comment la perte de notre modèle diminue après chaque époque d'entraînement. Une perte élevée signifie que les degrés Fahrenheit prédits par le modèle sont loin de la valeur correspondante en "fahrenheit_a".

Nous utiliserons [Matplotlib](https://matplotlib.org/) pour visualiser cela (vous pouvez utiliser un autre outil). Comme vous pouvez le voir, notre modèle s'améliore très rapidement au début, puis présente une amélioration constante et lente jusqu'à ce qu'il soit très proche de la "parfaite" vers la fin.


In [None]:
import matplotlib.pyplot as plt
plt.xlabel("Epoch)")
plt.ylabel("Loss")
plt.plot(history.history['loss'])

## UUtiliser le modèle pour prédire les valeurs

Vous avez maintenant un modèle qui a été formé pour apprendre la relation entre `celsius_q` et `fahrenheit_a`. Vous pouvez utiliser la méthode de prédiction pour lui faire calculer les degrés Fahrenheit pour des degrés Celsius auparavant inconnus.

Ainsi, par exemple, si la valeur Celsius est de 100, que pensez-vous que le résultat Fahrenheit sera ? Faites une supposition avant d'exécuter ce code.

In [None]:
print(model.predict([100.0]))

La bonne réponse est $ 100  \times 1,8 + 32 = 212 $, donc notre modèle se comporte très bien.

### Recap!


* Nous avons créé un modèle avec une couche Dense
* Nous l'avons entraîné avec 3500 exemples (7 paires sur 500 époques).

Notre modèle a ajusté les variables (poids) dans la couche dense jusqu'à ce qu'il soit capable de renvoyer la valeur Fahrenheit correcte pour n'importe quelle valeur Celsius. (Rappelez-vous, 100 degrés Celsius ne faisaient pas partie de nos données d'entraînement.)


## Regardons les paramètres de la seule couche de notre modèle
Imprimons les variables internes de la couche Dense.

In [None]:
print("Ce sont les paramètres de notre couche: {}".format(l0.get_weights()))

La première variable est proche de ~1,8 et la seconde de ~32. Ces valeurs (1,8 et 32) sont les variables réelles dans la formule de conversion réelle.

C'est très proche des valeurs de la formule de conversion. Nous expliquerons cela dans une prochaine vidéo où nous montrons comment fonctionne une couche dense, mais pour un seul neurone avec une seule entrée et une seule sortie, le calcul interne ressemble à ce qu'on a en cours, $y = mx + b$, qui a la même forme que l'équation de conversion, $f = 1.8c + 32$.

Puisque la forme est la même, les variables devraient converger vers les valeurs standard de 1,8 et 32, ce qui est exactement ce qui s'est passé.

Avec des neurones supplémentaires, des entrées supplémentaires et des sorties supplémentaires, la formule devient beaucoup plus complexe, mais l'idée est la même.



### Exercie - Une petite expérience

Si on créait 3 réseaux plus denses avec des unités différentes, qui ont donc aussi plus de variables, que se passerait-il ?

In [None]:
# Réseau 1

#l0 = tf.keras.layers.Dense(units=???, input_shape=[1])
#l1 = tf.keras.layers.Dense(units=???)
#l2 = tf.keras.layers.Dense(units=???)
#..................

#..................
#..................


plt.xlabel("Epoch)")
plt.ylabel("Loss")
plt.plot(history.history['loss'])

##Commentez

In [None]:
# Réseau 2

#l0 = tf.keras.layers.Dense(units=???, input_shape=[1])
#l1 = tf.keras.layers.Dense(units=???)
#l2 = tf.keras.layers.Dense(units=???)
#l3 = tf.keras.layers.Dense(units=???)

#..................

#..................
#..................


plt.xlabel("Epoch)")
plt.ylabel("Loss")
plt.plot(history.history['loss'])

##Commentez

In [None]:
# Réseau 3

#l0 = tf.keras.layers.Dense(units=???, input_shape=[1])
#l1 = tf.keras.layers.Dense(units=???)
#l2 = tf.keras.layers.Dense(units=???)
#l3 = tf.keras.layers.Dense(units=???)
#l4 = tf.keras.layers.Dense(units=???)

#..................

#..................
#..................


##Commentez