<a href="https://colab.research.google.com/github/Twoarms/workshop_python_machine-learning/blob/master/Parcours/2_Machine_Learning/Celcius_to_Farenheit.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Import des dépendances

Nous importons TensorFlow (Librairie machine learning) et lui indiquons de n'afficher que les erreurs, ainsi que NumPy(Librairie Science Computing)

In [0]:
# Cette ligne est là pour des raisons de compatibilité
from __future__ import absolute_import, division, print_function
#TensorFlow
import tensorflow as tf
tf.logging.set_verbosity(tf.logging.ERROR)
#NumPy
import numpy as np

# Données d'entrainement

Nous créons les données sur lesquelles l'algorithme va s'entrainer. Nous lui donnons une liste d'input et d'ouput, la fonction de notre algorithme va être de découvrir comment obtenir les output donnés à partir des inputs donnés.

In [0]:
# Feature*
celsius_q    = np.array([-40, -10,  0,  8, 15, 22,  38],  dtype=float)
# Labels*
fahrenheit_a = np.array([-40,  14, 32, 46, 59, 72, 100],  dtype=float)

for i,c in enumerate(celsius_q):
  print("{} degrees Celsius = {} degrees Fahrenheit".format(c, fahrenheit_a[i]))

Note : Chaque terme suivi d'un astérique sera expliqué dans le glossaire, il s'agit (généralement) d'un mot propre à la terminologie du machine learning.

# Création d'un modèle

Il existe différentes sortes de modèles, nous utiliserons ici le plus simple, le "Dense network".
C'est un type de réseau neuronal où chaque neurone d'une couche(layer) est relié à chacun des neurones de la couche précédente.

Le problème présenté ici étant assez simple et direct, le réseau sera composé d'une seule couche avec un seul neurone.

### Création du layer*

Nous appelerons cette couche ```l0```  (C'est un L comme layer, pas un 1)

In [0]:
l0 = tf.keras.layers.Dense(units=1, input_shape=[1]) 

Décortiquons ce code :

Nous instancions ```tf.keras.layers.Dense``` pour créer le fameux réseau Dense.

```units=1``` signifie que la couche n'est consituée que d'un neurone. C'est le nombre de neurones qui déterminera le nombre de variables internes cachées que la couche devra essayer pour apprendre à régler le problème.

Comme cette couche est la couche finale, 1 est également la taille de l'output du modèle : notre température en Farenheit

```input_shape=[1]``` signifie que l'input pour cette couche est une seule valeur (Un tableau unidimensionnel d'une seule valeur) : notre température en Celsius

Dans le cas d'un modèle multicouche, la taille et la forme d'une couche doit correspondre à l'input_shape de la prochaine couche.

### Création du modèle par assemblage des couches

Une fois que les couches sont définies, elles doivent être assemblées pour former le modèle. La définition séquentielle du modèle prend une liste de couches en argument et définit l'ordre de calcul de l'input jusqu'à l'output.

Ce modèle est constitué d'une unique couche : ```l0```

In [0]:
model = tf.keras.Sequential([l0])

Note :

Il est possible de définir chaque couche lors de la définitions du modèle plutôt que les définir à l'avance
```
model = tf.keras.Sequential([
  tf.keras.layers.Dense(units=1, input_shape=[1])
])

```

### Compiler le modèle, avec les fonctions perte et optimiseur

Avant de pouvoir entrainer le modèle(le réseau de neurone), il faut le compiler :
Lors de la compilation du modèle, on lui donne une ```fonction perte*``` et une ```fonction optimiseur*```

In [0]:
model.compile(loss='mean_squared_error',
              optimizer=tf.keras.optimizers.Adam(0.1))

Ces fonctions sont utilisées durant l'entrainement, pour calculer la perte à chaque essai et ensuite la diminuer. C'est simplement ce en quoi consiste l'entrainement.

L'optimiseur est utilisé pour calculer les ajustements à produire sur les variables internes(cachées) du modèle dans le but d'approcher l'équation qui convertit les Celsius en Fahrenheit.

Il existe évidemment d'autres fonction perte et optimiseur en fonction de la tâche et de la complexité de celle-ci.

Le ```(0.1)``` de la fonction optimiseur est le taux d'ajustement lors de l'apprentissage, une trop faible valeur prendrait trop d'itérations pour entrainer le modèle, mais une valeur trop importante réduirait la précision. Trouver la bonne valeur est souvent une affaire d'essai-erreur et se trouve souvent dans la fourchette 0.001(valeur par défaut) et 0.1

# Entrainer le modèle

Nous avons nos données d'entraînement, nous avons défini le modèle et les couches qui le composent, nous avons compilé notre modèle...
L'heure est venue d'entrainer celui-ci

Pour ce faire, nous appelons la méthode ```fit```.

Durant l'entrainement, le modèle prend en input les degrés Celsius, effectue des calculs en utilisants les variables internes actuelles (appelées "weights*") et donne en output les valeurs qui sont censées êtres nos degrés Fahrenheit. Les weights sont initiatalement définies au hasard et nos premiers outputs seront donc bien les des valeurs attendues.
La fonction perte calcule la différence entre l'output produit et l'input produit(la perte), et la fonction optimiseur détermine comment vont s'ajuster les weights.

In [0]:
history = model.fit(celsius_q, fahrenheit_a, epochs=500, verbose=False)
print("Finished training the model")


La méthode ```fit``` contrôle les cycles de calcul, comparaison et ajustement. La méthode prends les inputs comme premier argument, l'output attendu comme second argument.

L'argument "epoch" détermine combien de cycles vont êtres éxécutés, et l'argument "verbose" contrôle le nombre d'output produits par la méthode.

La méthode fit retourne un objet "historique". Nous pouvons utiliser cette objet pour représenter graphiquement l'évolution de la perte à chaque "epoch"(cycle).

Nous utilisons la librairie ```Matplotlib``` pour visualiser cela.

In [0]:
import matplotlib.pyplot as plt
plt.xlabel('Epoch Number')
plt.ylabel("Loss Magnitude")
plt.plot(history.history['loss'])

# Utilisation du modèle

Nous avons maintenant un modèle entrainé à prédire des températures en Fahrenheit à partir de températures en Celsius.

Nous allons l'utiliser pour prédire la valeur en Fahrenheit d'une valeur en Celsius inconnue par notre algorithme jusqu'ici.

In [0]:
print(model.predict([100.0]))

La réponse attendue est 100 * 1.8 + 32 = 212. On en est vraiment pas loin !

### Résumé

Nous avons dans un premier temps créé un modèle de type Dense : Un réseau de neurone où chaque neurone de chaque couche est relié à chacun des neurones de la couche précédente. (1 input, 1 couche qui produit un outpout, cela me parait logique)

Nous l'avons entrainé avec 3500 exemples* (7 paires, 500 cycles)

### Petit coup d'oeil aux variables internes

In [0]:
print("Voici les variables internes: {}".format(l0.get_weights()))

Notre première variable est presque de 1.8, la seconde est très proche de 32 qui sont les variables de la vraie formule de conversion. 

Lorsqu'on a un seul input, pour un seul neurone pour un seul outpout, le calcul effectué est semblable à l'équation d'une droite ```y = mx + b``` qui a la même forme que l'équation de conversion Celsius vers Fahrenheit : f = 1.8c + 32

Plus il y a de neurones, d'inputs et d'outputs, plus la formule devient complexe mais c'est toujours le même principe.