<a href="https://colab.research.google.com/github/gael-roustan-epsi-2022/ia-notebooks/blob/main/Linear_Regression_with_Synthetic_Data.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
#@title Copyright 2020 Google LLC. Double-click here for license information.
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Simple Linear Regression with Synthetic Data

Nous allons expérimenter colab et tf.keras avec une base de données prête à l'emploi.

## Utiliser la bonne version de TensorFlow

Le code suivant permet de fixer la version de tensorflow que l'on souhaite utiliser, à savoir la plus récente, la 2.x (2.8)

In [None]:
#@title Run this Colab on TensorFlow 2.x
%tensorflow_version 2.x

## Import des modules essentiels à la suite des opérations

La cellule suivante importe les 3 modules que nous souhaitons utiliser :


In [None]:
import pandas as pd
import tensorflow as tf
from matplotlib import pyplot as plt

## Fonctions pour construire et entraîner le modèle

Les 2 fonctions ci-après :

  * `build_model(my_learning_rate)`, construit un modèle vide.
  * `train_model(model, feature, label, epochs)`, entraîne un modèle à partir des données exemples (caractéristique et résultat) qu'on lui passe. 

Il n'y a aucun code à ajouter/modifier de votre part.

In [None]:
#@title Fonctions de création et d'entrainement de modèle
def build_model(my_learning_rate):
  """Create and compile a simple linear regression model."""
  # Most simple tf.keras models are sequential. 
  # A sequential model contains one or more layers.
  model = tf.keras.models.Sequential()

  # Describe the topography of the model.
  # The topography of a simple linear regression model
  # is a single node in a single layer. 
  model.add(tf.keras.layers.Dense(units=1, 
                                  input_shape=(1,)))

  # Compile the model topography into code that 
  # TensorFlow can efficiently execute. Configure 
  # training to minimize the model's mean squared error. 
  model.compile(optimizer=tf.keras.optimizers.RMSprop(lr=my_learning_rate),
                loss="mean_squared_error",
                metrics=[tf.keras.metrics.RootMeanSquaredError()])

  return model           


def train_model(model, feature, label, epochs, batch_size):
  """Train the model by feeding it data."""

  # Feed the feature values and the label values to the 
  # model. The model will train for the specified number 
  # of epochs, gradually learning how the feature values
  # relate to the label values. 
  history = model.fit(x=feature,
                      y=label,
                      batch_size=batch_size,
                      epochs=epochs)

  # Gather the trained model's weight and bias.
  trained_weight = model.get_weights()[0]
  trained_bias = model.get_weights()[1]

  # The list of epochs is stored separately from the 
  # rest of history.
  epochs = history.epoch
  
  # Gather the history (a snapshot) of each epoch.
  hist = pd.DataFrame(history.history)

  # Specifically gather the model's root mean 
  #squared error at each epoch. 
  rmse = hist["root_mean_squared_error"]

  return trained_weight, trained_bias, epochs, rmse

print("Defined create_model and train_model")

## Fonctions de visualisation

C'est  [Matplotlib](https://developers.google.com/machine-learning/glossary/#matplotlib) qui est utilisé pour visualiser les 2 graphiques :

* un graphique qui représente la caractéristique en fonction du résultat
* une [courbe d'écart](https://developers.google.com/machine-learning/glossary/#loss_curve).

Idem, pas de code à modifier, supprimer ou ajouter de votre part.

In [None]:
#@title Define the plotting functions
def plot_the_model(trained_weight, trained_bias, feature, label):
  """Plot the trained model against the training feature and label."""

  # Label the axes.
  plt.xlabel("feature")
  plt.ylabel("label")

  # Plot the feature values vs. label values.
  plt.scatter(feature, label)

  # Create a red line representing the model. The red line starts
  # at coordinates (x0, y0) and ends at coordinates (x1, y1).
  x0 = 0
  y0 = trained_bias
  x1 = feature[-1]
  y1 = trained_bias + (trained_weight * x1)
  plt.plot([x0, x1], [y0, y1], c='r')

  # Render the scatter plot and the red line.
  plt.show()

def plot_the_loss_curve(epochs, rmse):
  """Plot the loss curve, which shows loss vs. epoch."""

  plt.figure()
  plt.xlabel("Epoch")
  plt.ylabel("Root Mean Squared Error")

  plt.plot(epochs, rmse, label="Loss")
  plt.legend()
  plt.ylim([rmse.min()*0.97, rmse.max()])
  plt.show()

print("Defined the plot_the_model and plot_the_loss_curve functions.")

## Définition du jeu de données

Le jeu de données contient 12 [exemples](https://developers.google.com/machine-learning/glossary/#example). Chaque exemple est constitué d'une [caractéristique](https://developers.google.com/machine-learning/glossary/#feature) et d'un [résultat associé](https://developers.google.com/machine-learning/glossary/#label).


In [None]:
my_feature = ([1.0, 2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0, 10.0, 11.0, 12.0])
my_label   = ([5.0, 8.8,  9.6, 14.2, 18.8, 19.5, 21.4, 26.8, 28.9, 32.0, 33.8, 38.2])

## Personnaliser les hyperparamètres

Les hyperparamètres dans ce script sont les suivants:

  * [taux d'apprentissage](https://developers.google.com/machine-learning/glossary/#learning_rate)
  * [essais](https://developers.google.com/machine-learning/glossary/#epoch)
  * [taille du jeu de données](https://developers.google.com/machine-learning/glossary/#batch_size)

La prochaine section initialise les hyperparamètres.

In [None]:
learning_rate=0.01
epochs=10
my_batch_size=12

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                         my_label, epochs,
                                                         my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

## Exercice 1: Examiner les graphiques

Analyser en premier le graphique du haut. Les points bleus représentent les valeurs réellement obtenus et la ligne rouge représente la sortie du modèle entraîné. Idéalement, la ligne rouge passe par tous les points bleus.

A ce stage, normalement, la ligne rouge est loin de passer par tous les points bleus.

Examiner le graphique du bas, qui montre l'évolution de l'erreur. Remarquez que la courbe ne s'aplatit pas, ce qui signifie que l'on atteint pas le comportement limite, c'est donc que le modèle n'as pas été assez entraîne.


## Exercice 2: Augmenter le nombre de tests à réaliser

L'écart d'entraînement devrait décroitre, rapidement au début, puis plus lentement au fur et à mesure jusqu'à avoir un coefficient directeur proche de 0, ce qui signifierai qu'elle [converge](http://developers.google.com/machine-learning/glossary/#convergence).

Dans l'exercice 1, l'écart d'entraînement ne converge pas. L'une des possibilités est qu'il entraîner le modèle sur un plus grand nombre d'itérations.
Vous devez augmenter le nombre d'epochs afin de constater que l'écart d'entraînement converge. Augmenter la valeur par petits écarts (pas plus de 100).

Est-ce que le modèle finit par converger ?


In [None]:
learning_rate=0.01
epochs= ?   # Replace ? with an integer.
my_batch_size=12

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                        my_label, epochs,
                                                        my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

## Exercice 3: Augmenter le taux d'apprentissage

Dans l'exercice précédent, nous avons augmenté le nombre d'itérations pour faire converger le modèle. Il est également possible de faire converger le modèle plus rapidement, c'est à dire avec moins d'itérations, en augmenter le taux d'apprentissage. Attention cependant à ne pas augmenter trop le taux d'apprentissage, ce qui risque de rendre impossible la convergence de votre modèle.


In [None]:
# Increase the learning rate and decrease the number of epochs.
learning_rate=200 
epochs=500 

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                         my_label, epochs,
                                                         my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

Le résultat n'est pas bon, puisque la ligne rouge ne s'aligne pas du tout avec les points bleus. De plus, la courbe de l'écart ressemble à des montagnes russes et ne converge donc jamais.
Une courbe avec une allure oscillatoire de la sorte marque un taux d'apprentissage trop élevé.

## Exercice 4: Trouver la combinaison idéale entre le nombre de tests et le taux d'apprentissage

Essyare différentes valeurs pour les 2 hyperparamètres suivants afin que la courbe de l'écart converge le plus rapidement possible

*  learning_rate
*  epochs

In [None]:
# Set the learning rate and number of epochs
learning_rate= ?  # Replace ? with a floating-point number
epochs= ?   # Replace ? with an integer

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                         my_label, epochs,
                                                         my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)

## Exercice 5: Ajuster la taille du nombre d'échantillons considérés pour le calcul de l'écart

Le système recalcule l'écart du modèle et ajuste le poids et le biais après chaque **itération**. Une itération est une portée dans laquelle le système traite un batch. Par exemple, si la **taille du batch** est 6, alors le système recalcul l'écart et ajuste le poids et le biais après avoir traité 6 examples.

Un **epoch** porte suffissament d'itérations pour traiter chaque exemple dans le jeu de données. Par exemple, si la taille du batch est 12, alors chaque epoch dure 1 iteration. En revanche, si la taille du batch est 6, alors chaque epoch consomme 2 itérations.

Il est toujours tentant de paramétrer la taille du batch au nombre d'exemples dans le jeu de données (12 dans notre cas). Cependant, le modèle peut être entrainé plus rapidement sur des batchs de plus petite taille. Et inversement, des batchs trop petits peuvent ne pas contenir suffisamment d'information à chaque fois pour aider le modèle à converger vers les valeurs de poids et de biais optimales.

Essayer de voir les impacts de valeur du `batch_size` dans la cellule de code suivant. Quel est le plus petit entier pour lequel le modèle converge en moins d'une centaine d'epochs ?


In [None]:
learning_rate=0.05
epochs=100
my_batch_size= ?  # Replace ? with an integer.

my_model = build_model(learning_rate)
trained_weight, trained_bias, epochs, rmse = train_model(my_model, my_feature, 
                                                        my_label, epochs,
                                                        my_batch_size)
plot_the_model(trained_weight, trained_bias, my_feature, my_label)
plot_the_loss_curve(epochs, rmse)