# Régression linéaire avec TensorFlow

Dans ce notebook, on va voir comment utiliser TensorFlow pour entraîner un modèle de régression linéaire sur le jeu de données de *Boston* de Sklearn.
Le but sera de prédire  le prix des maisons en fonction de leurs caractéristiques.

## Importation des packages

In [None]:
pip install scikit-learn==1.1

In [None]:
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error
from sklearn.preprocessing import StandardScaler

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

import tensorflow as tf
from tensorflow.keras.layers import Dense
from tensorflow.keras.models import Sequential
from tensorflow.keras.losses import MeanAbsoluteError
from tensorflow.keras.optimizers import SGD

## Importation des données

In [None]:
boston = load_boston()
X = pd.DataFrame(data=boston['data'], columns=boston['feature_names'])

X_train, X_test, y_train, y_test = train_test_split(X, boston['target'], test_size=0.33, random_state=42)

std_scaler = StandardScaler().fit(X_train, y_train)

X_train  =  std_scaler.transform(X_train)
X_test = std_scaler.transform(X_test)

X_train_tf = tf.convert_to_tensor(X_train)
X_test_tf = tf.convert_to_tensor(X_test)
y_train_tf = tf.convert_to_tensor(y_train)
y_test_tf = tf.convert_to_tensor(y_test)

## Création de l'architecture

La fonction `Dense` permet d'initialiser les poids pour la régression linéaire et d'effectuer une multiplication matricielle entre les poids et les exemples d'entraînement. Utilisez les paramètres `units` et `input_shape` pour spécifier le nombre d'entrées et de sorties de la couche.

Pour plus d'informatons, n'hésitez pas à lire la [documentation](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense).

La fonction `Dense` sera déclarée dans un modèle via la fonction `Sequential`.

Pour plus d'informatons, n'hésitez pas à lire la [documentation](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential).


In [None]:
def linear_regression(input_shape:int, output_shape:int)->tf.keras.models.Sequential:
  ### Your Code ###
  return None

Initialisez le modèle.

In [None]:
rl_model = linear_regression(input_shape=13, output_shape=1)

In [None]:
rl_model.summary()

Prédire notre jeu d'entraînement.

Utilisez la méthode `predict` du modèle pour appliquer le modèle `rl_model` sur le jeu de données `X_train_tf`.

In [None]:
prediction = None

Utilisez la fonction `mean_absolute_error` de Scikit-learn pour calculer la MAE (erreur absolue moyenne) entre les prédictions du modèle aléatoire `prediction` et les valeurs réelles du jeu de données `y_train`.








In [None]:
None

## Définir la fonction de coût

Vous allez maintenant initialiser votre fonction de coût.

Vous pouvez consulter les différentes fonctions de coût implémentées par TensorFlow dans la [documentation](https://www.tensorflow.org/api_docs/python/tf/keras/losses).

Pour ce notebook utilisez `MeanAbsoluteError`.

In [None]:
### Your code ###
loss = None

## Définir l'algorithme d'optimisation

Vous allez maintenant initialiser votre fonction d'optimisation, qui aura pour rôle de mettre à jour les poids du modèle. Il existe des variantes de la descente de gradient, conçues pour être plus rapides et performantes.

Vous pouvez consulter les différents algorithmes d'optimisation implémentés par TensorFlow dans la [documentation](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers).

Dans ce notebook, vous allez utiliser la descente de gradient stochastique, l'algorithme de base appelé `SGD` dans TensorFlow.

Utilisez comme paramètre `learning_rate=0.1`

In [None]:
### Your code ###
opt = None

## Définir la fonction d'entraînement

Vous allez maintenant initialiser la fonction d'entraînement de votre modèle en utilisant le model, la fonction de coût et l'algorithme d'optimisation.

N'hésitez pas à regarder dans la [documentation](https://www.tensorflow.org/api_docs/python/tf/GradientTape) pour en apprendre plus sur le calcul des gradients.

In [None]:
def step(model:tf.Sequential, opt:tf.keras.optimizers, loss:tf.keras.losses, x_train:np.ndarray, y_train:np.ndarray)->tuple:

  # garder la trace de nos gradients
  with tf.GradientTape() as tape:

    ### Your code ###

    # faire une prédiction en utilisant le modèle
	  pred = None

    # Calculer le coût
	  train_loss = None

	# calculer les gradients en utilisant tape
  grads = None

  # mettre à jour les poids du modèle
  # Aide : Utiliser la fonction apply_gradients de opt


  return model, train_loss

## Entraîner le modèle

Il est maintenant temps d'entraîner le modèle

In [None]:
epoch = 1000
history_train = []
history_test = []

# nombre d'epochs
for e in range(epoch) :

  # mise à jour des poids
  rl_model, train_loss = step(rl_model, opt, loss, X_train_tf, y_train_tf)

  # prédiction sur le jeu de test
  test_pred = rl_model(X_test_tf)
  test_loss = mean_absolute_error(test_pred, y_test)

  # sauvegarde des coûts
  history_train = np.append(history_train, train_loss)
  history_test = np.append(history_test, test_loss)

  print('train_loss : '+str(np.squeeze(train_loss))+ ' test_loss : '+str(test_loss))


Visualisez de l'évolution de la performance du modèle pendant l'entraînement.

In [None]:
plt.plot(np.arange(epoch), history_train, label='train loss')
plt.plot(np.arange(epoch), history_test, label='test loss')
plt.xlabel('Epochs')
plt.ylabel('MAE')
plt.legend()
plt.show()

## Sauvegarde du modèle

Maintenant que le modèle est entraîné, il est temps de le sauvegarder.

Sauvegarder les poids du modèle grâce à la méthode `save_weights`

In [None]:
None

Remplacez le modèle entraîné par un nouveau modèle dont les poids sont initialisés aléatoirement.

In [None]:
rl_model = linear_regression(input_shape=13, output_shape=1)

In [None]:
prediction = rl_model(X_train_tf)
mean_absolute_error(prediction, y_train)

Étant donné que les poids du modèle sont initialisés de manière aléatoire, les performances sont faibles.

Nous pouvons restaurer nos poids entraînés en chargeant les poids précédemment sauvegardés.

Chargez les poids du modèle grâce à la méthode `load_weights`.

In [None]:
None

In [None]:
prediction = rl_model(X_train_tf)
mean_absolute_error(prediction, y_train)

Maintenant que les poids du modèle entraîné ont été chargés, la performance du modèle est nettement améliorée.