# Modélisation d'une fonction linéaire simple

Dans ce tutoriel, nous allons explorer comment utiliser **TensorFlow** pour modéliser la fonction linéaire $f(x) = 2x$ à l'aide d'un **réseau de neurones**. Pour ce faire, nous suivrons ces étapes simples :

Dans ce tutoriel, nous allons explorer comment utiliser TensorFlow pour modéliser la fonction linéaire $f(x) = 2x$ à l'aide d'un réseau de neurones. Pour ce faire, nous suivrons ces étapes simples :

1. **Préparation des données** : Nous allons générer des données d'entraînement en créant des paires d'entrées et de sorties basées sur la fonction $f(x) = 2x$.

2. **Construction du modèle** : Nous allons définir un réseau de neurones simple à l'aide de la bibliothèque TensorFlow. Notre modèle comportera une couche dense avec une seule unité, visant à capturer la relation linéaire.

3. **Compilation du modèle** : Nous choisirons une fonction de perte appropriée, comme l'erreur quadratique moyenne (`mean squared error`), et un optimiseur tel que la descente de gradient stochastique (`SGD`).

4. **Entraînement du modèle** : En utilisant les données générées, nous allons entraîner le modèle pour ajuster ses paramètres, de manière à ce qu'il puisse approximer au mieux la fonction $f(x) = 2x$.

5. **Évaluation des résultats** : Nous évaluerons les performances du modèle en utilisant des données de test et en calculant la perte (`loss`) ainsi que d'autres métriques pertinentes.

En suivant ces étapes, nous allons découvrir comment TensorFlow facilite la création et l'entraînement de modèles de réseaux de neurones pour résoudre des problèmes simples de modélisation de fonctions, jetant ainsi les bases pour aborder des tâches plus complexes à l'avenir.


## 1. Importation des bibliothéques nécessaires

In [None]:
import tensorflow as tf
import numpy as np
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
print("TensorFlow version:", tf.__version__)

## 2. Préparation des données

In [None]:
x_data = np.linspace(0, 10, 10000)
y_data = 2*x_data
print(x_data,y_data,sep="\n")
x_train,x_test,y_train,y_test=train_test_split(x_data, y_data, test_size=0.2, random_state=42,shuffle=False)

print(x_train,x_test,y_train,y_test,sep="\n")


## 3. Construction du modèle

La couche Dense est une des couches les plus fondamentales et les plus utilisées dans TensorFlow et Keras pour construire des réseaux de neurones. Elle est souvent appelée couche pleinement connectée. Voici les principaux paramètres que vous pouvez configurer avec `tf.keras.layers.Dense` :
 * `units` : Le nombre de neurones (unités) dans la couche. C'est un paramètre obligatoire qui définit la dimensionnalité de l'espace de sortie de la couche.
 * `activation` : Fonction d'activation à utiliser. Les choix courants incluent `relu`, `sigmoid`, `softmax`, et `tanh`. Si vous ne spécifiez rien, aucune activation n'est appliquée (c'est-à-dire, une "activation linéaire" avec $a(x) = x$).
 * `kernel_initializer` : Initialisateur pour la matrice des poids. Les valeurs par défaut dépendent de la version de Keras/TensorFlow mais sont généralement `glorot_uniform` ou un initialiseur similaire.
 * `input_shape` : Utilisé pour spécifier la forme des données d'entrée que la première couche de votre réseau de neurones s'attend à recevoir. Ce paramètre est crucial lors de la définition de la première couche dans un modèle séquentiel TensorFlow/Keras, car il aide le modèle à comprendre la dimensionnalité des données d'entrée.

In [None]:
model = tf.keras.models.Sequential([
  tf.keras.layers.Dense(units=1,input_shape=[1])
])

La méthode `model.summary()` dans TensorFlow/Keras fournit un résumé simple du modèle, y compris le nombre de paramètres (poids et biais) de chaque couche et le total dans le modèle. Ce résumé inclut les noms des couches, leurs formes de sortie et le nombre de paramètres. C'est un outil utile pour visualiser et comprendre la structure d'un modèle, surtout pour des modèles complexes.

In [None]:
model.summary()

## 4. Compilation du modèle

La méthode compile est une étape essentielle dans la construction d'un modèle de réseau de neurones avec TensorFlow et Keras. Elle configure le modèle pour l'entraînement, en spécifiant des éléments clés comme la fonction de perte, l'optimiseur et les métriques à évaluer pendant l'entraînement et le test. Voici les principaux paramètres de la méthode compile :
* `optimizer` : Définit l'algorithme d'optimisation à utiliser pour minimiser la fonction de perte. Des exemples courants d'optimiseurs incluent `adam`, `sgd`, `rmsprop`, etc. Vous pouvez également passer une instance d'optimiseur de `tf.keras.optimizers`.
* `loss` : Spécifie la fonction de perte à minimiser, qui mesure à quel point les prédictions du modèle sont éloignées des vraies valeurs. Des exemples courants incluent `sparse_categorical_crossentropy` pour la classification multi-classes avec des étiquettes comme des entiers, `categorical_crossentropy` pour les étiquettes sous forme de vecteurs one-hot, et `mean_squared_error` pour la régression.
* `metrics` : Liste des métriques à évaluer par le modèle pendant l'entraînement et le test. Ces métriques ne sont pas utilisées pour l'entraînement (elles ne contribuent pas à la mise à jour des poids du modèle) mais fournissent des informations utiles sur la performance du modèle. Exemples : `accuracy`, `mae` (erreur absolue moyenne).
* `loss_weights` : Des pondérations facultatives peuvent être attribuées à différentes sorties de modèle, particulièrement utile dans les modèles à sorties multiples. Les valeurs plus élevées donnent plus d'importance à la minimisation de la fonction de perte correspondante pendant l'entraînement.

In [None]:
model.compile(optimizer='sgd',
              loss='mean_squared_error',
              metrics=['accuracy'])

## 5. Entraînement du modèle

La méthode fit de Keras est utilisée pour entraîner un modèle sur des données d'entrée. Pendant l'entraînement, le modèle cherche à minimiser la fonction de perte en ajustant ses poids à travers les données fournies. Voici une explication des principaux paramètres de la méthode `fit` :
* `x` : Données d'entrée sur lesquelles entraîner le modèle. Pour un modèle simple, cela pourrait être un tableau NumPy ou un tenseur TensorFlow contenant les caractéristiques d'entrée.
* `y` : Données cibles (étiquettes) correspondant aux données d'entrée `x`.
* `batch_size` : Nombre d'échantillons par mise à jour de gradient. Si non spécifié, `batch_size` sera 32 par défaut.
* `epochs` : Nombre d'itérations sur l'ensemble des données d'entrée `x` et `y`.
* `verbose` : Mode verbeux. 0 = silencieux, 1 = barre de progression, 2 = une ligne par époque.
* `callbacks` : Liste d'objets de rappel à appliquer pendant l'entraînement. Utilisé pour des actions personnalisées à différentes étapes de l'entraînement (par exemple, pour enregistrer le modèle à chaque époque).
* `validation_split` : Fraction des données à utiliser comme ensemble de validation. Doit être compris entre 0 et 1.
* `validation_data` : Données sur lesquelles évaluer la perte et les métriques du modèle à la fin de chaque époque. Le modèle ne sera pas entraîné sur ces données.
* `shuffle` : Indique si les données d'entraînement doivent être mélangées avant chaque époque.

In [None]:
history = model.fit(x_train, y_train, epochs=10,  validation_data=(x_test, y_test))
history.history

## 6. Évaluation des résultats

La méthode model.evaluate de Keras est utilisée pour évaluer la performance d'un modèle sur des données de test. Elle retourne la valeur de perte et les métriques d'évaluation spécifiées lors de la compilation du modèle pour l'ensemble de données fourni. Voici les principaux paramètres de `model.evaluate(x,y)` :
* `x` : Données d'entrée sur lesquelles évaluer le modèle.
* `y` : Données cibles (labels) correspondant aux données d'entrée `x`.
* `batch_size` : Nombre d'échantillons par lot de données traitées. Si non spécifié, la valeur par défaut est 32.
* `verbose` : Mode verbeux. 0 = silencieux, 1 = barre de progression.

In [None]:
test_loss, test_acc = model.evaluate(x_test, y_test)

print("Résultat attendu",y_test)
print("Loss: ",test_loss)
y_pred=model.predict(x_test)
print(y_pred)
# Affichage de la courbe de perte
plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Courbe de perte')
plt.xlabel('Époque')
plt.ylabel('Perte')
plt.legend()
plt.show()

La méthode `model.predict` dans Keras est utilisée pour générer des prédictions à partir des données d'entrée fournies au modèle.

In [None]:
# Faire des prédictions
y_pred_train = model.predict(x_train)
y_pred_test = model.predict(x_test)

# Afficher les résultats de prédiction
plt.scatter(x_train, y_train, label='Données d\'entraînement')
plt.scatter(x_test, y_test, color='green', label='Données de test')
plt.plot(x_train, y_pred_train, color='red', label='Prédiction sur entraînement')
plt.plot(x_test, y_pred_test, color='orange', label='Prédiction sur test')
plt.legend()
plt.title("Régression Linéaire avec TensorFlow")
plt.xlabel("x")
plt.ylabel("y")
plt.show()