## Réseaux de Neurones Récurrents

Nous avons vu précédement un modèle avec un Réseau de Neurones Denses ou entièrement connectés (perceptrons multicouches - MPL).

Étudions à présent l'efficacité d'un modèle avec un Réseau de Neurones Récurrents (RNNs)

Les RNNs sont conçus pour gérer des séquences de données, comme le texte ou les séries temporelles. Ils ont la capacité unique de maintenir un "état" ou une mémoire des entrées antérieures dans leur état interne, ce qui les rend idéaux pour les tâches où le contexte séquentiel est important. 

In [3]:
import numpy as np
import pandas as pd
from keras.models import Sequential
from keras.layers import LSTM, Dense
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Chargement des données
# Chemin vers le fichier Excel
file_path = '/Users/benjamincordebar/Desktop/2A/S8/EP/Projet/EP/donnees_propres_2.xlsx'

# Chargement du fichier
try:
    data = pd.read_excel(file_path)
    print(data.head())  # Afficher les premières lignes pour inspecter les données
except Exception as e:
    print("Erreur lors du chargement du fichier:", e)

features = data[['CO', 'Mo', 'CR', 'Deg', 'Temps']]
target = data['P1']

# Fonction pour vérifier si la normalisation est nécessaire
def needs_normalization(data, expected_min=0, expected_max=1):
    actual_min, actual_max = np.min(data), np.max(data)
    return actual_min < expected_min or actual_max > expected_max

# Normaliser les données si nécessaire
if needs_normalization(features):
    scaler = MinMaxScaler(feature_range=(0, 1))
    features = scaler.fit_transform(features)
else:
    features = features.values

# Fonction pour créer des séquences pour l'entraînement du RNN
def create_sequences(features, target, sequence_length):
    X, y = [], []
    for i in range(len(features) - sequence_length):
        X.append(features[i:(i + sequence_length)])
        y.append(target[i + sequence_length])
    return np.array(X), np.array(y)

sequence_length = 5  # Définir la longueur de la séquence selon votre choix
X, y = create_sequences(features, target, sequence_length)

# Division des données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Construction du modèle RNN avec LSTM
model = Sequential()
model.add(LSTM(50, activation='relu', input_shape=(sequence_length, X_train.shape[2]), return_sequences=True))
model.add(LSTM(50, activation='relu'))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mean_squared_error')

# Entraînement du modèle
model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test))

# Prédiction et évaluation du modèle
predictions = model.predict(X_test)

# Calcul des métriques
mse = mean_squared_error(y_test, predictions)
rmse = np.sqrt(mse)
r_squared = r2_score(y_test, predictions)

# Affichage des résultats
print("Mean Squared Error (MSE):", mse)
print("Root Mean Squared Error (RMSE):", rmse)
print("R-squared (Coefficient of Determination):", r_squared)


   Deg  Mo    GO  CO  CR    P1  PW       T3P  T1  Ready  Temps
0    0   2  52.6  34  36  1.02  43  392.4298  39      1   5571
1    0   2  52.4  33  36  0.98  43  385.4558  39      1   5572
2    0   2  51.4  34  36  1.02  43  392.4298  40      1   5573
3    0   2  51.3  33  36  1.00  42  385.4558  41      1   5574
4    0   2  53.5  35  38  1.02  45  399.8960  41      1   5575
Epoch 1/20


  super().__init__(**kwargs)


[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 4ms/step - loss: 0.0398 - val_loss: 0.0103
Epoch 2/20
[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - loss: 0.0102 - val_loss: 0.0104
Epoch 3/20
[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - loss: 0.0091 - val_loss: 0.0091
Epoch 4/20
[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - loss: 0.0087 - val_loss: 0.0084
Epoch 5/20
[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - loss: 0.0085 - val_loss: 0.0088
Epoch 6/20
[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 4ms/step - loss: 0.0083 - val_loss: 0.0081
Epoch 7/20
[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - loss: 0.0083 - val_loss: 0.0078
Epoch 8/20
[1m1057/1057[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 4ms/step - loss: 0.0080 - val_loss: 0.0082
Epoch 9/20
[1m1057/1057[0m [32m━

Nous pouvons constater : 
-  De très bon résultat !

Nous avons utilisé dans ce Réseau de Neurones Récurrents, la fonction d'activation ReLU, or, dans le modèle précédent (MLP) nous avions trouvé que LeakyReLU était la mieux adaptée à notre problème. 

#### Essayons la fonction d'activation LeakyReLU avec ce modèle.

In [9]:
import numpy as np
import pandas as pd
from keras.models import Sequential
from keras.layers import LSTM, Dense, LeakyReLU
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Chargement des données
# Chemin vers le fichier Excel
file_path = '/Users/benjamincordebar/Desktop/2A/S8/EP/Projet/EP/donnees_propres_2.xlsx'

# Chargement du fichier
try:
    data = pd.read_excel(file_path)
    print(data.head())  # Afficher les premières lignes pour inspecter les données
except Exception as e:
    print("Erreur lors du chargement du fichier:", e)

features = data[['CO', 'Mo', 'CR', 'Deg', 'Temps']]
target = data['P1']

# Fonction pour vérifier si la normalisation est nécessaire
def needs_normalization(data, expected_min=0, expected_max=1):
    actual_min, actual_max = np.min(data), np.max(data)
    return actual_min < expected_min or actual_max > expected_max

# Normaliser les données si nécessaire
if needs_normalization(features):
    scaler = MinMaxScaler(feature_range=(0, 1))
    features = scaler.fit_transform(features)
else:
    features = features.values

# Fonction pour créer des séquences pour l'entraînement du RNN
def create_sequences(features, target, sequence_length):
    X, y = [], []
    for i in range(len(features) - sequence_length):
        X.append(features[i:(i + sequence_length)])
        y.append(target[i + sequence_length])
    return np.array(X), np.array(y)

sequence_length = 5  # Définir la longueur de la séquence selon votre choix
X, y = create_sequences(features, target, sequence_length)

# Division des données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Construction du modèle RNN avec LSTM et LeakyReLU
model = Sequential()
model.add(LSTM(50, input_shape=(sequence_length, X_train.shape[2]), return_sequences=True))
model.add(LeakyReLU(alpha=0.01)) # alpha est le paramètre de pente
model.add(LSTM(50))
model.add(LeakyReLU(alpha=0.01))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mean_squared_error')

# Entraînement du modèle
model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test))

# Prédiction et évaluation du modèle
predictions = model.predict(X_test)

# Calcul des métriques
mse = mean_squared_error(y_test, predictions)
rmse = np.sqrt(mse)
r_squared = r2_score(y_test, predictions)

# Affichage des résultats
print("Mean Squared Error (MSE):", mse)
print("Root Mean Squared Error (RMSE):", rmse)
print("R-squared (Coefficient of Determination):", r_squared)


   Deg  Mo    GO  CO  CR    P1  PW       T3P  T1  Ready  Temps
0    0   2  52.6  34  36  1.02  43  392.4298  39      1   5571
1    0   2  52.4  33  36  0.98  43  385.4558  39      1   5572
2    0   2  51.4  34  36  1.02  43  392.4298  40      1   5573
3    0   2  51.3  33  36  1.00  42  385.4558  41      1   5574
4    0   2  53.5  35  38  1.02  45  399.8960  41      1   5575
Epoch 1/20


  super().__init__(**kwargs)


[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 4ms/step - loss: 0.0345 - val_loss: 0.0112
Epoch 2/20
[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - loss: 0.0098 - val_loss: 0.0091
Epoch 3/20
[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - loss: 0.0088 - val_loss: 0.0098
Epoch 4/20
[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 4ms/step - loss: 0.0085 - val_loss: 0.0085
Epoch 5/20
[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 4ms/step - loss: 0.0085 - val_loss: 0.0088
Epoch 6/20
[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 4ms/step - loss: 0.0083 - val_loss: 0.0081
Epoch 7/20
[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 4ms/step - loss: 0.0082 - val_loss: 0.0081
Epoch 8/20
[1m1208/1208[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 4ms/step - loss: 0.0082 - val_loss: 0.0078
Epoch 9/20
[1m1208/1208[0m [32m━

Nous pouvons constater : 
- une très légère amélioration. Cela est sûrement du au fait que malgré que se soit la fonction d'activation la plus adaptée, elle ne marche pas aussi bien qu'attendu en raison du faible nombre des données d'entraînement. 