### Étape 1 : Importation des bibliothèques

Importez les bibliothèques nécessaires, y compris les composants de TensorFlow et de Keras. Ces bibliothèques fournissent les fonctions nécessaires pour créer des réseaux LSTM et manipuler les données facilement.


In [None]:
import tensorflow as tf
from tensorflow.keras.datasets import imdb
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Embedding, LSTM
from tensorflow.keras.preprocessing.sequence import pad_sequences

### Étape 2 : Chargement et préparation des données

Chargez le dataset de critiques de films IMDb fourni par Keras. Ce dataset contient des critiques de films prétraitées avec des étiquettes correspondantes (positives ou négatives). Nous limitons le vocabulaire aux 10 000 mots les plus fréquents et ajustons la longueur des séquences à un maximum de 500 pour assurer une taille d'entrée uniforme.



In [None]:
# Load the IMDb dataset
(vocab_train, labels_train), (vocab_test, labels_test) = imdb.load_data(num_words=10000)

# Padding sequences to ensure uniform input size
max_length = 500
vocab_train = pad_sequences(vocab_train, maxlen=max_length, padding='post')
vocab_test = pad_sequences(vocab_test, maxlen=max_length, padding='post')


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz


### Étape 3 : Construction du modèle LSTM

Construisez le modèle LSTM en utilisant l'API Sequential. Nous commençons par une couche d'Embedding pour transformer les entiers (indices de mots) en vecteurs denses, ajoutons une couche LSTM avec dropout pour prévenir le surajustement, et utilisons une couche Dense de sortie avec une fonction d'activation sigmoïde pour la classification binaire.


In [None]:
model = Sequential()
model.add(Embedding(input_dim=10000, output_dim=128, input_length=max_length))
model.add(LSTM(units=50, dropout=0.2, recurrent_dropout=0.2))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.summary()



Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding (Embedding)       (None, 500, 128)          1280000   
                                                                 
 lstm (LSTM)                 (None, 50)                35800     
                                                                 
 dense (Dense)               (None, 1)                 51        
                                                                 
Total params: 1315851 (5.02 MB)
Trainable params: 1315851 (5.02 MB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


### Étape 4 : Entraînement du modèle

Entraînez le modèle LSTM sur les données d'entraînement avec une division de validation pour surveiller la performance sur des données non vues. Ici, nous utilisons 5 époques et une taille de lot de 64 pour l'entraînement.


In [None]:
history = model.fit(vocab_train, labels_train, epochs=5, batch_size=64, validation_split=0.2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


### Étape 5 : Évaluation du modèle

Évaluez le modèle LSTM entraîné sur le jeu de test pour voir comment il performe sur des données non vues. Nous mesurons l'exactitude du modèle, ce qui nous donne une indication de son efficacité à classifier le sentiment des critiques de films.


In [None]:
loss, accuracy = model.evaluate(vocab_test, labels_test)
print(f'Test Accuracy: {accuracy*100:.2f}%')


Test Accuracy: 51.92%


## Conclusion

Ce tutoriel a démontré la configuration de base d'un LSTM pour l'analyse de sentiments sur les critiques de films IMDb. Les LSTM sont puissants pour manipuler des séquences pour des tâches comme l'analyse de sentiments en raison de leur capacité à maintenir des dépendances à long terme dans les données séquentielles. Expérimenter avec différentes configurations et ajuster les paramètres pourrait potentiellement améliorer encore plus la précision de vos modèles.

