In [1]:
import numpy as np
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, LSTM, Bidirectional, Dense

# Завантаження даних
max_features = 10000
maxlen = 200  # Максимальна довжина рецензії
batch_size = 32

(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)

# Заповнення або обрізання рецензій до максимальної довжини
x_train = pad_sequences(x_train, maxlen=maxlen)
x_test = pad_sequences(x_test, maxlen=maxlen)


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz


#Проста RNN

In [2]:
model_rnn = Sequential()
model_rnn.add(Embedding(max_features, 32))
model_rnn.add(SimpleRNN(32))
model_rnn.add(Dense(1, activation='sigmoid'))

model_rnn.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model_rnn.fit(x_train, y_train, epochs=5, batch_size=batch_size, validation_split=0.2)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x781382b0f0d0>

#LSTM

In [3]:
model_lstm = Sequential()
model_lstm.add(Embedding(max_features, 32))
model_lstm.add(LSTM(32))
model_lstm.add(Dense(1, activation='sigmoid'))

model_lstm.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model_lstm.fit(x_train, y_train, epochs=5, batch_size=batch_size, validation_split=0.2)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x781387a51b10>

#Bidirectional LSTM

In [5]:
model_bidirectional = Sequential()
model_bidirectional.add(Embedding(max_features, 32))
model_bidirectional.add(Bidirectional(LSTM(32)))
model_bidirectional.add(Dense(1, activation='sigmoid'))

model_bidirectional.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model_bidirectional.fit(x_train, y_train, epochs=5, batch_size=batch_size, validation_split=0.2)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x781385c3c850>

#Глибока мережа з LSTM

In [4]:
model_deep_lstm = Sequential()
model_deep_lstm.add(Embedding(max_features, 32))
model_deep_lstm.add(LSTM(64, return_sequences=True))
model_deep_lstm.add(LSTM(64))
model_deep_lstm.add(Dense(1, activation='sigmoid'))

model_deep_lstm.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model_deep_lstm.fit(x_train, y_train, epochs=5, batch_size=batch_size, validation_split=0.2)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x781387476860>

In [6]:
score_rnn = model_rnn.evaluate(x_test, y_test, verbose=0)
score_lstm = model_lstm.evaluate(x_test, y_test, verbose=0)
score_bidirectional = model_bidirectional.evaluate(x_test, y_test, verbose=0)
score_deep_lstm = model_deep_lstm.evaluate(x_test, y_test, verbose=0)

print("Проста RNN:")
print("Точність:", score_rnn[1])

print("\nLSTM:")
print("Точність:", score_lstm[1])

print("\nBidirectional LSTM:")
print("Точність:", score_bidirectional[1])

print("\nГлибока мережа з LSTM:")
print("Точність:", score_deep_lstm[1])


Проста RNN:
Точність: 0.6661199927330017

LSTM:
Точність: 0.849399983882904

Bidirectional LSTM:
Точність: 0.8498799800872803

Глибока мережа з LSTM:
Точність: 0.8472399711608887


Проста RNN показала найнижчу точність при класифікації рецензій на датасеті IMDb (приблизно 66.6%). Це свідчить про обмежену здатність простої RNN до моделювання складних залежностей в текстах, так як вона має проблему зі зниклими градієнтами.

LSTM та глибока мережа з LSTM показали значно кращі результати з точністю близько 85%. LSTM вже має можливість управляти довготривалими залежностями завдяки механізму довгих короткострокових пам'ятей (LSTM), тоді як глибока мережа з LSTM має ще більший потенціал для моделювання складних текстових зв'язків.

Bidirectional LSTM показала результат, подібний до звичайного LSTM, що вказує на те, що в даному випадку додавання бідірекціональності не значно покращило результати. Це може бути пов'язано з тим, що в деяких випадках зворотний контекст може вводити шум в модель.

Загалом, з точки зору точності, LSTM та глибока мережа з LSTM показали найкращі результати для класифікації рецензій у датасеті IMDb.