In [1]:
import numpy as np
from tensorflow import keras
from tensorflow.keras.datasets import imdb
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, LSTM, Bidirectional, Dense
from tensorflow.keras.preprocessing import sequence




In [2]:
max_features = 5000  # кількість слів, які будуть використовуватись в словнику
maxlen = 500  # максимальна довжина рецензії

(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)

x_train = sequence.pad_sequences(x_train, maxlen=maxlen)
x_test = sequence.pad_sequences(x_test, maxlen=maxlen)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz


Модель RNN

In [3]:
model = Sequential()
model.add(Embedding(max_features, 32))  # вбудовуємо слова у вектори
model.add(SimpleRNN(32))  # додаємо просту RNN
model.add(Dense(1, activation='sigmoid'))  # додаємо повнозв'язний шар з активацією sigmoid для класифікації

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['accuracy'])





In [4]:
model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test))

Epoch 1/10


Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x142c67bbe50>

In [5]:
# Оцінка базової моделі RNN
scores_rnn = model.evaluate(x_test, y_test, verbose=0)
print("Base RNN Accuracy: %.2f%%" % (scores_rnn[1] * 100))

Base RNN Accuracy: 81.40%


Модель LSTM

In [6]:
model = Sequential()
model.add(Embedding(max_features, 32))  # вбудовуємо слова у вектори
model.add(LSTM(32))  # додаємо LSTM шар
model.add(Dense(1, activation='sigmoid'))  # додаємо повнозв'язний шар з активацією sigmoid для класифікації

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x142bca6ad10>

In [7]:
# Оцінка моделі з LSTM шарами
scores_lstm = model.evaluate(x_test, y_test, verbose=0)
print("LSTM Accuracy: %.2f%%" % (scores_lstm[1] * 100))

LSTM Accuracy: 87.33%


Двостороння модель

In [8]:
model = Sequential()
model.add(Embedding(max_features, 32))  # вбудовуємо слова у вектори
model.add(Bidirectional(SimpleRNN(32)))  # додаємо двосторонню мережу з простою RNN
model.add(Dense(1, activation='sigmoid'))  # додаємо повнозв'язний шар з активацією sigmoid для класифікації

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x142bf1f3750>

In [9]:
# Оцінка моделі з Bidirectional RNN
scores_lstm = model.evaluate(x_test, y_test, verbose=0)
print("Bidirectional RNN Accuracy: %.2f%%" % (scores_lstm[1] * 100))

Bidirectional RNN Accuracy: 86.02%


Глибока модель

In [10]:
model = Sequential()
model.add(Embedding(max_features, 32))  # вбудовуємо слова у вектори
model.add(LSTM(32, return_sequences=True))  # додаємо перший LSTM шар з поверненням послідовностей
model.add(LSTM(32))  # додаємо другий LSTM шар
model.add(Dense(1, activation='sigmoid'))  # додаємо повнозв'язний шар з активацією sigmoid для класифікації

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x142bf4f2390>

In [11]:
# Оцінка моделі з глибокою мережею LSTM
scores_deep_lstm = model.evaluate(x_test, y_test, verbose=0)
print("Deep LSTM Accuracy: %.2f%%" % (scores_deep_lstm[1] * 100))

Deep LSTM Accuracy: 86.56%


Результати:
- Base RNN Accuracy: 81.40%
- LSTM Accuracy: 87.33%
- Bidirectional RNN Accuracy: 86.02%
- Deep LSTM Accuracy: 86.56%

В цілому результати точності (за винятком Base RNN) схожі, але все ж для данного випадку кращим вибором є LSTM модель, адже вона була доволі швидкою при максимальному результату точності. 