In [None]:
import numpy as np
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, LSTM, Bidirectional, Dense

num_words = 10000
maxlen = 200

(X_train, y_train), (X_test, y_test) = imdb.load_data(num_words=num_words)
X_train = pad_sequences(X_train, maxlen=maxlen)
X_test = pad_sequences(X_test, maxlen=maxlen)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz


# RNN


In [None]:
model_rnn = Sequential()
model_rnn.add(Embedding(num_words, 32))
model_rnn.add(SimpleRNN(64))
model_rnn.add(Dense(1, activation='sigmoid'))

model_rnn.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

model_rnn.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding (Embedding)       (None, None, 32)          320000    
                                                                 
 simple_rnn (SimpleRNN)      (None, 64)                6208      
                                                                 
 dense (Dense)               (None, 1)                 65        
                                                                 
Total params: 326,273
Trainable params: 326,273
Non-trainable params: 0
_________________________________________________________________


In [None]:
model_rnn.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=128)

loss, accuracy = model_rnn.evaluate(X_test, y_test, verbose=0)
print('Test Accuracy: {:.2f}%'.format(accuracy * 100))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Test Accuracy: 77.06%


**RNN**

**5 епох**, виконання 2 хвилини, точність 83.04%

**10 епох**, виконання 4 хвилини, точність 77.06%.
Під час тренування спостерігався overfitting. Пік точності було досягнуто на 7 епосі - 84%

# LSTM

In [None]:
model_lstm = Sequential()
model_lstm.add(Embedding(num_words, 32))
model_lstm.add(LSTM(64))
model_lstm.add(Dense(1, activation='sigmoid'))

model_lstm.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

model_lstm.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding_1 (Embedding)     (None, None, 32)          320000    
                                                                 
 lstm (LSTM)                 (None, 64)                24832     
                                                                 
 dense_1 (Dense)             (None, 1)                 65        
                                                                 
Total params: 344,897
Trainable params: 344,897
Non-trainable params: 0
_________________________________________________________________


In [None]:
model_lstm.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=128)

loss, accuracy = model_lstm.evaluate(X_test, y_test, verbose=0)
print('Test Accuracy: {:.2f}%'.format(accuracy * 100))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Test Accuracy: 84.84%


**LSTM**

**5 епох**, 7 хвилин, точність 85.98%

**10 епох**, 17 хвилин, точність 84.84%.
Спостерігається незначний спад точності після початкового підвищення

# Двостороння мережа (Bidirectional)

In [None]:
model_bidirectional = Sequential()
model_bidirectional.add(Embedding(num_words, 32))
model_bidirectional.add(Bidirectional(LSTM(64)))
model_bidirectional.add(Dense(1, activation='sigmoid'))

model_bidirectional.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

model_bidirectional.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding_2 (Embedding)     (None, None, 32)          320000    
                                                                 
 bidirectional (Bidirectiona  (None, 128)              49664     
 l)                                                              
                                                                 
 dense_2 (Dense)             (None, 1)                 129       
                                                                 
Total params: 369,793
Trainable params: 369,793
Non-trainable params: 0
_________________________________________________________________


In [None]:
model_bidirectional.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=128)

loss, accuracy = model_bidirectional.evaluate(X_test, y_test, verbose=0)
print('Test Accuracy: {:.2f}%'.format(accuracy * 100))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Test Accuracy: 84.94%


**Bidirectional**

**5 епох**, 12 хвилин, точність 85.76%

**10 епох**, виконання 25 хвилин, точність 84.94%. Попри зниження точності після перших кількох епох, модель Bidirectional все ще показує достатньо високу точність

# Глибока мережа (Deep)


In [None]:
model_deep = Sequential()
model_deep.add(Embedding(num_words, 32))
model_deep.add(LSTM(64, return_sequences=True))
model_deep.add(LSTM(64))
model_deep.add(Dense(1, activation='sigmoid'))

model_deep.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

model_deep.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 embedding_3 (Embedding)     (None, None, 32)          320000    
                                                                 
 lstm_2 (LSTM)               (None, None, 64)          24832     
                                                                 
 lstm_3 (LSTM)               (None, 64)                33024     
                                                                 
 dense_3 (Dense)             (None, 1)                 65        
                                                                 
Total params: 377,921
Trainable params: 377,921
Non-trainable params: 0
_________________________________________________________________


In [None]:
model_deep.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=128)

loss, accuracy = model_deep.evaluate(X_test, y_test, verbose=0)
print('Test Accuracy: {:.2f}%'.format(accuracy * 100))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Test Accuracy: 84.61%


**Deep**

**5 епох**, 19 хвилин, точність 85.55%

**10 епох**, виконання 38 хвилин, точність 84.61%.
 Після певного зростання точності протягом перших епох, точність на валідаційному наборі стає стійкою та показує добрі результати

# Висновки

**Після тренування моделей протягом 5 епох**


**LSTM** та двостороння мережа **Bidirectional** показують кращі результати, оскільки вони можуть краще усвідомлювати довгострокові залежності в тексті. Однак, різниця у точності між цими моделями є несуттєвою.

**Загальні**

**RNN**: При збільшенні кількості епох з 5 до 10 спостерігається overfitting моделі, що проявляється у зниженні точності на валідаційному наборі даних. При 7 епохах досягається пік точності, але загальна точність (77.06%) є нижчою в порівнянні з іншими моделями.

**LSTM**: При 5 епохах модель досягає високої точності (85.98%), але при подовженні тренування до 10 епох точність незначно знижується (84.84%). Це може свідчити про наявність незначного overfitting після певної кількості епох.

**Bidirectional**: Модель показує добрі результати при обох кількостях епох (85.76% при 5 епохах і 84.94% при 10 епохах). Хоча точність знижується після перших кількох епох, вона все ще залишається на високому рівні, що свідчить про ефективність моделі.

**Deep**: Точність моделі Deep також залишається на високому рівні незалежно від кількості епох (85.55% при 5 епохах і 84.61% при 10 епохах). Після певного зростання точності протягом перших епох, модель стає стійкою і показує добрі результати.


Загалом, можна зробити висновок, що моделі **LSTM**, **Bidirectional** і **Deep** показують добрі результати у класифікації рецензій, з високою точністю навіть після певного зниження в деяких випадках. Проте, **Bidirectional** і особливо **Deep** вимагають значно більше часу для навчання