## **Підготовка даних**

In [1]:
from keras.datasets import imdb
from keras.preprocessing import sequence

max_features = 10000
maxlen = 500

print('Loading data...')
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)
print(len(x_train), 'train sequences')
print(len(x_test), 'test sequences')

print('Pad sequences (samples x time)')
x_train = sequence.pad_sequences(x_train, maxlen=maxlen)
x_test = sequence.pad_sequences(x_test, maxlen=maxlen)
print('x_train shape:', x_train.shape)
print('x_test shape:', x_test.shape)

Loading data...
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz
25000 train sequences
25000 test sequences
Pad sequences (samples x time)
x_train shape: (25000, 500)
x_test shape: (25000, 500)


 ## **Створення моделей**

### a) RNN:

In [2]:
from keras.models import Sequential
from keras.layers import Embedding, SimpleRNN, Dense

model = Sequential()
model.add(Embedding(max_features, 32))
model.add(SimpleRNN(32))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])
history_rnn = model.fit(x_train, y_train, epochs=10, batch_size=128, validation_split=0.2)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


### b) LSTM:

In [3]:
from keras.layers import LSTM

model = Sequential()
model.add(Embedding(max_features, 32))
model.add(LSTM(32))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])
history_lstm = model.fit(x_train, y_train, epochs=10, batch_size=128, validation_split=0.2)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


### c) Двосторонній LSTM:

In [4]:
from keras.layers import Bidirectional

model = Sequential()
model.add(Embedding(max_features, 32))
model.add(Bidirectional(LSTM(32)))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])
history_bi_lstm = model.fit(x_train, y_train, epochs=10, batch_size=128, validation_split=0.2)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


### d) Глибока LSTM:

In [5]:
model = Sequential()
model.add(Embedding(max_features, 32))
model.add(LSTM(32, return_sequences=True))
model.add(LSTM(32, return_sequences=True))
model.add(LSTM(32))
model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])
history_deep_lstm = model.fit(x_train, y_train, epochs=10, batch_size=128, validation_split=0.2)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


### За результатами навчання різних моделей нейронних мереж на датасеті IMDb можна зробити наступні висновки:

#### 1. Звичайна RNN:

#### * Найбільш проста модель з наведених.
#### * Швидше за все навчається, але якість класифікації (val_acc) на валідаційних даних залишає бажати кращого в порівнянні з іншими моделями.
#### * Схильна до перенавчання (overfitting), що видно з розриву між acc та val_acc.

#### 2. LSTM:

#### * Показала кращі результати на валідаційних даних в порівнянні зі звичайною RNN.
#### * За часом навчання середньої складності.
#### * Схильність до перенавчання менша, але все ж присутня.

#### 3. Двосторонній LSTM (Bidirectional LSTM):

#### * Ця модель використовує інформацію з минулого і майбутнього для кращого розуміння контексту.
#### * Показала дуже добрі результати на валідаційних даних.
#### * Навчання відбувається повільніше, ніж у попередніх моделей.

#### 4. Глибока LSTM:

#### * Найскладніша модель з наведених.
#### * Показала добрі результати на валідаційних даних.
#### * Найбільш часозатратна модель з усіх.
#### * Схильність до перенавчання є, але вона не так сильно виражена, як у звичайної RNN.

#### Загальний висновок: з усіх розглянутих моделей, двосторонній LSTM показав найкращі результати на валідаційних даних, але при цьому вимагає більше часу на навчання. Якщо враховувати баланс між якістю і швидкістю навчання, то LSTM може бути хорошим варіантом для вирішення подібних задач класифікації текстових даних.