# Модуль 11. **Рекурентні нейронні мережі** 

### Завдання

В якості домашнього завдання вам пропонується створити рекурентну нейронну мережу за допомогою механізмів Keras, яка буде класифікувати рецензії із датасету imdb.



На відміну від прикладу в модулі 9 ми використаємо рекурентну нейронну мережу. Поекспериментуйте з будовою мережі - RNN, LSTM, двостороння та глибока.



Порівняйте результати та зробіть висновки.

In [None]:
! pip install keras --upgrade tensorflow --upgrade

In [None]:
import matplotlib.pyplot as plt
from keras.datasets import imdb
from keras.utils import pad_sequences
from keras.models import Sequential
from keras.layers import (
    Embedding,
    Bidirectional,
    LSTM,
    GRU,
    SimpleRNN,
    Dense,
    GlobalMaxPool1D,
    Dropout,
)
import pandas as pd

     Параметри 

In [None]:
max_features = 10000  # кількість слів, що розглядаються як особливості
maxlen = 500  # обмеження кількості слів в тексті

epochs = 3
batch_size = 128
optimizer = "adamw"
activation = "sigmoid"
verbose = 1
summary = False

     Завантаження даних 

In [None]:
# Завантаження тренувальних та тестових даних зі вказанням обмеження на кількість слів
(input_train, y_train), (input_test, y_test) = imdb.load_data(
    num_words=max_features, skip_top=1000
)

In [None]:
# Застосування заздалегідь обраної максимальної довжини до послідовних даних тренувального та тестового наборів
input_train = pad_sequences(input_train, maxlen=maxlen)
input_test = pad_sequences(input_test, maxlen=maxlen)

In [None]:
print(f"{input_train.shape = }")
print(f"    {y_train.shape = }")
print(f" {input_test.shape = }")
print(f"     {y_test.shape = }")

     Функція відображення графіків історії точності та втрат 
######      Аргументи: <br>1. history - дані історії точності та втрат<br>2. title - заголовок графіка

In [None]:
def plt_history(
    history, title="Точність та втрати на тренувальному та тестовому наборах"
):
    plt.figure(figsize=(10, 6))

    dict_data = {
        "acc": "Точність на тренувальному наборі",
        "val_acc": "Точність на тестовому наборі",
        "loss": "Втрати на тренувальному наборі",
        "val_loss": "Втрати на тестовому наборі",
    }

    epochs = range(1, len(history.history["acc"]) + 1)

    color_acc = "royalblue"
    color_loss = "peru"
    linestyle_train = "--"
    linestyle_test = "-"

    for data_, label_ in dict_data.items():
        plt.plot(
            epochs,
            history.history[data_],
            color=color_loss if (data_[-4:] == "loss") else color_acc,
            linestyle=linestyle_test if (data_[:3] == "val") else linestyle_train,
            label=label_,
        )

    plt.ylim(0, 1)
    plt.title(title)
    plt.xlabel("Епоха")
    plt.ylabel("Метрика")
    plt.legend()
    plt.show()

In [None]:
models, titles = [], [] # список моделей та їх назв

     Створення моделей 

In [None]:
title_kgl = "From Kaggle"

# model_rnn = Sequential()
# # Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
# model_rnn.add(Embedding(max_features, 32))
# # Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
# model_rnn.add(SimpleRNN(32))
# model_rnn.add(Dense(1, activation=activation))

embed_size = 128
model_kgl = Sequential()
model_kgl.add(Embedding(max_features, embed_size))
model_kgl.add(Bidirectional(LSTM(32, return_sequences=True)))
model_kgl.add(GlobalMaxPool1D())
model_kgl.add(Dense(20, activation="relu"))
model_kgl.add(Dropout(0.05))
model_kgl.add(Dense(1, activation="sigmoid"))

# model_kgl.compile(loss="binary_crossentropy", optimizer="adam", metrics=["accuracy"])

titles.append(title_kgl)
models.append(model_kgl)

# batch_size = 100
# epochs = 3
# model_kgl.fit(X_t, y, batch_size=batch_size, epochs=epochs, validation_split=0.2)

# Simple Recurrent Neural Network (RNN)

In [None]:
title_rnn = "Simple Recurrent Neural Network (RNN)"

model_rnn = Sequential()
# Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
model_rnn.add(Embedding(max_features, 32))
# Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
model_rnn.add(SimpleRNN(32))
model_rnn.add(Dense(1, activation=activation))

titles.append(title_rnn)
models.append(model_rnn)

# Long Short-Term Memory (LSTM)

In [None]:
title_lstm = "Long Short-Term Memory (LSTM)"

model_lstm = Sequential()
# Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
model_lstm.add(Embedding(max_features, 32))
# Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
model_lstm.add(LSTM(32))
model_lstm.add(Dense(1, activation=activation))

titles.append(title_lstm)
models.append(model_lstm)

# Gated Recurrent Unit (GRU)

In [None]:
title_gru = "Gated Recurrent Unit (GRU)"

model_gru = Sequential()
# Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
model_gru.add(Embedding(max_features, 32))
# Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
model_gru.add(GRU(32))
model_gru.add(Dense(1, activation=activation))

titles.append(title_gru)
models.append(model_gru)

# Bidirectional Recurrent Neural Network (BRNN)

In [None]:
# title_brnn = "Bidirectional Recurrent Neural Network + LSTM (BRNN)"

# model_brnn = Sequential()
# # Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
# model_brnn.add(Embedding(max_features, 32))
# # Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
# model_brnn.add(Bidirectional(LSTM(32)))
# model_brnn.add(Dense(1, activation=activation))

# titles.append(title_brnn)
# models.append(model_brnn)

In [None]:
# title_brnn_s = "Bidirectional Recurrent Neural Network + SimpleRNN (BRNN_2)"

# model_brnn_s = Sequential()
# # Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
# model_brnn_s.add(Embedding(max_features, 32))
# # Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
# model_brnn_s.add(Bidirectional(SimpleRNN(32)))
# model_brnn_s.add(Dense(1, activation=activation))

# titles.append(title_brnn_s)
# models.append(model_brnn_s)

# Deep Recurrent Neural Network (DRNN)

In [None]:
# title_drnn = "Deep Recurrent Neural Network + LSTM (DRNN)"

# model_drnn = Sequential()
# # Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
# model_drnn.add(Embedding(max_features, 32))
# # Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
# model_drnn.add(Bidirectional(LSTM(32, return_sequences=True)))
# model_drnn.add(Bidirectional(LSTM(32)))
# model_drnn.add(Dense(1, activation=activation))

# titles.append(title_drnn)
# models.append(model_drnn)

In [None]:
# title_drnn_s = "Deep Recurrent Neural Network + SimpleRNN (DRNN_2)"

# model_drnn_s = Sequential()
# # Додавання Embedding шару для перетворення слів в вектори фіксованої довжини
# model_drnn_s.add(Embedding(max_features, 32))
# # Параметри: кількість слів для розгляду як особливості та розмір вектора, що представляє кожне слово
# model_drnn_s.add(SimpleRNN(32, return_sequences=True))
# model_drnn_s.add(SimpleRNN(32))
# model_drnn_s.add(Dense(1, activation=activation))

# titles.append(title_drnn_s)
# models.append(model_drnn_s)

     Компіляція та навчання моделей 

In [None]:
histories = []

for i, model in enumerate(models):
    print(f"Training model {i+1} - \033[33m{titles[i]}\033[0m...")

    model.compile(optimizer=optimizer, loss="binary_crossentropy", metrics=["acc"])

    if summary:
        model.summary()

    history = model.fit(
        input_train,
        y_train,
        epochs=epochs,
        batch_size=batch_size,
        validation_data=(input_test, y_test),
        verbose=verbose,
    )
    histories.append(history)

In [None]:
for i, history in enumerate(histories):
    plt_history(history, title=titles[i])

In [None]:
# Creating a list for options
train_acc, train_loss, val_acc, val_loss = [], [], [], []

# Collecting results from stories
for history in histories:
    train_acc.append(history.history["acc"][-1])
    train_loss.append(history.history["loss"][-1])
    val_acc.append(history.history["val_acc"][-1])
    val_loss.append(history.history["val_loss"][-1])

# Creating a DataFrame
df = pd.DataFrame(
    {
        "Model": titles,
        "Train Accuracy": train_acc,
        "Train Loss": train_loss,
        "Validation Accuracy": val_acc,
        "Validation Loss": val_loss,
    }
)

df.head(len(models))

<div class="alert alert-block alert-info">

#### **Висновки:**

#### У всіх варіантах моделей ми спостерігали високу точність та низьки втрати на даних навчання. Це означає, що моделі ефективно навчаються та здатні добре адаптуватися до навчальних даних.

</div>