<a href="https://colab.research.google.com/github/Georgiiliwe8pcr/14hw/blob/main/Untitled4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import numpy as np
import pandas as pd
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN, LSTM, Bidirectional, Dense, Embedding
from tensorflow.keras.optimizers import Adam

# Завантаження та підготовка даних
max_features = 10000  # Максимальна кількість слів у словнику
max_len = 500  # Максимальна довжина рецензії

(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)

x_train = pad_sequences(x_train, maxlen=max_len)
x_test = pad_sequences(x_test, maxlen=max_len)

# Функції для створення моделей
def build_rnn_model():
    model = Sequential([
        Embedding(max_features, 128, input_length=max_len),
        SimpleRNN(64, return_sequences=False),
        Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer=Adam(learning_rate=0.001), loss='binary_crossentropy', metrics=['accuracy'])
    return model

def build_lstm_model():
    model = Sequential([
        Embedding(max_features, 128, input_length=max_len),
        LSTM(64, return_sequences=False),
        Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer=Adam(learning_rate=0.001), loss='binary_crossentropy', metrics=['accuracy'])
    return model

def build_bidirectional_lstm_model():
    model = Sequential([
        Embedding(max_features, 128, input_length=max_len),
        Bidirectional(LSTM(64, return_sequences=False)),
        Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer=Adam(learning_rate=0.001), loss='binary_crossentropy', metrics=['accuracy'])
    return model

def build_deep_lstm_model():
    model = Sequential([
        Embedding(max_features, 128, input_length=max_len),
        LSTM(64, return_sequences=True),
        LSTM(64, return_sequences=False),
        Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer=Adam(learning_rate=0.001), loss='binary_crossentropy', metrics=['accuracy'])
    return model

# Створення моделей
rnn_model = build_rnn_model()
lstm_model = build_lstm_model()
bidirectional_lstm_model = build_bidirectional_lstm_model()
deep_lstm_model = build_deep_lstm_model()

# Навчання моделей
rnn_history = rnn_model.fit(x_train, y_train, epochs=3, batch_size=64, validation_split=0.2, verbose=1)
lstm_history = lstm_model.fit(x_train, y_train, epochs=3, batch_size=64, validation_split=0.2, verbose=1)
bidirectional_lstm_history = bidirectional_lstm_model.fit(x_train, y_train, epochs=3, batch_size=64, validation_split=0.2, verbose=1)
deep_lstm_history = deep_lstm_model.fit(x_train, y_train, epochs=3, batch_size=64, validation_split=0.2, verbose=1)

# Оцінка моделей
rnn_eval = rnn_model.evaluate(x_test, y_test, verbose=0)
lstm_eval = lstm_model.evaluate(x_test, y_test, verbose=0)
bidirectional_lstm_eval = bidirectional_lstm_model.evaluate(x_test, y_test, verbose=0)
deep_lstm_eval = deep_lstm_model.evaluate(x_test, y_test, verbose=0)

# Створення DataFrame із результатами
results = {
    "Model": ["RNN", "LSTM", "Bidirectional LSTM", "Deep LSTM"],
    "Accuracy": [rnn_eval[1], lstm_eval[1], bidirectional_lstm_eval[1], deep_lstm_eval[1]],
    "Loss": [rnn_eval[0], lstm_eval[0], bidirectional_lstm_eval[0], deep_lstm_eval[0]],
}

df_results = pd.DataFrame(results)

# Збереження результатів у CSV файл
file_path = "/mnt/data/recurrent_models_results.csv"
df_results.to_csv(file_path, index=False)

print(f"Результати збережено у файл: {file_path}")


Висновки:  
RNN:

Найпростіша модель, але її здатність захоплювати довгострокові залежності обмежена.
Може показувати гірші результати, особливо для довгих послідовностей, через проблему затухання градієнтів.               
LSTM:

Покращує здатність моделі працювати з довгими послідовностями завдяки механізмам пам'яті (cell state і gate mechanisms).
Як правило, перевершує RNN за точністю на більшості задач.

Двостороння LSTM:

Аналізує послідовності в обох напрямах (зліва направо і справа наліво), що дозволяє захоплювати більше контексту.
Очікувано, ця модель демонструє кращі результати порівняно з односторонньою LSTM.

Глибока LSTM:

Завдяки додатковому шару LSTM, модель має більшу здатність до навчання складних залежностей.
Може бути найефективнішою для задач із довгими та складними послідовностями.

Порівняння продуктивності:

Очікується, що точність буде покращуватись у напрямку: RNN < LSTM < Двостороння LSTM < Глибока LSTM.
Проте, це залежить від складності задачі, обсягу даних і кількості епох навчання.

Час навчання:

Час навчання збільшується зі складністю моделі, особливо для двосторонньої та глибокої LSTM.