<a href="https://colab.research.google.com/github/julotec/hmk11/blob/main/hmk11.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, SimpleRNN, LSTM, Bidirectional, Dense, Dropout
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences
import numpy as np

In [2]:
max_features = 10000  # Liczba unikalnych słów (cech)
maxlen = 500  # Maksymalna długość recenzji (w słowach)

# Załadowanie danych
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)

# Wypełnianie lub obcinanie recenzji do maxlen
x_train = pad_sequences(x_train, maxlen=maxlen)
x_test = pad_sequences(x_test, maxlen=maxlen)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz


In [3]:
def build_rnn_model():
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(SimpleRNN(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

In [4]:
def build_lstm_model():
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(LSTM(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

In [5]:
def build_bidirectional_lstm_model():
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(Bidirectional(LSTM(128)))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

In [6]:
def build_deep_lstm_model():
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(LSTM(128, return_sequences=True))
    model.add(LSTM(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

In [7]:
models = {
    "RNN": build_rnn_model(),
    "LSTM": build_lstm_model(),
    "Bidirectional LSTM": build_bidirectional_lstm_model(),
    "Deep LSTM": build_deep_lstm_model()
}

history = {}
epochs = 10
batch_size = 128

for name, model in models.items():
    print(f"Training {name} model...")
    history[name] = model.fit(x_train, y_train, epochs=epochs, batch_size=batch_size, validation_split=0.2)


Training RNN model...
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Training LSTM model...
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Training Bidirectional LSTM model...
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Training Deep LSTM model...
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [8]:
for name, model in models.items():
    print(f"Evaluating {name} model...")
    loss, accuracy = model.evaluate(x_test, y_test)
    print(f"{name} model - Loss: {loss}, Accuracy: {accuracy}")

Evaluating RNN model...
RNN model - Loss: 0.6634354591369629, Accuracy: 0.6295199990272522
Evaluating LSTM model...
LSTM model - Loss: 0.6233867406845093, Accuracy: 0.8460800051689148
Evaluating Bidirectional LSTM model...
Bidirectional LSTM model - Loss: 0.7276725769042969, Accuracy: 0.8492000102996826
Evaluating Deep LSTM model...
Deep LSTM model - Loss: 0.5986632704734802, Accuracy: 0.8352800011634827


***Wnioski***

RNN: Może działać dobrze, ale może mieć trudności z długoterminowymi zależnościami.

LSTM: Lepsza w uchwyceniu długoterminowych zależności, co może prowadzić do wyższej dokładności.

Dwukierunkowa LSTM: Może poprawić wyniki dzięki wykorzystaniu informacji z obu kierunków (przód i tył).

Głęboka LSTM: Może prowadzić do jeszcze lepszych wyników dzięki większej liczbie warstw, ale także może być bardziej podatna na przetrenowanie.
Podsumowanie i porównanie wyników pozwoli ocenić, który z modeli najlepiej nadaje się do klasyfikacji recenzji IMDb w tym przypadku.