<a href="https://colab.research.google.com/github/pilipandr770/HomeWork13/blob/main/HomeWork13.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# directory: /imdb_classification
# file: data_preparation.py

import numpy as np
from keras.datasets import imdb
from keras.preprocessing.sequence import pad_sequences

# Параметри
max_features = 20000  # Кількість слів у словнику
maxlen = 100  # Максимальна довжина рецензій

# Завантаження даних
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)

# Додавання заповнювачів для однакової довжини рецензій
x_train = pad_sequences(x_train, maxlen=maxlen)
x_test = pad_sequences(x_test, maxlen=maxlen)

print(f'Розмір тренувальних даних: {x_train.shape}')
print(f'Розмір тестових даних: {x_test.shape}')


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz
[1m17464789/17464789[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Розмір тренувальних даних: (25000, 100)
Розмір тестових даних: (25000, 100)


In [2]:
# directory: /imdb_classification
# file: rnn_model.py

from keras.models import Sequential
from keras.layers import Embedding, SimpleRNN, Dense

def create_rnn_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(SimpleRNN(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model


In [3]:
# directory: /imdb_classification
# file: lstm_model.py

from keras.models import Sequential
from keras.layers import Embedding, LSTM, Dense

def create_lstm_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(LSTM(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model


In [4]:
# directory: /imdb_classification
# file: bidirectional_lstm_model.py

from keras.models import Sequential
from keras.layers import Embedding, Bidirectional, LSTM, Dense

def create_bidirectional_lstm_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(Bidirectional(LSTM(128)))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model


In [5]:
# directory: /imdb_classification
# file: deep_rnn_model.py

from keras.models import Sequential
from keras.layers import Embedding, SimpleRNN, Dense

def create_deep_rnn_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(SimpleRNN(128, return_sequences=True))
    model.add(SimpleRNN(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model


In [7]:
# directory: /imdb_classification
# file: train_models.py

import numpy as np
from keras.datasets import imdb
from keras.preprocessing.sequence import pad_sequences
from keras.models import Sequential
from keras.layers import Embedding, SimpleRNN, LSTM, Bidirectional, Dense
from keras.callbacks import EarlyStopping

# Параметри
max_features = 20000  # Кількість слів у словнику
maxlen = 100  # Максимальна довжина рецензій
batch_size = 32
epochs = 10
input_length = 100

# Завантаження даних
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)
x_train = pad_sequences(x_train, maxlen=maxlen)
x_test = pad_sequences(x_test, maxlen=maxlen)

# Визначення моделей
def create_rnn_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(SimpleRNN(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

def create_lstm_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(LSTM(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

def create_bidirectional_lstm_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(Bidirectional(LSTM(128)))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

def create_deep_rnn_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128, input_length=input_length))
    model.add(SimpleRNN(128, return_sequences=True))
    model.add(SimpleRNN(128))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

# Створення моделей
rnn_model = create_rnn_model(input_length, max_features)
lstm_model = create_lstm_model(input_length, max_features)
bidirectional_lstm_model = create_bidirectional_lstm_model(input_length, max_features)
deep_rnn_model = create_deep_rnn_model(input_length, max_features)

# Функція ранньої зупинки
early_stopping = EarlyStopping(monitor='val_loss', patience=2)

# Навчання RNN моделі
history_rnn = rnn_model.fit(x_train, y_train,
                            batch_size=batch_size,
                            epochs=epochs,
                            validation_split=0.2,
                            callbacks=[early_stopping])

# Навчання LSTM моделі
history_lstm = lstm_model.fit(x_train, y_train,
                              batch_size=batch_size,
                              epochs=epochs,
                              validation_split=0.2,
                              callbacks=[early_stopping])

# Навчання двосторонньої LSTM моделі
history_bidirectional_lstm = bidirectional_lstm_model.fit(x_train, y_train,
                                                          batch_size=batch_size,
                                                          epochs=epochs,
                                                          validation_split=0.2,
                                                          callbacks=[early_stopping])

# Навчання глибокої RNN моделі
history_deep_rnn = deep_rnn_model.fit(x_train, y_train,
                                      batch_size=batch_size,
                                      epochs=epochs,
                                      validation_split=0.2,
                                      callbacks=[early_stopping])

# Оцінка результатів
def evaluate_model(model, x_test, y_test):
    score, acc = model.evaluate(x_test, y_test, batch_size=batch_size)
    return score, acc

# Оцінка моделей
rnn_score, rnn_acc = evaluate_model(rnn_model, x_test, y_test)
lstm_score, lstm_acc = evaluate_model(lstm_model, x_test, y_test)
bidirectional_lstm_score, bidirectional_lstm_acc = evaluate_model(bidirectional_lstm_model, x_test, y_test)
deep_rnn_score, deep_rnn_acc = evaluate_model(deep_rnn_model, x_test, y_test)

print(f'RNN модель - Точність: {rnn_acc}, Втрата: {rnn_score}')
print(f'LSTM модель - Точність: {lstm_acc}, Втрата: {lstm_score}')
print(f'Двостороння LSTM модель - Точність: {bidirectional_lstm_acc}, Втрата: {bidirectional_lstm_score}')
print(f'Глибока RNN модель - Точність: {deep_rnn_acc}, Втрата: {deep_rnn_score}')




Epoch 1/10
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m45s[0m 67ms/step - accuracy: 0.5585 - loss: 0.6729 - val_accuracy: 0.7804 - val_loss: 0.4999
Epoch 2/10
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 67ms/step - accuracy: 0.6786 - loss: 0.5884 - val_accuracy: 0.7300 - val_loss: 0.5542
Epoch 3/10
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m83s[0m 68ms/step - accuracy: 0.7999 - loss: 0.4364 - val_accuracy: 0.7348 - val_loss: 0.5674
Epoch 1/10
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m126s[0m 197ms/step - accuracy: 0.7389 - loss: 0.4995 - val_accuracy: 0.8492 - val_loss: 0.3618
Epoch 2/10
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m147s[0m 206ms/step - accuracy: 0.9121 - loss: 0.2322 - val_accuracy: 0.8466 - val_loss: 0.3608
Epoch 3/10
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m122s[0m 196ms/step - accuracy: 0.9500 - loss: 0.1412 - val_accuracy: 0.8268 - val_loss: 0.4340
Epoch 4/10

Висновки
RNN модель:

Точність: 73.02%
Втрата: 0.5656
LSTM модель:

Точність: 81.96%
Втрата: 0.4937
Двостороння LSTM модель:

Точність: 83.64%
Втрата: 0.4655
Глибока RNN модель:

Точність: 77.56%
Втрата: 0.4982
Аналіз
RNN модель має найнижчу точність та найвищу втрату серед усіх моделей. Це очікувано, оскільки прості RNN менш ефективні для обробки довгих послідовностей через проблему затухаючих градієнтів.

LSTM модель значно перевершує RNN модель завдяки своїй здатності запам'ятовувати довготривалі залежності в даних.

Двостороння LSTM модель демонструє найвищу точність та найнижчу втрату. Це обумовлено тим, що вона враховує контекст як з попередніх, так і з наступних слів у рецензії.

Глибока RNN модель має кращі результати, ніж проста RNN, але все ще поступається моделям LSTM.

In [9]:
# directory: /imdb_classification
# file: final_training.py

import numpy as np
from keras.datasets import imdb
from keras.preprocessing.sequence import pad_sequences
from keras.models import Sequential
from keras.layers import Embedding, SimpleRNN, LSTM, Bidirectional, Dense
from keras.callbacks import EarlyStopping

# Параметри
max_features = 20000  # Кількість слів у словнику
maxlen = 100  # Максимальна довжина рецензій
batch_size = 32
epochs = 5
input_length = 100

# Завантаження даних
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)
x_train = pad_sequences(x_train, maxlen=maxlen)
x_test = pad_sequences(x_test, maxlen=maxlen)

# Визначення моделей
def create_rnn_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(SimpleRNN(64))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

def create_lstm_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(LSTM(64))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

def create_bidirectional_lstm_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(Bidirectional(LSTM(64)))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

def create_deep_rnn_model(input_length, max_features):
    model = Sequential()
    model.add(Embedding(max_features, 128))
    model.add(SimpleRNN(64, return_sequences=True))
    model.add(SimpleRNN(64))
    model.add(Dense(1, activation='sigmoid'))
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

# Створення моделей
rnn_model = create_rnn_model(input_length, max_features)
lstm_model = create_lstm_model(input_length, max_features)
bidirectional_lstm_model = create_bidirectional_lstm_model(input_length, max_features)
deep_rnn_model = create_deep_rnn_model(input_length, max_features)

# Функція ранньої зупинки
early_stopping = EarlyStopping(monitor='val_loss', patience=2)

# Навчання RNN моделі
history_rnn = rnn_model.fit(x_train, y_train,
                            batch_size=batch_size,
                            epochs=epochs,
                            validation_split=0.2,
                            callbacks=[early_stopping])

# Навчання LSTM моделі
history_lstm = lstm_model.fit(x_train, y_train,
                              batch_size=batch_size,
                              epochs=epochs,
                              validation_split=0.2,
                              callbacks=[early_stopping])

# Навчання двосторонньої LSTM моделі
history_bidirectional_lstm = bidirectional_lstm_model.fit(x_train, y_train,
                                                          batch_size=batch_size,
                                                          epochs=epochs,
                                                          validation_split=0.2,
                                                          callbacks=[early_stopping])

# Навчання глибокої RNN моделі
history_deep_rnn = deep_rnn_model.fit(x_train, y_train,
                                      batch_size=batch_size,
                                      epochs=epochs,
                                      validation_split=0.2,
                                      callbacks=[early_stopping])

# Оцінка результатів
def evaluate_model(model, x_test, y_test):
    score, acc = model.evaluate(x_test, y_test, batch_size=batch_size)
    return score, acc

# Оцінка моделей
rnn_score, rnn_acc = evaluate_model(rnn_model, x_test, y_test)
lstm_score, lstm_acc = evaluate_model(lstm_model, x_test, y_test)
bidirectional_lstm_score, bidirectional_lstm_acc = evaluate_model(bidirectional_lstm_model, x_test, y_test)
deep_rnn_score, deep_rnn_acc = evaluate_model(deep_rnn_model, x_test, y_test)

print(f'RNN модель - Точність: {rnn_acc}, Втрата: {rnn_score}')
print(f'LSTM модель - Точність: {lstm_acc}, Втрата: {lstm_score}')
print(f'Двостороння LSTM модель - Точність: {bidirectional_lstm_acc}, Втрата: {bidirectional_lstm_score}')
print(f'Глибока RNN модель - Точність: {deep_rnn_acc}, Втрата: {deep_rnn_score}')


Epoch 1/5
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m40s[0m 61ms/step - accuracy: 0.6556 - loss: 0.5953 - val_accuracy: 0.7526 - val_loss: 0.5545
Epoch 2/5
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m39s[0m 57ms/step - accuracy: 0.8664 - loss: 0.3262 - val_accuracy: 0.8076 - val_loss: 0.4423
Epoch 3/5
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m41s[0m 57ms/step - accuracy: 0.9480 - loss: 0.1445 - val_accuracy: 0.7830 - val_loss: 0.5575
Epoch 4/5
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m35s[0m 56ms/step - accuracy: 0.9810 - loss: 0.0572 - val_accuracy: 0.8020 - val_loss: 0.6616
Epoch 1/5
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m61s[0m 94ms/step - accuracy: 0.7342 - loss: 0.5128 - val_accuracy: 0.8488 - val_loss: 0.3504
Epoch 2/5
[1m625/625[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m80s[0m 92ms/step - accuracy: 0.9180 - loss: 0.2238 - val_accuracy: 0.8474 - val_loss: 0.3691
Epoch 3/5
[1m625/625


Оновлені Висновки
RNN модель:

Точність: 79.16%
Втрата: 0.6905
LSTM модель:

Точність: 83.63%
Втрата: 0.4165
Двостороння LSTM модель:

Точність: 84.15%
Втрата: 0.4689
Глибока RNN модель:

Точність: 77.84%
Втрата: 0.5029
Аналіз
RNN модель показала поліпшення точності, але все ще поступається LSTM моделям. Це підтверджує, що проста RNN менш ефективна для обробки довгих послідовностей через проблему затухаючих градієнтів.

LSTM модель показує значне покращення у порівнянні з RNN моделлю, демонструючи здатність краще обробляти послідовні дані.

Двостороння LSTM модель знову показала найвищу точність, що підкреслює її здатність враховувати контекст як з попередніх, так і з наступних слів у рецензії.

Глибока RNN модель продовжує поступатися LSTM моделям, підтверджуючи їхню перевагу в даному завданні.