In [1]:
# Імпорт необхідних бібліотек
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing import sequence

# Завантаження даних IMDB
max_features = 10000  # Кількість унікальних слів у датасеті
maxlen = 500  # Максимальна довжина рецензії (кількість слів)

(train_x, train_y), (test_x, test_y) = imdb.load_data(num_words=max_features)

# Заповнення або обрізка рецензій до однакової довжини
train_x = sequence.pad_sequences(train_x, maxlen=maxlen)
test_x = sequence.pad_sequences(test_x, maxlen=maxlen)

# Функція для створення та тренування моделі
def train_model(model, train_x, train_y, test_x, test_y, epochs=5, batch_size=64):
    model.compile(optimizer='adam',
                  loss='binary_crossentropy',
                  metrics=['accuracy'])
    
    history = model.fit(train_x, train_y,
                        epochs=epochs,
                        batch_size=batch_size,
                        validation_split=0.2,
                        verbose=1)
    
    test_loss, test_acc = model.evaluate(test_x, test_y, verbose=2)
    print(f'Accuracy on test set: {test_acc}')
    return history

# Простий RNN
simple_rnn_model = models.Sequential([
    layers.Embedding(input_dim=max_features, output_dim=128),
    layers.SimpleRNN(128),
    layers.Dense(1, activation='sigmoid')
])

print("Training Simple RNN model...")
simple_rnn_history = train_model(simple_rnn_model, train_x, train_y, test_x, test_y)

# LSTM
lstm_model = models.Sequential([
    layers.Embedding(input_dim=max_features, output_dim=128),
    layers.LSTM(128),
    layers.Dense(1, activation='sigmoid')
])

print("Training LSTM model...")
lstm_history = train_model(lstm_model, train_x, train_y, test_x, test_y)

# Двостороння LSTM
bi_lstm_model = models.Sequential([
    layers.Embedding(input_dim=max_features, output_dim=128),
    layers.Bidirectional(layers.LSTM(128)),
    layers.Dense(1, activation='sigmoid')
])

print("Training Bidirectional LSTM model...")
bi_lstm_history = train_model(bi_lstm_model, train_x, train_y, test_x, test_y)

# Глибока мережа з кількома LSTM шарами
deep_lstm_model = models.Sequential([
    layers.Embedding(input_dim=max_features, output_dim=128),
    layers.LSTM(128, return_sequences=True),
    layers.LSTM(128),
    layers.Dense(1, activation='sigmoid')
])

print("Training Deep LSTM model...")
deep_lstm_history = train_model(deep_lstm_model, train_x, train_y, test_x, test_y)

# Візуалізація результатів навчання
import matplotlib.pyplot as plt

def plot_history(histories, title):
    plt.figure(figsize=(12, 8))
    
    for name, history in histories:
        val_acc = history.history['val_accuracy']
        plt.plot(val_acc, label=name)
    
    plt.title(title)
    plt.xlabel('Epochs')
    plt.ylabel('Validation Accuracy')
    plt.legend()
    plt.show()

plot_history([('Simple RNN', simple_rnn_history), 
              ('LSTM', lstm_history), 
              ('Bidirectional LSTM', bi_lstm_history), 
              ('Deep LSTM', deep_lstm_history)], 
             'Validation Accuracy of Different RNN Models')


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/imdb.npz
[1m17464789/17464789[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 0us/step
Training Simple RNN model...
Epoch 1/5
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m59s[0m 182ms/step - accuracy: 0.5737 - loss: 0.6632 - val_accuracy: 0.6544 - val_loss: 0.6219
Epoch 2/5
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m60s[0m 191ms/step - accuracy: 0.7449 - loss: 0.5177 - val_accuracy: 0.6970 - val_loss: 0.5742
Epoch 3/5
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m57s[0m 183ms/step - accuracy: 0.8181 - loss: 0.4145 - val_accuracy: 0.8148 - val_loss: 0.4624
Epoch 4/5
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m60s[0m 193ms/step - accuracy: 0.7702 - loss: 0.4640 - val_accuracy: 0.6546 - val_loss: 0.6212
Epoch 5/5
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m63s[0m 202ms/step - accuracy: 0.8038 - loss: 0.4335 - val_accuracy: 0

### Пояснення коду:
- Імпорт бібліотек:
    - Імпортуємо необхідні модулі з TensorFlow, Keras та matplotlib.
- Завантаження та підготовка даних:
    - Завантажуємо датасет IMDB і обмежуємо кількість унікальних слів до 10,000. 
    - Також заповнюємо або обрізаємо рецензії до однакової довжини (500 слів).
- Функція для тренування моделі:
    - Створюємо функцію для компіляції, тренування та оцінки моделі.
- Створення та тренування моделей:
    - Простий RNN: Використовуємо шар SimpleRNN.
- LSTM:
    - Використовуємо шар LSTM.
- Двостороння LSTM:
    - Використовуємо шар Bidirectional з LSTM.
- Глибока LSTM: Використовуємо кілька LSTM шарів.
- Візуалізація результатів:
    - Відображаємо графіки точності валідації для всіх моделей, щоб порівняти їх продуктивність.

### Висновки:
Після тренування моделей та візуалізації результатів можна порівняти точність різних архітектур. Ви побачите, яка модель показує кращі результати і робить найменше помилок. Наприклад, двосторонні та глибокі LSTM моделі часто показують кращу точність у порівнянні з простими RNN завдяки своїй здатності краще захоплювати контекст у послідовностях.

Експериментуйте з різними архітектурами, кількістю нейронів, функціями активації, кількістю епох, розміром батчу та іншими гіперпараметрами, щоб знайти найкращу модель для вашого завдання.