In [1]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences


In [2]:
def create_gru_model(vocab_size, embedding_dim, maxlen):
    model = tf.keras.Sequential([
        tf.keras.layers.Embedding(vocab_size, embedding_dim, input_length=maxlen),
        tf.keras.layers.GRU(64, return_sequences=True),
        tf.keras.layers.GRU(32),
        tf.keras.layers.Dense(64, activation='relu'),
        tf.keras.layers.Dense(1, activation='sigmoid')
    ])
    return model


In [3]:

positive_reviews = [
    "Це був дуже захоплюючий фільм. Рекомендую всім!",
    "Виступ акторів був чудовим, історія захоплююча.",
    "Великий сюжет і чудова гра акторів!"
]

negative_reviews = [
    "Фільм був дуже нудним. Витрачений час.",
    "Жодних емоцій від перегляду цього фільму.",
    "Актори були безвиразними, сюжет нецікавий."
]

all_reviews = positive_reviews + negative_reviews

labels = np.array([1] * len(positive_reviews) + [0] * len(negative_reviews))

vocab_size = 1000
embedding_dim = 16
maxlen = 20
trunc_type='post'
padding_type='post'
oov_tok = "<OOV>"
training_size = len(all_reviews)

tokenizer = Tokenizer(num_words=vocab_size, oov_token=oov_tok)
tokenizer.fit_on_texts(all_reviews)
word_index = tokenizer.word_index

sequences = tokenizer.texts_to_sequences(all_reviews)
padded = pad_sequences(sequences, maxlen=maxlen, padding=padding_type, truncating=trunc_type)

split = int(0.8 * training_size)

train_sequences = padded[:split]
test_sequences = padded[split:]
train_labels = labels[:split]
test_labels = labels[split:]

gru_model = create_gru_model(vocab_size, embedding_dim, maxlen)
gru_model.compile(loss='binary_crossentropy',optimizer='adam',metrics=['accuracy'])
gru_model.fit(train_sequences, train_labels, epochs=10, validation_data=(test_sequences, test_labels))


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.src.callbacks.History at 0x7a7768897220>