In [6]:
# СОСНЮК КАТЕРИНА ФІТ 4-6 ВАРІАНТ 22 
# Створити RNN для семантичного аналізу тексту з використанням моделі GRU
import numpy as np
import re
from tensorflow.keras.layers import Dense, GRU, Input, Dropout, Embedding, Bidirectional
from tensorflow.keras.models import Sequential
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.callbacks import EarlyStopping

texts_true = [
    "Це чудовий фільм. Дуже рекомендую!",
    "Обожнюю цю книгу. Вона фантастична!",
    "Чудове обслуговування від цієї компанії. Дуже задоволений!",
]

texts_false = [
    "Не сподобався продукт. Здається, я витратив гроші даремно.",
    "Жахливе обслуговування! Не рекомендую нікому.",
    "Найгірший фільм, який я коли-небудь бачив. Повністю розчарований.",
]

texts = texts_true + texts_false
labels = [1] * len(texts_true) + [0] * len(texts_false)

maxWordsCount = 1000
tokenizer = Tokenizer(num_words=maxWordsCount, lower=True, split=' ')
tokenizer.fit_on_texts(texts)

sequences = tokenizer.texts_to_sequences(texts)
data = pad_sequences(sequences, maxlen=10)

labels = np.array(labels)
labels = np.vstack((labels, 1 - labels)).T

indices = np.arange(data.shape[0])
np.random.shuffle(indices)
data = data[indices]
labels = labels[indices]

model = Sequential([
    Embedding(maxWordsCount, 64),
    Bidirectional(GRU(128, return_sequences=True)),
    Dropout(0.5),
    Bidirectional(GRU(64)),
    Dropout(0.5),
    Dense(2, activation='softmax')
])

model.compile(loss='categorical_crossentropy', optimizer=Adam(0.001), metrics=['accuracy'])
model.summary()

early_stopping = EarlyStopping(monitor='val_loss', patience=10, restore_best_weights=True)
history = model.fit(data, labels, batch_size=32, epochs=50, validation_split=0.2, callbacks=[early_stopping])

def predict_sentiment(text):
    sequence = tokenizer.texts_to_sequences([text])
    data = pad_sequences(sequence, maxlen=10)
    prediction = model.predict(data)
    return "Позитивний" if np.argmax(prediction) == 0 else "Негативний"




Epoch 1/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 7s/step - accuracy: 0.7500 - loss: 0.6891 - val_accuracy: 0.5000 - val_loss: 0.6950
Epoch 2/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 67ms/step - accuracy: 0.7500 - loss: 0.6760 - val_accuracy: 0.5000 - val_loss: 0.6925
Epoch 3/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 63ms/step - accuracy: 0.5000 - loss: 0.6746 - val_accuracy: 0.5000 - val_loss: 0.6903
Epoch 4/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 62ms/step - accuracy: 0.7500 - loss: 0.6643 - val_accuracy: 0.5000 - val_loss: 0.6885
Epoch 5/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 63ms/step - accuracy: 0.7500 - loss: 0.6707 - val_accuracy: 0.5000 - val_loss: 0.6869
Epoch 6/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 62ms/step - accuracy: 0.7500 - loss: 0.6304 - val_accuracy: 0.5000 - val_loss: 0.6852
Epoch 7/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━

In [7]:
test_text = "Дійсно сподобався цей фільм!"
print(predict_sentiment(test_text))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 554ms/step
Позитивний


In [8]:
test_text = "Жахливе обслуговування! Не рекомендую нікому."
print(predict_sentiment(test_text))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 20ms/step
Негативний


In [None]:
#ВИСНОВКИ: БУЛО СТВОРЕНО RNN ДЛЯ СЕМАНТИЧНОГО АНАЛІЗУ ТЕКСТУ З ВИКОРИСТАННЯМ МОДЕЛІ GRU, ОТРИМАНО ПОЗИТИВНИЙ ТА НЕГАТИВНИЙ ВІДГУКИ