In [43]:
import numpy as np
from tensorflow.keras.layers import Dense, GRU, Embedding, Bidirectional
from tensorflow.keras.models import Sequential
from tensorflow.keras.optimizers import Adamax
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

texts_true = [
    "Цей фільм був надзвичайно захоплюючим і цікавим. Я отримав неймовірне задоволення від перегляду!",
    "Дуже задоволений роботою цієї компанії. Вони надзвичайні!",
    "Ця книга - справжнє диво літератури. Вона вражає своєю глибиною та мудрістю на кожній сторінці."
]

texts_false = [
    "Цей ресторан залишив мене розчарованим. Їжа була несмачною, обслуговування погане, а атмосфера нудна.",
    "Жахливе обслуговування! Не раджу нікому!",
    "Цей фільм - повний провал. Сюжет нудний, персонажі непривабливі, а акторська гра слабка."
]

# Об'єднання текстів
texts = texts_true + texts_false
count_true = len(texts_true)
count_false = len(texts_false)
total_lines = count_true + count_false
print(count_true, count_false, total_lines)

maxWordsCount = 1000
tokenizer = Tokenizer(num_words=maxWordsCount, filters='!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~\t\n\r«»', lower=True, split=' ', char_level=False)
tokenizer.fit_on_texts(texts)

max_text_len = 10
data = tokenizer.texts_to_sequences(texts)
data_pad = pad_sequences(data, maxlen=max_text_len)
print(data_pad)

X = data_pad
Y = np.array([[1, 0]]*count_true + [[0, 1]]*count_false)
print(X.shape, Y.shape)

indices = np.random.choice(X.shape[0], size=X.shape[0], replace=False)
X = X[indices]
Y = Y[indices]


model = Sequential()
model.add(Embedding(maxWordsCount, 128))
model.add(Bidirectional(GRU(128, return_sequences=True, activation='tanh')))
model.add(Bidirectional(GRU(64, activation='tanh')))
model.add(Dense(2, activation='softmax'))

model.compile(loss='categorical_crossentropy', metrics=['accuracy'], optimizer=Adamax(learning_rate=0.001))

history = model.fit(X, Y, batch_size=32, epochs=50)

def predict_sentiment(text):
    data = tokenizer.texts_to_sequences([text.lower()])
    data_pad = pad_sequences(data, maxlen=max_text_len)
    prediction = model.predict(data_pad)
    if prediction[0][0] > prediction[0][1]:
        return "Позитивний"
    else:
        return "Негативний"

positive = "Це найкращий фільм, який я коли-небудь бачив!"
negative = "Жахлива книга, я не рекомендую її."


3 3 6
[[ 6  7  8  9 10 11 12 13 14 15]
 [ 0  0  0 16 17 18 19 20 21 22]
 [27 28 29 30 31 32 33 34 35 36]
 [39 40 41 42 43  3 44  4 45 46]
 [ 0  0  0  0  0 47  3 48 49 50]
 [51 52 53 54 55 56  4 57 58 59]]
(6, 10) (6, 2)
Epoch 1/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 6s/step - accuracy: 0.6667 - loss: 0.6920
Epoch 2/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 1.0000 - loss: 0.6786
Epoch 3/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - accuracy: 1.0000 - loss: 0.6654
Epoch 4/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step - accuracy: 1.0000 - loss: 0.6508
Epoch 5/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - accuracy: 1.0000 - loss: 0.6340
Epoch 6/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - accuracy: 1.0000 - loss: 0.6142
Epoch 7/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/st

In [44]:
print(predict_sentiment(positive))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 519ms/step
Позитивний


In [45]:
print(predict_sentiment(negative))

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 21ms/step
Негативний
