In [1]:
from keras.models import Sequential
from keras.layers import Embedding, LSTM, Dense, Dropout
from keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.preprocessing.text import Tokenizer
from keras.optimizers import Adam
import numpy as np

In [8]:
reviews = [
    "Фільм був дуже нудним. Витрачений час.",
    "Нецікавий сюжет",
    "Погана гра акторів",
    "Сюжет та гра акторів зробили прегляд нестерпним"
    "Чудова картина, рекомендую до перегляду",
    "Гарні актори",
    "Чудовйи сюжет",
    "Відмінна гра акторів та сюжет"
    "Якісні ефекти"
    "Чудовий фільм з глибоким сенсом",
    "Жахливий фільм, втрачено час",
    "Цікава стрічка, рекомендую переглянути",
    "Нудний фільм, не вартий уваги",
    "Емоційний та захоплюючий фільм",
    "Сюжет слабкий, не вражає",
    "Фільм вразив своєю глибиною",
    "Занудний і нецікавий фільм",
]

labels = [1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0]  


tokenizer = Tokenizer(num_words=5000, filters='!–"—#$%&amp;()*+,-./:;<=>?@[\\]^_`{|}~\t\n\r«»', lower=True, split=' ', char_level=False)
tokenizer.fit_on_texts(reviews)
sequences = tokenizer.texts_to_sequences(reviews)

max_review_len = 100
padded_sequences = pad_sequences(sequences, maxlen=max_review_len)

In [3]:
model = Sequential()
model.add(Embedding(input_dim=5000, output_dim=128))
model.add(LSTM(128, dropout=0.2, recurrent_dropout=0.2))
model.add(Dense(1, activation='sigmoid'))

optimizer = Adam(learning_rate=0.001)

model.compile(optimizer=optimizer, loss='binary_crossentropy', metrics=['accuracy'])

In [9]:
labels = np.array(labels)
model.fit(padded_sequences, labels, batch_size=32, epochs=20, validation_split=0.2)

Epoch 1/20
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 82ms/step - accuracy: 0.5455 - loss: 0.7191 - val_accuracy: 0.3333 - val_loss: 0.8693
Epoch 2/20
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - accuracy: 0.5455 - loss: 0.7044 - val_accuracy: 0.3333 - val_loss: 0.8695
Epoch 3/20
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - accuracy: 0.5455 - loss: 0.7578 - val_accuracy: 0.3333 - val_loss: 0.8473
Epoch 4/20
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - accuracy: 0.6364 - loss: 0.7153 - val_accuracy: 0.3333 - val_loss: 0.8233
Epoch 5/20
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 59ms/step - accuracy: 0.6364 - loss: 0.6930 - val_accuracy: 0.3333 - val_loss: 0.8005
Epoch 6/20
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 71ms/step - accuracy: 0.6364 - loss: 0.6735 - val_accuracy: 0.3333 - val_loss: 0.7813
Epoch 7/20
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x1404717ee70>

In [20]:
test_reviews = [
   "Фільм був дуже нудним. Витрачений час",
    "цікавий сюжет",
    "Погана гра акторів",
    "Сюжет та гра акторів зробили прегляд нестерпним",
    "Чудова картина, рекомендую до перегляду",
    "Гарні актори",
    "Чудовйи сюжет",
    "Відмінна гра акторів та сюжет",
    "Якісні ефекти"
]

test_sequences = tokenizer.texts_to_sequences(test_reviews)
test_padded_sequences = pad_sequences(test_sequences, maxlen=max_review_len)

predictions = model.predict(test_padded_sequences)
print(predictions)

for i, review in enumerate(test_reviews):
    print(f"Рецензія: {review}\nПрогноз: {'негативний' if predictions[i] > 0.5 else 'позитивний'}\n")

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 19ms/step
[[0.6253472 ]
 [0.4588767 ]
 [0.65483284]
 [0.52061105]
 [0.3998398 ]
 [0.6482559 ]
 [0.41782767]
 [0.6683159 ]
 [0.45817843]]
Рецензія: Фільм був дуже нудним. Витрачений час
Прогноз: негативний

Рецензія: цікавий сюжет
Прогноз: позитивний

Рецензія: Погана гра акторів
Прогноз: негативний

Рецензія: Сюжет та гра акторів зробили прегляд нестерпним
Прогноз: негативний

Рецензія: Чудова картина, рекомендую до перегляду
Прогноз: позитивний

Рецензія: Гарні актори
Прогноз: негативний

Рецензія: Чудовйи сюжет
Прогноз: позитивний

Рецензія: Відмінна гра акторів та сюжет
Прогноз: негативний

Рецензія: Якісні ефекти
Прогноз: позитивний

