<a href="https://colab.research.google.com/github/MarinaaaniraM/deep_test/blob/master/lstm.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import numpy as np
from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Dense, Activation, Embedding
from keras.layers import LSTM, SpatialDropout1D
from keras.datasets import imdb

# Устанавливаем seed для повторяемости результатов
np.random.seed(42)
# Максимальное количество слов (по частоте использования)
max_features = 5000
# Максимальная длина рецензии в словах
maxlen = 80

# Загружаем данные
(X_train, y_train), (X_test, y_test) = imdb.load_data(num_words=max_features)

Using TensorFlow backend.


Downloading data from https://s3.amazonaws.com/text-datasets/imdb.npz


In [0]:
# Заполняем или обрезаем рецензии
X_train = sequence.pad_sequences(X_train, maxlen=maxlen)
X_test = sequence.pad_sequences(X_test, maxlen=maxlen)

In [0]:
# Создаем сеть
model = Sequential()
# Слой для векторного представления слов
model.add(Embedding(max_features, 32))
model.add(SpatialDropout1D(0.2))
# Слой долго-краткосрочной памяти
model.add(LSTM(100, dropout=0.2, recurrent_dropout=0.2)) 
# Полносвязный слой
model.add(Dense(1, activation="sigmoid"))

In [0]:
# Копмилируем модель
model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

In [5]:
# Обучаем модель
model.fit(X_train, y_train, batch_size=64, epochs=7,
          validation_data=(X_test, y_test), verbose=2)
# Проверяем качество обучения на тестовых данных
scores = model.evaluate(X_test, y_test,
                        batch_size=64)
print("Точность на тестовых данных: %.2f%%" % (scores[1] * 100))

Train on 25000 samples, validate on 25000 samples
Epoch 1/7
 - 105s - loss: 0.5131 - acc: 0.7447 - val_loss: 0.3957 - val_acc: 0.8246
Epoch 2/7
 - 104s - loss: 0.3753 - acc: 0.8402 - val_loss: 0.3869 - val_acc: 0.8303
Epoch 3/7
 - 103s - loss: 0.3405 - acc: 0.8575 - val_loss: 0.3810 - val_acc: 0.8310
Epoch 4/7
 - 104s - loss: 0.3147 - acc: 0.8734 - val_loss: 0.3757 - val_acc: 0.8332
Epoch 5/7
 - 104s - loss: 0.2974 - acc: 0.8788 - val_loss: 0.3846 - val_acc: 0.8359
Epoch 6/7
 - 104s - loss: 0.2785 - acc: 0.8872 - val_loss: 0.3937 - val_acc: 0.8321
Epoch 7/7
 - 103s - loss: 0.2634 - acc: 0.8942 - val_loss: 0.3916 - val_acc: 0.8285
Точность на тестовых данных: 82.85%
