# Определение тональности отзывов на фильмы в базе IMDB

Чтобы запускать и редактировать код, сохраните копию этого ноутбука себе (File->Save a copy in Drive...). Свою копию вы сможете изменять и запускать.

In [None]:
import numpy as np
from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Dense, Activation, Embedding
from keras.layers import LSTM, SpatialDropout1D
from keras.datasets import imdb

In [None]:
# Максимальное количество слов (по частоте использования)
max_features = 5000
# Максимальная длина рецензии в словах
maxlen = 80

## Загружаем данные

In [None]:
(X_train, y_train), (X_test, y_test) = imdb.load_data(num_words=max_features)

## Предварительная обработка рецензий

In [None]:
X_train = sequence.pad_sequences(X_train, maxlen=maxlen)
X_test = sequence.pad_sequences(X_test, maxlen=maxlen)

## Создаем нейронную сеть

In [None]:
model = Sequential()
# Слой для векторного представления слов
model.add(Embedding(max_features, 32))
model.add(SpatialDropout1D(0.2))
# Слой долго-краткосрочной памяти
model.add(LSTM(100, dropout=0.2, recurrent_dropout=0.2)) 
# Полносвязный слой
model.add(Dense(1, activation="sigmoid"))

**Печаем информацию о сети**

In [None]:
print(model.summary())

**Компилируем модель**

In [None]:
model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

## Обучаем модель

In [None]:
model.fit(X_train, y_train, batch_size=64, epochs=7,
          validation_data=(X_test, y_test), verbose=2)

## Оцениваем качество обучения сети

In [None]:
scores = model.evaluate(X_test, y_test,
                        batch_size=64)
print("Аккуратность на тестовых данных: %.2f%%" % (scores[1] * 100))