# Урок 5. Рекуррентные нейронные сети

ЗАДАНИЕ 1

Попробуйте изменить параметры нейронной сети работающей с датасетом imdb так, чтобы улучшить ее точность. Приложите анализ.

In [5]:
from __future__ import print_function

import keras
from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Dense, Embedding
from keras.layers import LSTM
from keras.datasets import imdb

max_features = 20000

# обрезание текстов после данного количества слов (среди top max_features наиболее используемые слова)
maxlen = 80
batch_size = 50 # увеличьте значение для ускорения обучения

print('Загрузка данных...')
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)
print(len(x_train), 'тренировочные последовательности')
print(len(x_test), 'тестовые последовательности')

print('Pad последовательности (примеров в x единицу времени)')
x_train = sequence.pad_sequences(x_train, maxlen=maxlen)
x_test = sequence.pad_sequences(x_test, maxlen=maxlen)
print('x_train shape:', x_train.shape)
print('x_test shape:', x_test.shape)

print('Построение модели...')
model = Sequential()
model.add(Embedding(max_features, 128))
model.add(LSTM(128, dropout=0.2, recurrent_dropout=0.2))
model.add(Dense(1, activation='sigmoid'))

# стоит попробовать использовать другие оптимайзер и другие конфигурации оптимайзеров 
model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

print('Процесс обучения...')
model.fit(x_train, y_train,
          batch_size=batch_size,
          epochs=1, # увеличьте при необходимости
          validation_data=(x_test, y_test))
score, acc = model.evaluate(x_test, y_test,
                            batch_size=batch_size)
print('Результат при тестировании:', score)
print('Тестовая точность:', acc)

Загрузка данных...
25000 тренировочные последовательности
25000 тестовые последовательности
Pad последовательности (примеров в x единицу времени)
x_train shape: (25000, 80)
x_test shape: (25000, 80)
Построение модели...
Процесс обучения...


TypeError: Can not convert a NoneType into a Tensor or Operation.

In [6]:
import tensorflow as tf
print(tf.__version__)
print(keras.__version__)

2.2.0
2.3.1


**Не могу сделать д з к 5 уроку - ошибка в коде при обучении модели на imdb:**

model.fit(x_train, y_train,
batch_size=batch_size,
epochs=1, 
validation_data=(x_test, y_test))

TypeError: Can not convert a NoneType into a Tensor or Operation.

ЗАДАНИЕ 2.

Попробуйте изменить параметры нейронной сети генерирующий текст таким образом, чтобы добиться генерации как можно более осмысленного текста. Пришлите лучший получившейся у вас текст и опишите, что вы предприняли, чтобы его получить. Можно использовать текст другого прозведения.

In [7]:
import numpy as np
from keras.layers import Dense, Activation
from keras.layers.recurrent import SimpleRNN, LSTM, GRU
from keras.models import Sequential


# построчное чтение из примера с текстом 
with open("alice_in_wonderland.txt", 'rb') as _in:
    lines = []
    for line in _in:
        line = line.strip().lower().decode("ascii", "ignore")
        if len(line) == 0:
            continue
        lines.append(line)
text = " ".join(lines)
chars = set([c for c in text])
nb_chars = len(chars)


# создание индекса символов и reverse mapping чтобы передвигаться между значениями numerical
# ID and a specific character. The numerical ID will correspond to a column
# ID и определенный символ. Numerical ID будет соответсвовать колонке
# число при использовании one-hot кодировки для представление входов символов
char2index = {c: i for i, c in enumerate(chars)}
index2char = {i: c for i, c in enumerate(chars)}

# для удобства выберете фиксированную длину последовательность 10 символов 
SEQLEN, STEP = 10, 1
input_chars, label_chars = [], []

# конвертация data в серии разных SEQLEN-length субпоследовательностей
for i in range(0, len(text) - SEQLEN, STEP):
    input_chars.append(text[i: i + SEQLEN])
    label_chars.append(text[i + SEQLEN])


# Вычисление one-hot encoding входных последовательностей X и следующего символа (the label) y

X = np.zeros((len(input_chars), SEQLEN, nb_chars), dtype=np.bool)
y = np.zeros((len(input_chars), nb_chars), dtype=np.bool)
for i, input_char in enumerate(input_chars):
    for j, ch in enumerate(input_char):
        X[i, j, char2index[ch]] = 1
    y[i, char2index[label_chars[i]]] = 1


# установка ряда метапамертров  для нейронной сети и процесса тренировки
BATCH_SIZE, HIDDEN_SIZE = 128, 128
NUM_ITERATIONS = 1 # 25 должно быть достаточно
NUM_EPOCHS_PER_ITERATION = 1
NUM_PREDS_PER_EPOCH = 100


# Create a super simple recurrent neural network. There is one recurrent
# layer that produces an embedding of size HIDDEN_SIZE from the one-hot
# encoded input layer. This is followed by a Dense fully-connected layer
# across the set of possible next characters, which is converted to a
# probability score via a standard softmax activation with a multi-class
# cross-entropy loss function linking the prediction to the one-hot
# encoding character label.

'''
Создание очень простой рекуррентной нейронной сети. В ней будет один реккурентный закодированный входной слой. 
За ним последует полносвязный слой связанный с набором возможных следующих символов, 
которые конвертированы в вероятностные результаты через стандартную softmax активацию 
с multi-class cross-encoding loss функцию ссылающуются на предсказание one-hot encoding лейбл символа
'''

model = Sequential()
model.add(
    GRU(  # вы можете изменить эту часть на LSTM или SimpleRNN, чтобы попробовать альтернативы
        HIDDEN_SIZE,
        return_sequences=False,
        input_shape=(SEQLEN, nb_chars),
        unroll=True
    )
)
model.add(Dense(nb_chars))
model.add(Activation("softmax"))
model.compile(loss="categorical_crossentropy", optimizer="rmsprop")


# выполнение серий тренировочных и демонстрационных итераций 
for iteration in range(NUM_ITERATIONS):

    # для каждой итерации запуск передачи данных в модель 
    print("=" * 50)
    print("Итерация #: %d" % (iteration))
    model.fit(X, y, batch_size=BATCH_SIZE, epochs=NUM_EPOCHS_PER_ITERATION)

    # Select a random example input sequence.
    test_idx = np.random.randint(len(input_chars))
    test_chars = input_chars[test_idx]

    # для числа шагов предсказаний использование текущей тренируемой модели 
    # конструирование one-hot encoding для тестирования input и добавление предсказания.
    print("Генерация из посева: %s" % (test_chars))
    print(test_chars, end="")
    for i in range(NUM_PREDS_PER_EPOCH):

        # здесь one-hot encoding.
        X_test = np.zeros((1, SEQLEN, nb_chars))
        for j, ch in enumerate(test_chars):
            X_test[0, j, char2index[ch]] = 1

        # осуществление предсказания с помощью текущей модели.
        pred = model.predict(X_test, verbose=0)[0]
        y_pred = index2char[np.argmax(pred)]

        # вывод предсказания добавленного к тестовому примеру 
        print(y_pred, end="")

        # инкрементация тестового примера содержащего предсказание
        test_chars = test_chars[1:] + y_pred
print()

Итерация #: 0
Epoch 1/1
Генерация из посева:  on, turni
 on, turnia h hh  h  o o  oa oaaaaaa  o       oaaaaaaaaa          oaaaaaaaaa          oaaaaaaaaa          oaaa


In [10]:
def exploring_model(batch_size,epochs,RNN_type):
    model = Sequential()
    if RNN_type == 'LSTM':
        model.add(LSTM(HIDDEN_SIZE,
                       return_sequences=False,
                       input_shape=(SEQLEN, nb_chars),
                       dropout=0.2,
                       recurrent_dropout=0.2,
                       unroll=True))
    elif RNN_type == 'GRU':
        model.add(
            GRU(  # вы можете изменить эту часть на LSTM или SimpleRNN, чтобы попробовать альтернативы
                HIDDEN_SIZE,
                return_sequences=False,
                input_shape=(SEQLEN, nb_chars),
                unroll=True
            )
        )
    model.add(Dense(nb_chars))
    model.add(Activation("softmax"))
    model.compile(loss="categorical_crossentropy", optimizer="rmsprop")

    print('batch_size=',batch_size)
    print('epochs=',epochs)
    print('RNN_type=',RNN_type)
    
    # выполнение серий тренировочных и демонстрационных итераций 
    for iteration in range(NUM_ITERATIONS):

        # для каждой итерации запуск передачи данных в модель 
        print("=" * 50)
        print("Итерация #: %d" % (iteration))
        model.fit(X, y, batch_size=batch_size, epochs=epochs)

        # Select a random example input sequence.
        test_idx = np.random.randint(len(input_chars))
        test_chars = input_chars[test_idx]

        # для числа шагов предсказаний использование текущей тренируемой модели 
        # конструирование one-hot encoding для тестирования input и добавление предсказания.
        print("Генерация из посева: %s" % (test_chars))
        print(test_chars, end="")
        for i in range(NUM_PREDS_PER_EPOCH):

            # здесь one-hot encoding.
            X_test = np.zeros((1, SEQLEN, nb_chars))
            for j, ch in enumerate(test_chars):
                X_test[0, j, char2index[ch]] = 1

            # осуществление предсказания с помощью текущей модели.
            pred = model.predict(X_test, verbose=0)[0]
            y_pred = index2char[np.argmax(pred)]

            # вывод предсказания добавленного к тестовому примеру 
            print(y_pred, end="")

            # инкрементация тестового примера содержащего предсказание
            test_chars = test_chars[1:] + y_pred
    return y_pred

In [11]:
NUM_ITERATIONS=10

batch_sizes=[128,256,512]
epochses=[1,5,10]
RNN_types=['GRU','LSTM']
for batch_size in batch_sizes:
    for epochs in epochses:
        for RNN_type in RNN_types:
            exploring_model(batch_size,epochs,RNN_type)

batch_size= 128
epochs= 1
RNN_type= GRU
Итерация #: 0
Epoch 1/1
Генерация из посева: ir that wo
Итерация #: 1
Epoch 1/1
Генерация из посева: mallest id
Итерация #: 2
Epoch 1/1
Генерация из посева:  --mystery
Итерация #: 3
Epoch 1/1
Генерация из посева: eal mary a
Итерация #: 4
Epoch 1/1
Генерация из посева: fect: the 
Итерация #: 5
Epoch 1/1
Генерация из посева: isclaimer 
Итерация #: 6
Epoch 1/1
Генерация из посева: ! how funn
Итерация #: 7
Epoch 1/1
Генерация из посева: e was goin
Итерация #: 8
Epoch 1/1
Генерация из посева: k to the l
Итерация #: 9
Epoch 1/1
Генерация из посева: ep ebooks 
ep ebooks eiiiieeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeebatch_size= 128
epochs= 1
RNN_type= LSTM
Итерация #: 0
Epoch 1/1
Генерация из посева: refund fro
Итерация #: 1
Epoch 1/1
Генерация из посева:  not wish 
Итерация #: 2
Epoch 1/1
Генерация из посева: rtle went 
Итерация #: 3
Epoch 1/1
Генерация из посева:  it what y
Итерация #: 4
Epoch 1/1
Г

Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: y of room!
Итерация #: 4
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: ich), and 
Итерация #: 5
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: cii or oth
Итерация #: 6
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: ence to co
Итерация #: 7
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева:  hardly fi
Итерация #: 8
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: is, what? 
Итерация #: 9
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: hines in t
hines in t                                                                                                    batch_size= 128
epochs= 5
RNN_type= LSTM
Итерация #: 0
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева:  the white
Итерация #: 1
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: e, the coo
Итерация 

Epoch 4/5
Epoch 5/5
Генерация из посева: y and sadl
Итерация #: 6
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева:  just thin
Итерация #: 7
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: oo far! an
Итерация #: 8
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева:  knuckles.
Итерация #: 9
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Генерация из посева: ght size a
ght size annnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnbatch_size= 128
epochs= 10
RNN_type= GRU
Итерация #: 0
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: y rate, th
Итерация #: 1
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: ece out of
Итерация #: 2
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/

Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: voice of t
Итерация #: 5
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: nd barking
Итерация #: 6
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева:  dont talk
Итерация #: 7
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: , and did 
Итерация #: 8
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: er flaming
Итерация #: 9
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: ouldnt min
ouldnt min                                                                                                    batch_size= 128
epochs= 10
R

Epoch 9/10
Epoch 10/10
Генерация из посева: the cat in
Итерация #: 2
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева:  of equipm
Итерация #: 3
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева: ith curios
Итерация #: 4
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Генерация из посева:  i had our
Итерация #: 5
Epoch 1/10

KeyboardInterrupt: 

**Вывод:
лучше распознает последовательность сеть с типом='LSTM' и epochs=10 и batch_sizes=128**