# RNNとは？
再帰型ニューラルネットワーク(RNN)は自然言語処理の分野や時系列データの扱いで高い成果をあげ、現在最も注目されているアルゴリズムの一つです。  
RNNの利点は文章など連続的な情報を利用できる点です。  
従来のニューラルネットワークの考え方はそうではなく、インプットデータ（またアウトプットデータも）は互いに独立の状態にある(1つの特徴だけで説明されている)、と仮定します。  
しかしこの仮定は多くの場合、適切ではありません。  
例えば次の言葉を予測したい場合、その前の言葉が何だったのかを知っておくべきですよね？  
他にも周期性のあるデータ(時系列データ)は前日の曜日や前の月などのデータも重要になります。  
RNNのRはReccurent（再帰）という意味で、直前の計算に左右されずに、連続的な要素ごとに同じ作業を行わせることができます。  
言い方を変えると、RNNは以前に計算された情報を覚えるための記憶力を持っています。  
理論的にはRNNはとても長い文章の情報を利用することが可能です。

## 実装はcommo　timelayersで行なっています。

# kerasを使った実装

In [1]:
from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Input, Dense, Embedding
from keras.models import Model
from keras.layers import SimpleRNN
from keras.datasets import imdb

max_features = 10000
maxlen = 40
batch_size = 32

print('load dataset')
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=max_features)

print('padding')
x_train = sequence.pad_sequences(x_train, maxlen=maxlen)
x_test = sequence.pad_sequences(x_test, maxlen=maxlen)

print('build model')
inp = Input(shape=(maxlen,), dtype='int32', name='main_input')
x = Embedding(max_features, 128)(inp)
simple_rnn_out = SimpleRNN(32)(x)
predictions = Dense(1, activation='sigmoid')(simple_rnn_out)
model = Model(inputs=inp, outputs=predictions)

model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

print('train')
model.fit(x_train, y_train,
          batch_size=batch_size,
          epochs=3,
          validation_data=(x_test, y_test))
score, acc = model.evaluate(x_test, y_test,
                            batch_size=batch_size)
print('Test score:', score)
print('Test accuracy:', acc)

Using TensorFlow backend.


load dataset
Downloading data from https://s3.amazonaws.com/text-datasets/imdb.npz
padding
build model
train
Train on 25000 samples, validate on 25000 samples
Epoch 1/3
Epoch 2/3
Epoch 3/3
Test score: 0.6343636835002899
Test accuracy: 0.76


array([[  22,   21,  134, ...,   19,  178,   32],
       [ 152,  491,   18, ...,   16,  145,   95],
       [  23,   22,   12, ...,    7,  129,  113],
       ...,
       [ 234, 2766,  234, ...,    4, 3586,    2],
       [  14,  123,    5, ...,   12,    9,   23],
       [1468,    2,  497, ...,  204,  131,    9]], dtype=int32)