In [1]:
from keras.models import Sequential

Using TensorFlow backend.


In [59]:
from keras.layers import Dense, Activation, LSTM

In [60]:
from keras.optimizers import RMSprop

In [61]:
from keras.utils.data_utils import get_file

In [62]:
import numpy as np

In [63]:
import random

In [64]:
import sys

In [65]:
path = './kazeno_matasaburo.txt'

In [66]:
bindata = open(path, "rb").read()

In [67]:
text = bindata.decode("shift_jis")

In [68]:
print('Size of text: ', len(text))

Size of text:  32608


In [69]:
chars = sorted(list(set(text)))

In [70]:
print('Total chars:', len(chars))

Total chars: 783


In [71]:
char_indices = dict((c, i) for i, c in enumerate(chars))

In [72]:
indices_char = dict((i, c) for i, c in enumerate(chars))

In [73]:
maxlen = 40

In [74]:
step = 3

In [75]:
sentences = []
next_chars = []

In [76]:
for i in range(0, len(text) - maxlen, step):
    sentences.append(text[i: i + maxlen])
    next_chars.append(text[i + maxlen])

In [77]:
print('Number of sentences: ', len(sentences))

Number of sentences:  10856


In [78]:
#テキストのベクト化

In [79]:
X = np.zeros((len(sentences), maxlen, len(chars)), dtype=np.bool)

In [80]:
y = np.zeros((len(sentences), len(chars)), dtype=np.bool)

In [81]:
for i, sentence in enumerate(sentences):
    for t, char in enumerate(sentence):
        X[i, t, char_indices[char]] = 1
    y[i, char_indices[next_chars[i]]] = 1

In [82]:
#モデルを定義する

In [83]:
model = Sequential()
model.add(LSTM(128, input_shape=(maxlen, len(chars))))

In [84]:
model.add(Dense(len(chars)))

In [85]:
model.add(Activation('softmax'))

In [86]:
optimizer = RMSprop(lr=0.01)

In [87]:
model.compile(loss='categorical_crossentropy', optimizer=optimizer)

In [91]:
def sample(preds, temperature=1.0):
    preds = np.asarray(preds).astype('float64')
    preds = np.log(preds) / temperature
    exp_preds = np.exp(preds)
    preds = exp_preds / np.sum(exp_preds)
    probas = np.random.multinomial(1, preds, 1)
    return np.argmax(probas)

In [92]:
for iteration in range(1, 60):
    print()
    print('-' * 50)
    print('繰り返し回数: ', iteration)
    model.fit(X, y, batch_size=128, epochs=1)

start_index = random.randint(0, len(text) - maxlen - 1)

for diversity in [0.2, 0.5, 1.0, 1.2]:
    print()
    print('------diversity', diversity)
    
    generated = ''
    sentence = text[start_index: start_index + maxlen]
    generated += sentence
    print('---- Seedを生成しました: ' + sentence + '"')
    sys.stdout.write(generated)
    
    for i in range(400):
        x = np.zeros((1, maxlen, len(chars)))
        for t, char in enumerate(sentence):
            x[0, t, char_indices[char]] = 1.
            
        preds = model.predict(x, verbose=9)[0]
        next_index = sample(preds, diversity)
        next_char = indices_char[next_index]
        
        generated += next_char
        sentence = sentence[1:] + next_char
        
        sys.stdout.write(next_char)
        sys.stdout.flush()
        
    print()


--------------------------------------------------
繰り返し回数:  1
Epoch 1/1

--------------------------------------------------
繰り返し回数:  2
Epoch 1/1

--------------------------------------------------
繰り返し回数:  3
Epoch 1/1

--------------------------------------------------
繰り返し回数:  4
Epoch 1/1

--------------------------------------------------
繰り返し回数:  5
Epoch 1/1

--------------------------------------------------
繰り返し回数:  6
Epoch 1/1

--------------------------------------------------
繰り返し回数:  7
Epoch 1/1

--------------------------------------------------
繰り返し回数:  8
Epoch 1/1

--------------------------------------------------
繰り返し回数:  9
Epoch 1/1

--------------------------------------------------
繰り返し回数:  10
Epoch 1/1

--------------------------------------------------
繰り返し回数:  11
Epoch 1/1

--------------------------------------------------
繰り返し回数:  12
Epoch 1/1

--------------------------------------------------
繰り返し回数:  13
Epoch 1/1

----------------------------------------------


--------------------------------------------------
繰り返し回数:  58
Epoch 1/1

--------------------------------------------------
繰り返し回数:  59
Epoch 1/1

------diversity 0.2
---- Seedを生成しました: いました。
　そこはたぶんは、野馬の集まり場所であったでしょう。霧の中に丸い広"
いました。
　そこはたぶんは、野馬の集まり場所であったでしょう。霧の中に丸い広いが言いました。みんなは前まにと見ていました。そのうしろから、
「おつ　　そのうしまって、んだんだか、
「なん、このうのなくらみんなはならと集まってしまいました。と思っていました。
「おうも。あ、」
「なん、この前をぐなぐ。」と言いました。
　ひはやっと一郎の木を見ながら手をあいました。
　はこまがなんのこうの山の上ほうではすこうでもまってくいっていました。
　嘉助はやっと起わかにないた。」ががやっと言いました。
「うわか、それから。」三郎が言いました。ました。
「おいらないがら、だっとよろ。」みんないが言いました。
「す。
「なんだ、あ、西あ、あいあい。」
「又三郎って来るのか。」
「あありない、ない。」
「ぼくさんはやって来たぞ。」三郎が言いました。
「おおいないがないな。」と言いながら本のほうはこんまた行きました。
　すると一郎は、どっこまわこってここ

------diversity 0.5
---- Seedを生成しました: いました。
　そこはたぶんは、野馬の集まり場所であったでしょう。霧の中に丸い広"
いました。
　そこはたぶんは、野馬の集まり場所であったでしょう。霧の中に丸い広いかわけできました。
　空い少し大きな楢、「はいっやって来たぞ。」一郎が言いました。
「おうち。一郎、
「おまあまた。」
「あ、あの木はすかすた。」
「あありな、、またす、三郎だみんながら、やっと白」
「待っていたのだった。」
　みんなはで嘉助は言いました。
「す。あ、はやはやはこうでは雨がしいでした。
　すると嘉助は半はやっと来たんだいます。一郎はにいましたが、十つもからました。
「あるおうい。」
「又三郎って来るのかないが。」と言いながら本のほうでき