In [1]:
from keras.models import Sequential
from keras.layers import Dense, Activation, LSTM
from keras.optimizers import RMSprop
from keras.utils.data_utils import get_file
import numpy as np
import random
import sys

Using TensorFlow backend.


In [2]:
path = "./kazeno_matasaburo.txt"
bindata = open( path, "rb" ).read()

In [3]:
text = bindata.decode("sjis")

In [4]:
print( "Size of text: ", len(text))

Size of text:  33106


In [5]:
chars = sorted( list(set(text)) )
print("Total chars:", len(chars))

Total chars: 834


In [6]:
char_indices = dict( (c,i) for i, c in enumerate(chars) )
indices_char = dict( (i,c) for i,c in enumerate(chars) )

In [7]:
maxlen = 40
step = 3
sentences = []
next_chars = []

In [8]:
for i in range(0,len(text)-maxlen, step):
    sentences.append( text[i:i+maxlen] )
    next_chars.append( text[i+maxlen] )

In [9]:
print( "Number of senteces: ", len(sentences) )

Number of senteces:  11022


In [10]:
X = np.zeros((len(sentences), maxlen, len(chars) ), dtype=np.bool )
y = np.zeros((len(sentences), len(chars) ), dtype=np.bool)

In [11]:
for i, sentence in enumerate(sentences):
    for t, char in enumerate(sentence):
        X[i, t, char_indices[char]] = 1
    y[i, char_indices[next_chars[i]]] = 1

In [12]:
# モデルを定義する
model = Sequential()
model.add( LSTM(128, input_shape=(maxlen, len(chars))) )
model.add( Dense(len(chars)) )
model.add( Activation("softmax") )
optimizer = RMSprop( lr=0.01)
model.compile( loss="categorical_crossentropy", optimizer=optimizer )

In [13]:
def sample(preds, temperture=1.0 ):
    preds = np.asarray( preds ).astype("float64")
    preds = np.log(preds)/temperture
    exp_preds = np.exp(preds)
    preds = exp_preds / np.sum(exp_preds)
    probs = np.random.multinomial(1, preds, 1)
    return np.argmax(probs)

In [17]:
for iteration in range(1,60):
    print()
    print("-" * 50)
    print("繰り返し回数：", iteration)
    model.fit(X, y, batch_size=128, epochs=1)
    



--------------------------------------------------
繰り返し回数： 1
Epoch 1/1

--------------------------------------------------
繰り返し回数： 2
Epoch 1/1

--------------------------------------------------
繰り返し回数： 3
Epoch 1/1

--------------------------------------------------
繰り返し回数： 4
Epoch 1/1

--------------------------------------------------
繰り返し回数： 5
Epoch 1/1

--------------------------------------------------
繰り返し回数： 6
Epoch 1/1

--------------------------------------------------
繰り返し回数： 7
Epoch 1/1

--------------------------------------------------
繰り返し回数： 8
Epoch 1/1

--------------------------------------------------
繰り返し回数： 9
Epoch 1/1

--------------------------------------------------
繰り返し回数： 10
Epoch 1/1

--------------------------------------------------
繰り返し回数： 11
Epoch 1/1

--------------------------------------------------
繰り返し回数： 12
Epoch 1/1

--------------------------------------------------
繰り返し回数： 13
Epoch 1/1

--------------------------------------------------
繰り返し回数： 

In [16]:
start_index = random.randint(0,len(text)-maxlen-1)

for diversity in [0.2, 0.5, 1.0, 1.2]:
    print()
    print( "------ diversity", diversity  )
    
    generated = ""
    sentence = text[start_index:start_index+maxlen]
    generated += sentence
    print("------Seedを生成しました：" + '"' + sentence + '"' )
    sys.stdout.write( generated )

    for i in range(400):
        x = np.zeros( (1,maxlen, len(chars)) )
        for t, char in enumerate(sentence):
            x[0, t, char_indices[char]] = 1
            
        prediction = model.predict( x, verbose=0 )[0]
        next_index = sample( prediction, diversity )
        next_char = indices_char[next_index]
        
        generated += next_char
        sentence = sentence[1:] + next_char
        
        sys.stdout.write( next_char )
        sys.stdout.flush()
    
    print()
        
    


------ diversity 0.2
------Seedを生成しました："る曲げて、だあんだあんと水をたたくようにしながら斜めにならんで向こう岸へ泳ぎはじ"
る曲げて、だあんだあんと水をたたくようにしながら斜めにならんで向こう岸へ泳ぎはじまました。
「ああ、ああ、ああ、あああり、あああり、あありになったり、
「ああ。」
「おあ、あの木のです。」
「ああさんだ。」と言いながら、
「ああ。」
「ああ、あの前の木のです。」
「ああ。」
「おあ、
「ああ。」
「ああさんだ。」
「ああ。」
「ああ。」
「ああ。」
「ああ。」
「ああらったり、
「ああ、ああ、ああ、あの木ので、
「ああ、ああ、ああ、ああ、ああ、あの木のが、
「そのに、
「ああ、そのはあったり、とをはいて、
「ああ。」
「ああ。」
「ああ。」
「ああ。」
「ああ。」
「ああ。」と言いながら、
「あああり、そのから、
「ああ、ああ、又三郎が、
「ああ。」
「ああ。」
「その子は、
「ああ。」
「ああ。」
「ああ、ああ、あの木のです。」
「ああ。」
「ああ。」
「ああ、あり、あっちに、あっちになったり、

------ diversity 0.5
------Seedを生成しました："る曲げて、だあんだあんと水をたたくようにしながら斜めにならんで向こう岸へ泳ぎはじ"
る曲げて、だあんだあんと水をたたくようにしながら斜めにならんで向こう岸へ泳ぎはじまました。そして三郎はいまながら、
「んん。」と言いました。そしたのでした。
「ああ、
「風がら、
「ああ、「さん。」と言いながら、
「ああいるのようで、みんなはから、いんながらだ。」と言いながら、
「ああから、もうはするです。」と言いながらみたなったり、とわあ、ました。
「なあ。」
「ああ、三郎は、やっとあいました。
「おう、
「行が、そのから、そのらたのです。」
「みんなな。」
「そんだ。」
「その子のです。」
「ああ又三郎は、
「なんだ。」
「うん。」
「おらおらささ。」
「ああ。」
「あんだって、どんな。」
「先生さん、草の子のでした。
「あったり、そのはでも、一郎は、
「又三郎にす。」
「おさんな。」
「おくらする。」
「そのりはのでする。」
「ああ。」と言いました。一郎は、
「おらんだ。」
「みんなはあったりでした。
「

------ diversity