In [2]:
from keras.callbacks import LambdaCallback
from keras.models import Sequential
from keras.layers import Dense, LSTM
from keras.optimizers import RMSprop
from keras.utils.data_utils import get_file
import numpy as np

import random
import sys
import io
import re

Using TensorFlow backend.
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])


In [7]:
path = 'story.txt'
with io.open(path) as f:
    text = f.read().lower()

text = re.sub(r'<.*>', '', text)
text = re.sub(r'\n', ' ', text)
text = re.sub(r' +', ' ', text)

print('corpus length:', len(text))

corpus length: 893988


In [9]:
chars = sorted(list(set(text)))
print('total chars:', len(chars))
char_indices = dict((c, i) for i, c in enumerate(chars))
indices_char = dict((i, c) for i, c in enumerate(chars))

total chars: 1486


In [10]:
maxlen = 40
step = 3
sentences = []
next_chars = []

for i in range(0, len(text) - maxlen, step):
    sentences.append(text[i: i + maxlen])
    next_chars.append(text[i + maxlen])
print('nb sequences:', len(sentences))

print('Vectorization...')
x = np.zeros((len(sentences), maxlen, len(chars)), dtype=np.bool)
y = np.zeros((len(sentences), len(chars)), dtype=np.bool)

for i, sentence in enumerate(sentences):
    for t, char in enumerate(sentence):
        x[i, t, char_indices[char]] = 1
    y[i, char_indices[next_chars[i]]] = 1

nb sequences: 297983
Vectorization...


In [11]:
print('Build model...')
model = Sequential()
model.add(LSTM(1024, input_shape=(maxlen, len(chars))))
model.add(Dense(len(chars), activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer=RMSprop(lr=0.001))

Build model...


In [12]:
def sample(preds, temperature=1.0):
    # helper function to sample an index from a probability array
    preds = np.asarray(preds).astype('float64')
    preds = np.log(preds) / temperature
    exp_preds = np.exp(preds)
    preds = exp_preds / np.sum(exp_preds)
    probas = np.random.multinomial(1, preds, 1)
    return np.argmax(probas)


def on_epoch_end(epoch, _):
    print('\n----- Generating text after Epoch: %d' % epoch)

    start_index = random.randint(0, len(text) - maxlen - 1)

    generated = ''
    sentence = text[start_index: start_index + maxlen]
    generated += sentence
    print('----- Generating with seed: "' + sentence + '"')
    sys.stdout.write(generated)

    for i in range(400):
        x_pred = np.zeros((1, maxlen, len(chars)))
        for t, char in enumerate(sentence):
            x_pred[0, t, char_indices[char]] = 1.

        preds = model.predict(x_pred, verbose=0)[0]
        next_index = sample(preds, 0.5)
        next_char = indices_char[next_index]

        generated += next_char
        sentence = sentence[1:] + next_char

        sys.stdout.write(next_char)
        sys.stdout.flush()
    print()

print_callback = LambdaCallback(on_epoch_end=on_epoch_end)

In [13]:
model.fit(x, y, batch_size=128, epochs=60, callbacks=[print_callback])


Epoch 1/60

----- Generating text after Epoch: 0
----- Generating with seed: "」의 끝 ※ 위의 동화는, 아래링크의 영어동화를 우리말로 해석한 것입니다"
」의 끝 ※ 위의 동화는, 아래링크의 영어동화를 우리말로 해석한 것입니다. 「가새 이 말 ) 한 번 말 주고 있었어요. 그가 다음 그가 그 정말에 나무 그녀의 두 번째에 앉아 있었어요. 그가 그 왕이 다시 “아가 있다 말했어요. “오고 여기 아무도 있는 거예요.” 하지만 그녀는 그 정이 하지 않는 거예요. 그러고 그가 어주 그래서 그 그리에 차리 그 “가지 그들이 그 애들을 그 하지만 그들을 때 이 말을 하지 않고 말했어요. “그럼 그 사람에 있는 거예요. 그래서 그가 그 후 번째 그 어느 이 도착했어요. 그들이 그 하지만 그 사람을 맞고 있었어요. 그때 그 고 이 없지 않았어요. 그녀가 배 미 있었어요. 그래서 그 후 모든 아들이 그 사람을 더 해주었어요. 그가 그 상에서 그 하지만 그 하나 거라고 그게 하지 않아 있었어요. 그가 다음에 그는 그 정말에 도착하고 말했어요. “
Epoch 2/60

----- Generating text after Epoch: 1
----- Generating with seed: "다면야,”라며 하인이 말했어요. “나도 연주를 멈추지요. 하지만 말에 책"
다면야,”라며 하인이 말했어요. “나도 연주를 멈추지요. 하지만 말에 책기 두 마리 여기 들어오더니 . 그 말이 그 자기 찾아 있는 그 나무 다시 나무 위로 돌아갔는데 그 애가 아들이 저를 하고 있었어요. 그 그 사람에 그 여자가 말했어요. “그 사람이 금 나가 자신의 사람들의 아내들의 말이 보니 하지만 그 몸을 그 애가 다 하나 나아 여기에 간 나무 한 명이 있는 사람들의 모두 집에서 부자를 하고 있었어요. 그 고기이 족의 집으로 나서 장을 다시 돌아오는 때 그녀가 다시 끼리를 하고 있었어요. 그리는 왕비가 그 애가 자신의 또 자신의 모습을 보고 있었고, 그 사

KeyboardInterrupt: 