In [1]:
import tensorflow as tf
import numpy as np

In [2]:
seq_data = [['I',' ','am',' ','a',' ','boy'], ['나','는', ' ', '소년','이다'], ['I',' ','am',' ','a',' ','girl'], ['나','는', ' ', '소녀','다'], ['How',' ','often',' ','do',' ','you',' ','eat',' ','per',' ','day','?'], ['하루에', ' ', '얼마나', ' ', '자주', ' ', '드십니까','?'],['You',' ','are',' ','so',' ','beautiful'], ['당신','은', ' ', '너무', ' ', '아름답다'], ['Would', ' ', 'you', ' ', 'mind', ' ', 'helping', ' ', 'me', ' ', 'out', '?'], ['혹시', ' ', '도와', ' ', '주실', ' ', '수', ' ', '있나요', '?']]

In [3]:
char_arr = []
for seq in seq_data:
    char_arr += seq
char_arr += ['<S>', '</S>', '<P>']
char2num = {c:i for i, c in enumerate(set(char_arr))}
num2char = {i:c for i, c in enumerate(char2num.keys())}
dic_len = len(char2num)

In [4]:
def get_enc_max_length(seq_data):
    enc_max_len = 0
    for i, seq in enumerate(seq_data):
        if i%2==0:
            if enc_max_len < len(seq):
                enc_max_len = len(seq)
    return enc_max_len

In [5]:
def get_dec_max_length(seq_data):
    dec_max_len = 0
    for i, seq in enumerate(seq_data):
        if i%2==1:
            if dec_max_len < len(seq):
                dec_max_len = len(seq)
    return dec_max_len

In [6]:
def make_batch(seq_data):
    enc_max_len = get_enc_max_length(seq_data)
    dec_max_len = get_dec_max_length(seq_data)
    input_batch = []
    output_batch = []
    target_batch = []
    for i in range(len(seq_data)):
        input = []
        output = []
        target = []
        if i%2==0:
            for seq in seq_data[i]:
                input.append(char2num[seq])
            for i in range(len(seq_data[i]), enc_max_len):
                input.append(char2num['<P>'])
            input_batch.append(np.eye(dic_len)[input])
        else:
            output.append(char2num['<S>'])
            for seq in seq_data[i]:
                output.append(char2num[seq])
                target.append(char2num[seq])
            target.append(char2num['</S>'])
            for i in range(len(seq_data[i]), dec_max_len):
                output.append(char2num['</S>'])
                target.append(char2num['</S>'])
            output_batch.append(np.eye(dic_len)[output])
            target_batch.append(target)

    return input_batch, output_batch, target_batch

In [7]:
def get_enc_seq_length(seq_data):
    enc_seq_len = []
    for i, seq in enumerate(seq_data):
        if i%2==0:
            enc_seq_len.append(len(seq))
    return enc_seq_len

In [8]:
def get_dec_seq_length(seq_data):
    dec_seq_len = []
    for i, seq in enumerate(seq_data):
        if i%2==1:
            dec_seq_len.append(len(seq))
    return dec_seq_len

In [9]:
enc_seq_data = get_enc_seq_length(seq_data)
dec_seq_data = get_dec_seq_length(seq_data)

In [10]:
learning_rate = 1e-3
n_hidden = 256
n_enc_step = get_enc_max_length(seq_data)
n_dec_step = get_dec_max_length(seq_data)
total_epoch = 100
n_class = n_input = dic_len
batch_size = int(len(seq_data)/2)

In [42]:
tf.reset_default_graph()
enc_input = tf.placeholder(tf.float32, [None, None, n_input])
dec_input = tf.placeholder(tf.float32, [None, None, n_input])
targets = tf.placeholder(tf.int64, [None, None])
enc_seq_len = tf.placeholder(dtype=tf.int32, shape=[None])
dec_seq_len = tf.placeholder(dtype=tf.int32, shape=[None])

In [43]:
with tf.variable_scope('encode'):
    enc_cell = tf.nn.rnn_cell.GRUCell(n_hidden)
    #enc_cell = tf.nn.rnn_cell.DropoutWrapper(enc_cell, output_keep_prob=0.5)
    outputs, enc_states = tf.nn.dynamic_rnn(enc_cell, enc_input, sequence_length=enc_seq_len, dtype=tf.float32)

In [44]:
idx = tf.range(batch_size)*tf.shape(outputs)[1] + (enc_seq_len - 1)

In [45]:
last_enc_states = tf.gather(tf.reshape(outputs, [-1, n_hidden]), idx)

In [46]:
with tf.variable_scope('decode'):
    dec_cell = tf.nn.rnn_cell.BasicRNNCell(n_hidden)
    #dec_cell = tf.nn.rnn_cell.DropoutWrapper(dec_cell, output_keep_prob=0.5)
    outputs, dec_states = tf.nn.dynamic_rnn(dec_cell, dec_input, initial_state = last_enc_states, sequence_length=dec_seq_len, dtype=tf.float32)

In [47]:
logits = tf.layers.dense(outputs, n_class, activation=None)

In [48]:
cost = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits, labels=targets))
predict = tf.argmax(logits, 2)

In [49]:
optimizer = tf.train.AdamOptimizer(learning_rate).minimize(cost)

  "Converting sparse IndexedSlices to a dense Tensor of unknown shape. "


In [50]:
sess = tf.Session()
sess.run(tf.global_variables_initializer())

input_batch, output_batch, target_batch = make_batch(seq_data)

for epoch in range(total_epoch):
    _, loss = sess.run([optimizer, cost], feed_dict={enc_input: input_batch, dec_input: output_batch, targets: target_batch, enc_seq_len: enc_seq_data, dec_seq_len: dec_seq_data})
    if epoch % 10 == 9:
        result = sess.run(predict, feed_dict={enc_input: input_batch, dec_input: output_batch, targets: target_batch, enc_seq_len: enc_seq_data, dec_seq_len: dec_seq_data})
        translation = []
        for i in range(len(result)):
            decoded = [num2char[j] for j in result[i]]
            end = len(decoded)-1
            if '</S>' in decoded:
                end = decoded.index('</S>')
            translated = ''.join(decoded[:end])
            translation.append(translated)
        print('Epoch:', '%03d' % (epoch+1), 'cost =', '{:.6f}'.format(loss))
        print(translation)
print('optimization finished!')

Epoch: 010 cost = 2.526134
['나   다는는는는는', '나   다는는는는는', '나   있나요 수?는는', '나     는는는는', '나   주실 수?있나요?']
Epoch: 020 cost = 1.804328
['나는 소녀이다', '나는 소녀다', '하루에 얼마나 자주 드십니까?', '나는 너무 아름답다', '하루에 얼마나 자주 수 있나요?']
Epoch: 030 cost = 1.613161
['나는 소년이다', '나는 소년다', '하루에 얼마나 자주 드십니까?', '나은 너무 아름답다', '혹시 도와 주실 수 있나요?']
Epoch: 040 cost = 1.502281
['나는 소년이다', '나는 소년다', '하루에 얼마나 자주 드십니까?', '당신은 너무 아름답다', '혹시 도와 주실 수 있나요?']
Epoch: 050 cost = 1.467961
['나는 소년이다', '나는 소년다', '하루에 얼마나 자주 드십니까?', '당신은 너무 아름답다', '혹시 도와 주실 수 있나요?']
Epoch: 060 cost = 1.452948
['나는 소년이다', '나는 소녀다', '하루에 얼마나 자주 드십니까?', '당신은 너무 아름답다', '혹시 도와 주실 수 있나요?']
Epoch: 070 cost = 1.441691
['나는 소년이다', '나는 소녀다', '하루에 얼마나 자주 드십니까?', '당신은 너무 아름답다', '혹시 도와 주실 수 있나요?']
Epoch: 080 cost = 1.431067
['나는 소년이다', '나는 소녀다', '하루에 얼마나 자주 드십니까?', '당신은 너무 아름답다', '혹시 도와 주실 수 있나요?']
Epoch: 090 cost = 1.419355
['나는 소년이다', '나는 소녀다', '하루에 얼마나 자주 드십니까?', '당신은 너무 아름답다', '혹시 도와 주실 수 있나요?']
Epoch: 100 cost = 1.403966
['나는 소년이다', '나는 소녀다', '하루에 얼마나 자주 드십니까?', '당신은

In [40]:
result = sess.run(predict, feed_dict={enc_input: input_batch, dec_input: output_batch, targets: target_batch, enc_seq_len: enc_seq_data, dec_seq_len: dec_seq_data})
translation = []
for i in range(len(result)):
    decoded = [num2char[j] for j in result[i]]
    end = len(decoded)-1
    if '</S>' in decoded:
        end = decoded.index('</S>')
    translated = ''.join(decoded[:end])
    translation.append(translated)

In [41]:
for i, seq in enumerate(seq_data):
    if i%2==0:
        temp = ''
        for token in seq:
            temp += token
        print(temp, '->', translation[int(i/2)])

I am a boy -> 나는 소년이다
I am a girl -> 나는 소녀다
How often do you eat per day? -> 하루에 얼마나 자주 드십니까?
You are so beautiful -> 당신은 너무 아름답다
Would you mind helping me out? -> 혹시 도와 주실 수 있나요?
