# Recurrent Neural Network  - Predict
간단하게 FCNN 과 CNN 을 설명하였다. RNN 은 Recurrent Neural Network 의 약자로 순차적인 데이터를 처리하기 위하여 고안이 되었다.  
예를들면 자연어 데이터 같은 것이 있을 수 있다. 본 예제는 https://github.com/sjchoi86/Tensorflow-101 을 참조하여 작성되었다. 

<H3>(1) Package Load</H3>   
아무래도 RNN 은 데이터 전처리 작업이 많다보니 여러가지 Package 들을 사용하게 된다. 

In [1]:
# Import Packages
import numpy as np
import tensorflow as tf
import collections
import argparse
import time
import os
from six.moves import cPickle
print ("Packages Imported")

Packages Imported


In [None]:
<H3>(2) Load Vocab</H3>   
Train 할때 구성했던 vocab 정보를 Load 한다. 

In [2]:
# Load chars and vocab
load_dir = "RNN_data/"
with open(os.path.join(load_dir, 'chars_vocab.pkl'), 'rb') as f:
    chars, vocab = cPickle.load(f)
vocab_size = len(vocab) 
print ("'vocab_size' is %d" % (vocab_size))

'vocab_size' is 98


In [None]:
<H3>(3) Configure Net Graph</H3>   
Train 하면서 훈련된 모델을 불러오기 위해서 동일한 Graph 를 재 정의해줘야 함 

In [3]:
# Important RNN parameters 
rnn_size   = 128
num_layers = 2

batch_size = 1 # <= In the training phase, these were both 50
seq_length = 1

# Construct RNN model 
unitcell   = tf.nn.rnn_cell.BasicLSTMCell(rnn_size)
cell       = tf.nn.rnn_cell.MultiRNNCell([unitcell] * num_layers)
input_data = tf.placeholder(tf.int32, [batch_size, seq_length])
istate     = cell.zero_state(batch_size, tf.float32)
# Weigths 
with tf.variable_scope('rnnlm'):
    softmax_w = tf.get_variable("softmax_w", [rnn_size, vocab_size])
    softmax_b = tf.get_variable("softmax_b", [vocab_size])
    with tf.device("/cpu:0"):
        embedding = tf.get_variable("embedding", [vocab_size, rnn_size])
        inputs = tf.split(1, seq_length, tf.nn.embedding_lookup(embedding, input_data))
        inputs = [tf.squeeze(_input, [1]) for _input in inputs]
# Output
def loop(prev, _):
    prev = tf.nn.xw_plus_b(prev, softmax_w, softmax_b)
    prev_symbol = tf.stop_gradient(tf.argmax(prev, 1))
    return tf.nn.embedding_lookup(embedding, prev_symbol)
outputs, final_state = tf.nn.seq2seq.rnn_decoder(inputs, istate, cell
                                          , loop_function=None, scope='rnnlm')
output = tf.reshape(tf.concat(1, outputs), [-1, rnn_size])

logits = tf.nn.xw_plus_b(output, softmax_w, softmax_b)
probs  = tf.nn.softmax(logits)

print ("Network Ready")

Network Ready


In [None]:
<H3>(34 Load Trained Model </H3>   
Train 된 Model 을 읽어서 Network 재 구성 

In [22]:
# Restore RNN
sess = tf.Session()
sess.run(tf.initialize_all_variables())
saver = tf.train.Saver(tf.all_variables())
ckpt  = tf.train.get_checkpoint_state(load_dir)

print (ckpt.model_checkpoint_path)
saver.restore(sess, ckpt.model_checkpoint_path)

Instructions for updating:
Use `tf.global_variables_initializer` instead.
Instructions for updating:
Please use tf.global_variables instead.
RNN_data/model.ckpt-3000


<H3>(5) Prediction Test </H3>   
원래 대화형 RNN 같은 것을 만드려고 하면 Data 훈련시 200 : 200 으로 훈련을 하였기 때문에 prime (시작하려는 Text 값) 이 200보다 작다면 뒤에 PAdding 을 붙인다던가 하는 행위를 한후에 Final State 를 200 번 반복하면서 값을 찾아야 할 것으로 보이나 아래의 Sample 코드는 그러한 부분들을 무시하고 입력된 값의 Final State 부터 정해진 Iteraion 횟수만큼 돌면서 그냥 택스트를 찍어낸다. 아래의 코드에서는  sample = np.argmax(p) 이 주석처리 되고 Random 한 값을 출력하도록 되어 있는데, 이 부분 또한 가장 확률이 높은 값으로 출력하는 것이 맞는 것으로 보인다.  

In [23]:
# Sampling function
def weighted_pick(weights):
    t = np.cumsum(weights)
    s = np.sum(weights)
    # 어디에 넣어야 List 를 계속 Sort 된 상태로 유지 할 수 있는지 반환 
    return(int(np.searchsorted(t, np.random.rand(1)*s)))

# Sample using RNN and prime characters
prime = "return_slock_file  "
state = sess.run(cell.zero_state(1, tf.float32))
for char in prime[:-1]:
    x = np.zeros((1, 1))
    x[0, 0] = vocab[char]
    state = sess.run(final_state, feed_dict={input_data: x, istate:state})

# Sample 'num' characters
ret  = prime
char = prime[-1] # <= This goes IN! 
num  = 1000
for n in range(num):
    x = np.zeros((1, 1))
    x[0, 0] = vocab[char]
    [probsval, state] = sess.run([probs, final_state]
        , feed_dict={input_data: x, istate:state})
    p      = probsval[0] 

    sample = weighted_pick(p)
    
    # 원래는 아래 것으로 하는게 이론에 맞는 것임 
    #sample = np.argmax(p)
    
    pred   = chars[sample]
    ret    = ret + pred
    char   = pred
    
print ("Sampling Done. \n___________________________________________\n")

print (ret)

Sampling Done. 
___________________________________________

return_slock_file                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          