
### 10. RNN

- 이미지 인식
    - CNN
- 자연어 인식
    - RNN (순환 신경망)

- 특징
    - 자연어 처리나 음성 인식처럼 순서가 있는 데이터를 처리하는데 강점
        - 다른 신경망은 상태가 고정된 데이터를 처리한다.
    - 어떤 문장 앞에 정보(단어, 문장)에 따라 전체 의미가 달라지거나, 앞의 정보로 다음 정보를 추측하는 경우
    사용하기에 성능이 좋음
    
    

#### 10.1 MNIST를 RNN으로

기본적인 RNN 그림
![RNN기본](./img/img1.JPG)

셀 : 한 덩어리의 신경망  
이 셀을 여러 개 중첩하여 심층 신경망을 만든다. 즉, 앞 단계에서 학습한 결과를 다음 단계 학습에 이용.  
따라서 학습 데이터를 단계별로 구분하여 입력해야 한다.  
-> MNIST 입력값도 단계별로 입력할 수 있도록 수정  
    - MNIST 28*28 :가로 한 줄의 28픽셀을 한 단계의 입력값으로 삼고, 세로줄이 총 28개로 28단계


![RNN_MNIST](./img/img2.JPG)



In [5]:
import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("..\data\mnist\data", one_hot = True)


Extracting ..\data\mnist\data\train-images-idx3-ubyte.gz
Extracting ..\data\mnist\data\train-labels-idx1-ubyte.gz
Extracting ..\data\mnist\data\t10k-images-idx3-ubyte.gz
Extracting ..\data\mnist\data\t10k-labels-idx1-ubyte.gz


In [6]:
learning_rate = 0.001
total_epoch = 30
batch_size = 128

n_input = 28  # 한 번에 입력받은 개수
n_step = 28   # RNN 단계
n_hidden = 128
n_class = 10


X = tf.placeholder(tf.float32, [None, n_step, n_input])
Y = tf.placeholder(tf.float32, [None, n_class])
W = tf.Variable(tf.random_normal([n_hidden, n_class]))
b = tf.Variable(tf.random_normal([n_class]))


In [7]:

# n_hidden개의 출력값을 같는 RNN 셀을 생성
# 신경망 구성을 위해 BasicRNNCell 함수 사용 (BasicLSTMCell, GRUCell 등 다양한 방식의 셀이 있음)
cell = tf.nn.rnn_cell.BasicRNNCell(n_hidden)



RNN 기본 신경망은 긴 단계의 데이터를 학습할 때 맨 뒤에서는 맨 앞의 정보를 잘 기억하지 못한다.  
이를 보완하기 위해 다양한 신경망 구조가 만들어졌고, 그중 가장 많이 사용 되는 것이 LSTM이다. (GRU는 구조가 좀 더 간단)

In [8]:

# dynamic_rnn 함수를 이용해 RNN 신경망을 완성한다.
# dynamic_rnn(생성한 셀, 입력값, 입력값의 자료형)
outputs, states = tf.nn.dynamic_rnn(cell, X, dtype = tf.float32)



실제로는 단계를 반복하는 과정을 거쳐야 한다.   

states = tf.zeros(batch_size)  
for i in range(n_step_):  
    outputs, states = cell(X[[:, i]], states)  
    ...  
  
dynamic_rnn 함수는 이 과정을 대신해 준다.(셀과 신경망 생성)

In [9]:

# RNN에서 나온 출력값을 가지고 최종 출력값을 만든다.
# 결과는 원-핫코딩 형태 => 손실함수로 softmax_cross_entropy_with_logits 사용
# 위 손실함수를 쓰려면 최종 결과값이 실측값 Y와 동일하게 [batch_size, n_class]여야 한다.

# outputs : [batch_size, n_step, n_hidden]
# -> [n_step, batch_size, n_hidden]
# n_step과 batch_size 차원 순서를 바꾸고
outputs = tf.transpose(outputs, [1, 0, 2])  

# -> [batch_size, n_hidden]
# n_step 차원을 제거하여 마지막 단계 결과값만 얻음 
outputs = outputs[-1]

# 최종 결과값
model = tf.matmul(outputs, W) + b


In [11]:
# 손실 함수
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(
                    logits = model, labels = Y))
# 최적화
optimizer = tf.train.AdamOptimizer(learning_rate).minimize(cost)



In [13]:
# 결과 확인

sess = tf.Session()
sess.run(tf.global_variables_initializer())

total_batch = int(mnist.train.num_examples / batch_size)

for epoch in range(total_epoch):
    total_cost = 0
    
    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        # 입력값 형태 변환
        batch_xs = batch_xs.reshape((batch_size, n_step, n_input))
        
        _, cost_val = sess.run([optimizer, cost],
                              feed_dict={X: batch_xs, Y: batch_ys})
        total_cost += cost_val
    print('Epoch::', '%04d' % (epoch + 1),
         'Avg. Cost::','{:.3f}.format(total_cost / total_batch)')
    
print('최적화 완료')

is_correct = tf.equal(tf.argmax(model, 1), tf.argmax(Y, 1))
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))

test_batch_size = len(mnist.test.images)
test_xs = mnist.test.images.reshape(test_batch_size, n_step, n_input)
test_ys = mnist.test.labels

print('정확도::', sess.run(accuracy, 
                       feed_dict={X:test_xs, Y:test_ys}))

Epoch:: 0001 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0002 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0003 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0004 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0005 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0006 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0007 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0008 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0009 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0010 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0011 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0012 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0013 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0014 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0015 Avg. Cost:: {:.3f}.format(total_cost / total_batch)
Epoch:: 0016 Avg. Cost:: 