-----------------------------------------------------
*Draft*
v4. 30-Nov-18

# Analysis 과정 - Deep Learning

# MLP in `tensorflow`

## `tensorflow`의 작동원리

* **`텐서플로` : 머신러닝의 심층 신경망 구현을 위한 소프트웨어 프레임워크**

<img src="images/mlp_tf/image_tensor_new.png" width=550 height=550 align="center">

###  Tensor

<img src="images/mlp_tf/mnist.png" width=600 height=600 align="center">
<font color="grey"><div style="text-align: right"> [참조] derindelimavi.blogspot.com/2015/04/mnist-el-yazs-rakam-veri-seti.html

####  `텐서` 
: 텐서플로우에서 딥러닝의 데이터를 표현하는 방법 Tensor object

* 주로 행렬로 그래프에 전달됨
* 스칼라, 벡터, 행렬, 다차원 배열 등 다양한 단위가 가능함
* [참고] 텐서 tensor : n 차원 배열을 가리키는 수학 용어 (텐서플로 이름의 유래)
    * 1 x 1 텐서 = 스칼라
    * 1 x n 텐서 = 벡터
    * n x n 텐서 = 행렬
    * n x n x n 텐서 = 3차원 배열 <br>

<img src="images/mlp_tf/structure.png" width=650 height=650 align="center">

#### 텐서 배열과 형태
* **`get_shape()`** 메서드는 텐서의 형태를 정수의 튜플로 반환
    * 튜플의 원소의 개수 : 텐서의 차원수 
    * 튜플의 각 정수 : 해당 차원의 배열 항목의 개수

In [1]:
import tensorflow as tf
import numpy as np 

  return f(*args, **kwds)
  return f(*args, **kwds)


In [None]:
a = tf.constant([1, 2, 3])

print(a.get_shape())

In [None]:
b = tf.constant([[1, 2, 3], 
                 [4, 5, 6]]) 

print(b.get_shape()) # 차원은 2개, # 각 차원의 항목의 개수

In [None]:
c = tf.constant([[1],
                 [2],
                 [3]])

print(c.get_shape())

#### 텐서 타입 
<img src="images/mlp_tf/tensor_type_new.png" width=600 height=600 align="center">

-  **`variable` : 변수. 연산 과정에서 업데이트 되는 값**
    * 학습과정에서 조정되는 모델의 매개변수(가중치, 편향 등)를 표현하는 방법    
    - y = `W`x + `b` + 2
    * ** tf.Variable( initial_value ) ** : 초기값과 초기화 작업이 필요

In [None]:
W = tf.Variable(tf.random_normal([3, 2])) # 변수 생성 (초기값 지정)


init_op = tf.global_variables_initializer() # 초기화
with tf.Session() as sess:
    sess.run(init_op)       # 초기화 실행
    print(sess.run(W))      # 변수 실행

- **`constant` : 고정된 상수값**
    * y = Wx + b + `2`
    * **tf.constant( value**, dtype, shape, name **)** 

In [None]:
c1 = tf.constant("Hello") # 고정값 생성
c2 = tf.constant(2) 
c3 = tf.constant(-1.0, shape=[2, 3]) # 고정값 생성 & shape 지정


with tf.Session() as sess:
    print(sess.run(c1)); print(sess.run(c2)); print(sess.run(c3))

- **`placeholder` : 빈 변수. 나중에 입력값을 공급받기 위한 텐서플로 구조**
    * 그래프가 실행되는 시점에 플레이스홀더에 입력 데이터가 들어감  
    - `y` = W`x` + b + 2
    * **tf.placeholder( shape, dtype**, name )
        - 입력될 데이터의 shape, dtype 정의
        - shape이 None이면 모든 크기의 데이터를 받을 수 있다는 의미
        - 그래프 실행 시점에 feed_dict 인수를 사용해 딕셔너리 형태로 입력 값을 받음

In [None]:
input_data = [[1,2]] # 입력 데이터

X = tf.placeholder(tf.float32, shape= [None, 2]) # 플레이스홀더 생성
W = 2
node = tf.add(X, W) # 덧셈 연산


with tf.Session() as sess:
    print(sess.run(node, feed_dict={X: input_data})) # 실행시점에 입력 데이터가 들어감

### Graph와 Session

<img src="images/mlp_tf/tensor_mechanism.png" width=700 height=700 align="center">
<font color="grey"><div style="text-align: right"> [참조] www.mathwarehouse.com

* **`Graph` : 알고리즘을 구성하는 연산의 상호작용(흐름) 그래프**
    - **노드** : 하나의 연산
    - **엣지** : 연산에 의해 소비되거나 생성되는 데이터
    - **tf.< operator >** 메소드를 사용하여 연산 그래프 구성
        - tf.add(), matmul(), multiply(), subtract(), divide() 등

In [None]:
tensor_a = tf.constant([[1, 2, 3],
                        [4, 5, 6]])

tensor_b = tf.constant([[2],
                        [3],
                        [2]])

In [None]:
node_c = tf.matmul(tensor_a, tensor_b)

<img src="images/mlp_tf/graph_concept_new.png" width=500 height=500 align="center">

* **`Session` : 정의한 연산 그래프 실행**
    * 세션은 그래프를 CPU 또는 GPU와 같은 하드웨어에 올려주고 실행하도록 하는 텐서플로 API
    * **세션 생성**
        - tf.Session( )
    * **세션 실행**
        - Session 객체의 .run( ) 메서드에 출력하려는 노드값 입력
        - 메서드가 호출되면, 출력하려는 노드에서 시작해 역방향으로 의존관계에 따라 필요한 노드들만 연산 수행
        - tf.Session.run(accuracy)
    * **세션 종료**
        - Session 객체의 .close( ) 명령을 사용해 세션을 종료
        - 세션에서 사용하는 자원을 해제하는 습관 가지는 것이 좋음
    * **자동 세션 종료**
        - 파이썬의 with 구문을 사용하여 세션을 열면 모든 연산이 완료된 후 자동으로 세션이 닫힘
        - with tf.Session( ) as sess :

In [None]:
node_c

In [None]:
with tf.Session() as sess:
    edge_d = sess.run(node_c)
    
print(edge_d)

* **`name` : 텐서 객체마다 가지는 고유의 이름**
    - 하나의 그래프 내의 객체는 동일한 이름을 가질 수 없음
    - 변수의 이름과는 다름
    -  .name 속성을 사용
    - name 입력 시에도 값 출력 가능<br><br>

In [101]:
tf.reset_default_graph()
v1 = tf.Variable(1., name='v1')
v2 = tf.Variable(2., name='v2')

print(v1.name)
print(v2.name)

v1:0
v2:0


In [102]:
with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    print(sess.run("v1:0"))

1.0


In [103]:
v1 = tf.Variable(1., name='v1')
v2 = tf.Variable(2., name='v2')

print(v1.name)
print(v2.name)

v1_1:0
v2_1:0


* **`name_scope` : 크고 복잡한 그래프인 경우, 쉽게 관리하기 위해, 노드를 그룹화**
    - 각 tensor마다 고유의 name이 있기 때문에, 좀 더 구조적인 관리를 위해 name_scope 사용
    - 그래프의 구조를 시각화 할 때 유용
    - with tf.name_scope(“접두사”)

In [104]:
with tf.name_scope("scope1"):
    v1 = tf.Variable(1., name='v1')
    v2 = tf.Variable(2., name='v2')
    v3 = tf.get_variable("v3",1,initializer=tf.constant_initializer(3.))
    v4 = tf.get_variable("v4",1,initializer=tf.constant_initializer(4.))

print(v1.name)
print(v2.name)
print(v3.name)
print(v4.name)

scope1/v1:0
scope1/v2:0
v3:0
v4:0


* **`variable scope` : name scope처럼 기존에 존재하는 변수를 신규생성하지 않고 name scope으로 관리 가능**
    - tf.get_variable()은 name_scope 영향을 받지 않고 그래프에 기존 이름이 있으면 새로운 이름을 생성
    - tf.get_variable()도 name_sceop 영향을 받을 수 있도록 도와주는 것이 variable scope 
    - 기존 변수를 그대로 가지고 올 수 있음

In [83]:
with tf.variable_scope("scope2"):
    v1 = tf.Variable(1., name='v1')
    v2 = tf.Variable(2., name='v2')
    v3 = tf.get_variable("v3",1,initializer=tf.constant_initializer(3.))
    v4 = tf.get_variable("v4",1,initializer=tf.constant_initializer(4.))

print(v1.name)
print(v2.name)
print(v3.name)
print(v4.name)

scope2/v1:0
scope2/v2:0
scope2/v3:0
scope2/v4:0


In [84]:
with tf.variable_scope("scope2", reuse=True): # 기존 생성된 변수가 없으면
    v3_ = tf.get_variable("v3")

with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    print(sess.run(v3_))
    print(sess.run(v3))
    
    print(v3_.name)
    print(v3.name)

[3.]
[3.]
scope2/v3:0
scope2/v3:0


![tensors_flowing](images/mlp_tf/tensors_flowing.gif "tensors_flowing")
<font color="grey"><div style="text-align: right"> [참조] www.tensorflow.org/guide/graphs

## [실습] MLP 구현

<img src="images/mlp_tf/mlp_concept.png" width=700 height=800 align="center">

### 데이터 로딩

In [None]:
import tensorflow as tf
import numpy as np
import random
import matplotlib.pyplot as plt

In [None]:
# 같은 랜덤값 생성
tf.set_random_seed(777)

# 훈련 데이터 로딩
train_x_mlp = np.load('data/train_x_mlp.npy')
train_y_mlp = np.load('data/train_y_mlp.npy')

# 테스트 데이터 로딩
test_x_mlp = np.load('data/test_x_mlp.npy')
test_y_mlp = np.load('data/test_y_mlp.npy')

In [None]:
# 훈련 데이터 확인
train_x_mlp[:10]

In [None]:
# 훈련 데이터 형태 확인
train_x_mlp.shape

In [None]:
train_y_mlp[:10]

In [None]:
train_y_mlp.shape

In [None]:
# 테스트 데이터 확인
test_x_mlp.shape

### 인풋 데이터
* **입력값이 들어갈 구조 생성**
    - **`tf.placeholder( 입력받을 데이터의 dtype, shape=[ 샘플 데이터 개수, 데이터의 원소 개수 ])`**
        - shape의 샘플 데이터 개수를 None으로 지정하면 모든 크기의 데이터를 받을 수 있다는 뜻
        - 그래프 실행 시점에 session.run() 메서드에 입력 데이터값 전달하면 플레이스 홀더에 입력값이 들어감

In [None]:
# 파라미터 설정
input_dim  = train_x_mlp.shape[1]
output_dim = train_y_mlp.shape[1]

layer1_unit_num = 4
layer2_unit_num = output_dim # 2


# 데이터 입력 (플레이스홀더) 
X = tf.placeholder(tf.float32, [None, input_dim]) # 3
Y_true = tf.placeholder(tf.float32, [None, output_dim]) # 2

### 레이어 구성

* **가중치 생성**
    - **` tf.Variable(초기값 설정)`**
        - tf.random_normal() : 랜덤값으로 초기화 
        - tf.zeros() : 0값으로 초기화
    - **` tf.Variable(tf.random_normal(shape= [ 입력 데이터 원소 개수 , 레이어의 원소 개수 ])`**
        - shape의 행은 입력 데이터의 원소 개수와 같아야 하고, 열은 생성하고 싶은 만큼 지정

<font color = "blue"> 레이어 그림 수정 필요
<img src="images/mlp_tf/mlp_concept.png" width=700 height=800 align="center">

* **레이어 생성**
    -  Layer1 =  **` tf.sigmoid( tf.matmul(입력데이터, 가중치1) + 편향1 )`**
    -  Layer2 =  **` tf.sigmoid( tf.matmul(Layer1 , 가중치2) + 편향2 )`**
    -  예측값 = ** Layer2 **
    
    

In [None]:
# 레이어 구성
W1 = tf.Variable(tf.random_normal(shape=(input_dim, layer1_unit_num)))
b1 = tf.Variable(tf.random_normal(shape=(layer1_unit_num,)))
Layer1 = tf.sigmoid(tf.matmul(X, W1) + b1)


W2 = tf.Variable(tf.random_normal(shape=(layer1_unit_num, layer2_unit_num)))
b2 = tf.Variable(tf.random_normal(shape=(layer2_unit_num,)))
Layer2 = tf.sigmoid(tf.matmul(Layer1, W2) + b2)


# 결과값 확인
Y_pred = Layer2

### 최적화 (학습)

- **실제 결과와 함수에서 예측한 결과의 차이를 확인 (loss)**
    *  `tf.losses.mean_squared_error( labels= 실제값, predictions= 예측값 )`
     <br><br>

-  **loss를 최소화하는 방향으로 모델 훈련 (Adam Optimizer 사용)**
    * `tf.train.AdamOptimizer( learning_rate ).minimize(loss)`    
        - 학습률 (learning rate) : 경사하강 최적화 함수가 전체 손실이 감소되도록 가중치를 이동시킬 때, 얼마나 빨리 이동할지를 제어

In [None]:
# 최적화
loss = tf.losses.mean_squared_error(labels = Y_true, predictions = Y_pred)
train_op = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

<font color = "blue"> batch 그림추가 필요

### 실행
* **세션 생성**
    *  `with tf.Session() as sess:`<br><br>
* **변수 초기화 실행**
    * `sess.run( tf.global_variables_initializer() )` <br><br>

* **반복학습 설정 (epoch, batch)**
    - **지정한 training_epoch을 모두 수행해야 학습이 최종 완료**
        <br> `for epoch in range(training_epochs):` <br><br>
    - **total_batch가 모두 수행되어야 epoch 1번을 수행한 것임**
         <br>    `for i in range(total_batch):`<br><br>
    
    - **batch_size에 따라 total_batch 개수가 결정됨**
        - `total_batch = int(len(train_x_mlp) / batch_size)`
        - batch_size : batch 1번에 사용할 데이터의 양
        - 전체 데이터 10개 / 배치 사이즈 2개 = 배치가 5번 돌아야 epoch 1 수행 <br><br>   
        
    - **batch_size만큼 데이터 슬라이싱**
        - `batch_x, batch_y = train_x_mlp[start:end], train_y_mlp[start:end]`<br><br>

* **모델 학습**
    * `sess.run([loss, train_op], feed_dict={X: batch_x, Y_true: batch_y})`
    * **.run( )에 수행하려는 연산을 입력 *
        * 학습은 loss의 최적화 과정이 이루어 지는 것을 의미하기 때문에 train_op를 입력
        * loss도 값 확인을 위해 실행
        
    * **feed_dict 사용하여 배치 사이즈만큼의 입력 데이터 지정**
        - 딕셔너리 형태로 제공
        - feed_dict={플레이스홀더 변수 이름 : 값의 이름}<br><br>

* **모델 평가** 
    - **loss값이 줄어드는 것으로 학습 정도를 확인**
    - **테스트 데이터를 입력값으로 제공하여 예측값과 실제값(test_y_mlp)을 비교**
    - `예측값 = sess.run(Y_pred, feed_dict={X: test_x_mlp}`

<font color = "blue"> batch 셔플 문의

In [None]:
# 파라미터 설정
training_epochs = 15
batch_size = 100


# 트레이닝 실행
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    for epoch in range(training_epochs):
        avg_loss = 0 # 초기값
        total_batch = int(len(train_x_mlp) / batch_size)
# 배치 셔플
        for i in range(total_batch):
            start = i * batch_size
            end = min(i*batch_size + batch_size, len(train_x_mlp))
            batch_x, batch_y = train_x_mlp[start:end], train_y_mlp[start:end]
            c, _ = sess.run([loss, train_op], feed_dict={X: batch_x, Y_true: batch_y})
            avg_loss += c / total_batch

        print('Epoch:', '%03d' % (epoch + 1), 'loss =', '{:.9f}'.format(avg_loss))

    print('----- Learning Finished! -----')
    

    # 모델 평가 (예측) 
    print("Prediction: ", sess.run(Y_pred, feed_dict={X: test_x_mlp[:1]}))
    print("True Label: ", test_y_mlp[:1])

<img src="images/mlp_tf/mlp_concept.png" width=700 height=800 align="center">

-----------------------------------------------------
*End of Document*