## 4.2 간단한 Classification 모델 구현하기

#### 털과 날개가 있느냐를 기준으로 포유류와 조류를 구분하는 신경망 모델을 만들자.

In [80]:
import tensorflow as tf
import numpy as np

In [81]:
## Definition of Training set
### Define feature data as [fur, fly]
### Existence == 1; Non-existence == 0;
x_data = np.array([[0, 0], [1, 0], [0, 0], [1, 1], [0, 0], [0, 1]])

### Define labed data as [None, Mammal, Birds]
y_data = np.array([[1, 0, 0],   ## None
                   [0, 1, 0],   ## Mammal
                   [1, 0, 0],
                   [0, 0, 1],   ## Birds
                   [1, 0, 0],
                   [0, 0, 1]])

#### 위와 같은 Labeling 방식을 One-hot encoding이라 한다.
#### 이것은 데이터가 가질 수 있는 값 중 표현하려는 값을 뜻하는 인덱스의 원소만 1로 표기하고 나머지는 0으로 표기하는 방식이다. 

In [82]:
### Placeholder
X = tf.placeholder(tf.float32)
Y = tf.placeholder(tf.float32)

In [83]:
### Weight & Bias
W = tf.Variable(tf.random_uniform([2, 3], -1., 1.))
b = tf.Variable(tf.zeros([3]))

##### X * W + b를 고려했을 때, X는 (Training Set 개수 * Feature 개수)이므로, W는 (Feature 개수 * Classification 개수)로 설정하는 것이 맞다.

In [84]:
### Neural Net Settings
### Activation = ReLU(X*W + b)
L = tf.add(tf.matmul(X, W), b)
L = tf.nn.relu(L)

model = tf.nn.softmax(L)

#### 신경망을 통해 나온 출력을 Softmax 함수로 다듬어 준다. 이는 결과값들의 전체 합이 1이 되도록 정규화시켜주는 요소이다.

In [85]:
### Cross-Entropy Cost Function
cost = tf.reduce_mean(-tf.reduce_sum(Y * tf.log(model), axis = 1))

#### 실제 Label이 1인 것과 예측값 사이의 차이만 고려하는 Cost Function.

In [86]:
### Gradient Descent
optimizer = tf.train.GradientDescentOptimizer(learning_rate = 0.1)
train_op = optimizer.minimize(cost)

In [100]:
### Open & Initialize session
sess = tf.Session()
sess.run(tf.global_variables_initializer())
    
for step in range(100):
    sess.run(train_op, feed_dict = {X: x_data, Y: y_data})
        
    ### Print cost value every 10 iteration
    if (step + 1) % 10 == 0:
        print(step + 1, sess.run(cost, feed_dict = {X: x_data, Y: y_data}))

10 0.8616209
20 0.6619931
30 0.4706123
40 0.32308817
50 0.2182142
60 0.14749156
70 0.102030635
80 0.07310289
90 0.05469809
100 0.042508125


In [101]:
### Printing Prediction & Real
prediction = tf.argmax(model, axis = 1)
target = tf.argmax(Y, axis = 1)
print ("예측값: ", sess.run(prediction, feed_dict = {X: x_data}))
print ("실제값: ", sess.run(target, feed_dict = {Y: y_data}))

### Compute Accuracy
is_correct = tf.equal(prediction, target)
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))
print ("정확도: ", sess.run(accuracy * 100, feed_dict = {X: x_data, Y: y_data}))

예측값:  [0 1 0 2 0 2]
실제값:  [0 1 0 2 0 2]
정확도:  100.0


#### argmax 메소드는 해당 배열 중 가장 큰 원소의 index를 반환한다. 즉, 0은 None, 1은 Mammal, 2는 Birds에 대응된다.

#### 정확도가 좋지 않은 것은 Hidden Layer를 추가함으로써 해결 가능하다.

## 4.2 심층 신경망 구현하기

#### 심층 신경망은 은닉층이 존재하는 신경망을 일컫는다. 4.1에서 구현한 신경망에 Hidden Layer를 추가한다.

In [93]:
### Weight Setting
W1 = tf.Variable(tf.random_uniform([2, 10], -1., 1.))    ## Number of feature * Number of Hidden Layer 
W2 = tf.Variable(tf.random_uniform([10, 3], -1., 1.))    ## Number of Hidden Layer * Number of classifier

### Bias Setting
b1 = tf.Variable(tf.zeros([10]))
b2 = tf.Variable(tf.zeros([3]))

In [94]:
### Input Layer -> Hidden Layer
L1 = tf.add(tf.matmul(X, W1), b1)
L1 = tf.nn.relu(L1)

### Hidden Layer -> Input Layer
model = tf.add(tf.matmul(L1, W2), b2)

In [95]:
### Cost Function is Cross-Entropy & Algorithm is Adam Optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels = Y, logits = model))
optimizer = tf.train.AdamOptimizer(learning_rate = 0.01)
train_op = optimizer.minimize(cost)

#### AdamOptimizer는 GradientDescent가 아닌, 최소 parameter를 찾는 또다른 알고리즘이다.

In [96]:
### Open & Initialize session
sess = tf.Session()
sess.run(tf.global_variables_initializer())
    
for step in range(100):
    sess.run(train_op, feed_dict = {X: x_data, Y: y_data})
        
    ### Print cost value every 10 iteration
    if (step + 1) % 10 == 0:
        print(step + 1, sess.run(cost, feed_dict = {X: x_data, Y: y_data}))
        
### Printing Prediction & Real
prediction = tf.argmax(model, axis = 1)
target = tf.argmax(Y, axis = 1)
print ("예측값: ", sess.run(prediction, feed_dict = {X: x_data}))
print ("실제값: ", sess.run(target, feed_dict = {Y: y_data}))

### Compute Accuracy
is_correct = tf.equal(prediction, target)
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))
print ("정확도: ", sess.run(accuracy * 100, feed_dict = {X: x_data, Y: y_data}))

10 1.0030497
20 0.73868865
30 0.55730087
40 0.4315435
50 0.34388223
60 0.27922127
70 0.23183252
80 0.19648558
90 0.16910255
100 0.14730628
예측값:  [0 1 0 2 0 2]
실제값:  [0 1 0 2 0 2]
정확도:  100.0
