## 7.  CNN (합성곱 신경망) 

#### 이미지 인식 분야에서 강력한 성능 발휘 + 자연어 처리와 음성인식에서 활용성도 뛰어남


## CNN = Convolution layer + Pooling layer 
: 지정한 영역의 값들을 하나의 값으로 압축함 

  #### Convolution layer : 가중치와 편향 적용   
  
  
      : 윈도우 크기만큼의 가중치, 1개의 편향 적용(= 커널, 필터: 모든 윈도우에 공통 적용)
  #### Pooling layer : 값들 중 하나를 선택해서 가져옴
  
  
  * 윈도우 : 지정한 크기의 영역
  * 스트라이드 : 몇 칸씩 움직일지 정하는 값 
  
  * 계산량이 매우 적어져 학습이 더 빠르고 효율적으로 이루어짐 (컨볼루션 계층에서 가중치를 적게 찾아도 되니까)
  
#### * 보통 커널을 여러 개 사용 (커널의 크기, 개수가 하이퍼파라미터임)  

In [1]:
# 모델 구현하기 

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("./mnist/data/", one_hot=True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use urllib or similar directly.
Successfully downloaded train-images-idx3-ubyte.gz 9912422 bytes.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting ./mnist/data/train-images-idx3-ubyte.gz
Successfully downloaded train-labels-idx1-ubyte.gz 28881 bytes.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting ./mnist/data/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Successfully downloaded t10k-images-idx3-ubyte.gz 1648877 bytes.
Extracting ./mnist/data/t10k-images-idx3-ubyte.gz
Successfully downloaded t10k-labels-idx1-ubyte.gz 4542 bytes.
Extracting ./mnist/data/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/datas

In [3]:
# 2D 컨볼루션의 경우 -> 2차원 평면으로 구성

X = tf.placeholder(tf.float32, [None, 28, 28, 1])
Y = tf.placeholder(tf.float32, [None, 10])
keep_prob = tf.placeholder(tf.float32)

In [4]:
# 1. First CNN layer
# L1 Conv shape=(?, 28, 28, 32)
#    Pool     ->(?, 14, 14, 32)

#Convolution layer
# W1 [3 3 1 32] -> [3 3]: 커널 크기, 1: 입력값 X 의 특성수, 32: 필터(커널) 갯수
W1 = tf.Variable(tf.random_normal([3, 3, 1, 32], stddev=0.01))
#padding='SAME' : 커널 슬라이딩 시 이미지의 가장 외곽에서 한칸 더 밖으로 움직임(테두리까지 정확 평가 가능)
L1 = tf.nn.conv2d(X, W1, strides=[1,1,1,1], padding='SAME')
L1 = tf.nn.relu(L1)

#pooling layer
# stide =[1,2,2,1] -> 슬라이딩 시 두칸씩 움직임 / 커널크기 2x2
L1 = tf.nn.max_pool(L1, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')

In [5]:
# 2. Second CNN layer
# L2 Conv shape=(?, 14, 14, 64)
#    Pool     ->(?, 7, 7, 64)

# W2 의 [3, 3, 32, 64] -> 32 :L1 에서 출력된 W1 의 마지막 차원, 필터의 크기(출력층의 개수: 첫번째 컨볼루션 계층이 찾아낸 이미지 특징 개수)
W2 = tf.Variable(tf.random_normal([3, 3, 32, 64], stddev=0.01))
L2 = tf.nn.conv2d(L1, W2, strides=[1, 1, 1, 1], padding='SAME')
L2 = tf.nn.relu(L2)
L2 = tf.nn.max_pool(L2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

In [6]:
# 3. 추출한 특징들 이용, 10개의 분류를 만들어내는 계층
# 7x7x64 크기의 1차원 계층으로 만듦 : 차원을 줄이는 단계 , 256-> 최종 출력값의 중간 단계 
W3 = tf.Variable(tf.random_normal([7 * 7 * 64, 256], stddev=0.01))
L3 = tf.reshape(L2, [-1, 7 * 7 * 64])
L3 = tf.matmul(L3, W3)
L3 = tf.nn.relu(L3)
#과적합 방지 : 드롭아웃 기법
L3 = tf.nn.dropout(L3, keep_prob)

#직전 L3d(hidden layer)의 출력값 256 ->10개의 출력값(label-0~9)
W4 = tf.Variable(tf.random_normal([256, 10], stddev=0.01))
model = tf.matmul(L3, W4)

Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.


In [7]:
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=model, labels=Y))
#AdamOptimizer 를 이용해 최적화 함수를 만듦 (*RMSPropOptimizer 함수도 있음)
optimizer = tf.train.AdamOptimizer(0.001).minimize(cost)

In [8]:
# 모델 학습하기 

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

batch_size = 100
total_batch = int(mnist.train.num_examples / batch_size)

for epoch in range(15):
    total_cost = 0

    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        #MNIST 데이터를 28X28 형태로 재구성 : batch_xs.reshape(-1, 28, 28, 1)
        batch_xs = batch_xs.reshape(-1, 28, 28, 1)

        _, cost_val = sess.run([optimizer, cost],
                               feed_dict={X: batch_xs,
                                          Y: batch_ys,
                                          keep_prob: 0.7})
        total_cost += cost_val

    print('Epoch:', '%04d' % (epoch + 1),
          'Avg. cost =', '{:.3f}'.format(total_cost / total_batch))

print('최적화 완료!')

# 모델 정확도 평가 (결과)
is_correct = tf.equal(tf.argmax(model, 1), tf.argmax(Y, 1))
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))
 #MNIST 데이터를 28X28 형태로 재구성 mnist.test.images.reshape(-1, 28, 28, 1) 
print('정확도:', sess.run(accuracy,
                        feed_dict={X: mnist.test.images.reshape(-1, 28, 28, 1),
                                   Y: mnist.test.labels,
                                   keep_prob: 1}))

Epoch: 0001 Avg. cost = 0.342
Epoch: 0002 Avg. cost = 0.110
Epoch: 0003 Avg. cost = 0.078
Epoch: 0004 Avg. cost = 0.061
Epoch: 0005 Avg. cost = 0.051
Epoch: 0006 Avg. cost = 0.043
Epoch: 0007 Avg. cost = 0.037
Epoch: 0008 Avg. cost = 0.032
Epoch: 0009 Avg. cost = 0.027
Epoch: 0010 Avg. cost = 0.027
Epoch: 0011 Avg. cost = 0.022
Epoch: 0012 Avg. cost = 0.020
Epoch: 0013 Avg. cost = 0.019
Epoch: 0014 Avg. cost = 0.017
Epoch: 0015 Avg. cost = 0.015
최적화 완료!
정확도: 0.9901


## 고수준 API 
### : tf.layer 모듈 이용하여 CNN 모델 간단하게 만들기


##### Convolution & pooling 계층 : 기본 함수 사용한 기존의 layer구성

In [None]:
# Convolution & Pooling layers 
W1 = tf.Variable(tf.random_normal([3,3,1,32], stddev=0.01))
L1 = tf.nn.conv2d(X, W1, strides=[1, 1, 1, 1], padding='SAME')
L1 = tf.nn.relu(L1)
L1 = tf.nn.max_pool(L1, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')

##### Convolution & pooling 계층 :  tf.layer 모듈 이용

In [None]:
# Convolution & Pooling layers

# 기본적으로 inputs, outputs size, kernel_size 만 넣어주면
# 활성화 함수 적용은 물론, 컨볼루션 신경망을 만들기 위한 나머지 수치들은 알아서 계산

L1 = tf.layers.conv2d(X, 32, [3, 3], activation=tf.nn.relu)
L1 = tf.layers.max_pooling2d(L1, [2, 2], [2, 2])

##### 완전 연결 계층 : 기본 함수 사용한 기존의 layer구성

In [9]:
W3 = tf.Variable(tf.random_normal([7 * 7 * 64, 256], stddev=0.01))
L3 = tf.reshape(L2, [-1, 7 * 7 * 64])
L3 = tf.matmul(L3, W3)
L3 = tf.nn.relu(L3)

##### 완전 연결 계층 : : tf.layer 모듈 이용

In [10]:
L3 = tf.contrib.layers.flatten(L2)
L3 = tf.layers.dense(L3, 256, activation=tf.nn.relu)

The TensorFlow contrib module will not be included in TensorFlow 2.0.
For more information, please see:
  * https://github.com/tensorflow/community/blob/master/rfcs/20180907-contrib-sunset.md
  * https://github.com/tensorflow/addons
  * https://github.com/tensorflow/io (for I/O related ops)
If you depend on functionality not listed there, please file an issue.

Instructions for updating:
Use keras.layers.flatten instead.
Instructions for updating:
Please use `layer.__call__` method instead.
Instructions for updating:
Use keras.layers.Dense instead.
