### Convolutional Neural Network

- 신경망의 결합
- 입력층, 출력층 사이에 중간층(은폐층)을 구성
- 중간층에 합성공층과 풀링층을 배치
> 이미지 인식, 이미지 블럭 처리(흐리게)  
> 경계선을 강조 
> 해상도를 낮추는 작업
- 구조
[입력층] => [중간층:[합성곱층][풀링층] [합성곱층][풀링층] [합성곱층][풀링층] ..... [전결합층]]=>[출력층] 

### 합성곱층 

- 이미지 특징을 추출할 때 사용
- 방식  
> 입력 x 의 이미지의 일부분을 잘라가면서 가중치 필터(W:평활화 작업, 윤곽선 검출)를 적용하여 맵(C)를 추출하는 과정  
> 평활화 : 명암의 분포를 균일하게 처리  
> 윤곽선 검출 : 에지 디틱션, 이미지의 윤곽만을 추출해내는 과정  
<img src='./data/dp1.png'>

### 풀링층

- 합성곱층의 연산의 결과로 얻은 특정맵(C)를 축소하는 층    
- 특성을 유지 한상태로 축소, 위치 변경에 결과 변화를 막아준다.  
- 직선 인식이 미세하게 흐트러져도 직선으로 인식하게 한다.
- 방법 : 최대 풀링, 최소 풀링 존재
<img src='./data/dp2.png'>

### 전결합층

- 각 층의 유닛을 결합  
- 합성곱층과 풀링층의 결과 2차원 특징맵을 1차원으로 전개하는 역할을 담당.

In [1]:
import tensorflow as tf

  from ._conv import register_converters as _register_converters


In [2]:
#MNIST 손글씨 이미지를 딥러닝으로 구현하여 인식  
from tensorflow.examples.tutorials.mnist import input_data

In [3]:
mnist = input_data.read_data_sets('./data/mnist/', one_hot = True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting ./data/mnist/train-images-idx3-ubyte.gz
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting ./data/mnist/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Extracting ./data/mnist/t10k-images-idx3-ubyte.gz
Extracting ./data/mnist/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.


In [4]:
# 데이터 확인
print(mnist.train.images, mnist.train.images.shape)
print(mnist.train.labels, mnist.train.labels.shape) # label을 이진화 하는게 성능이 좋음.

[[0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]] (55000, 784)
[[0. 0. 0. ... 1. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 0. 0.]
 [0. 0. 0. ... 0. 1. 0.]] (55000, 10)


In [51]:
import numpy as np
np.where(mnist.train.labels[:1][0] > 0)[0][0]
for label in mnist.train.labels:
    print(type(label.nonzero()[0]))
    print(label.nonzero()[0][0])
    break    

<class 'numpy.ndarray'>
9


In [6]:
# 총 픽셀의 크기 
pixels = mnist.train.images.shape[1]
# 총 레이블의 특성수 (정답 종류의 수)
nums = mnist.train.labels.shape[1]
pixels, nums

(784, 10)

In [7]:
# 개별 가로,세로 픽셀의 크기는 정사각형이다 -> 제곱
pixel_size = int(np.sqrt(pixels))

## 텐서플로우 절차 적용

In [8]:
# 입력층,출력층 placeholder 구성

x = tf.placeholder(tf.float32,shape=(None, pixels), name='x')

y_ = tf.placeholder(tf.float32,shape=(None, nums), name='y_')


In [9]:
# 가중치(w), 바이어스(b)를 초기화하는 함수  ??뭐가 또나옴?? 아마 [합성곱층][풀링층]이 여러개라서 그런듯

def makeWeight(name, filt): # weight => 필터 
    # 절단정규분포(truncate normal distribution) 로 부터 난수를 반환받는다.
    # 내부적으로 생성된 값들 평균과 표준편차를 가진 정규분포
    # 2개를 생성해서 평균보다 떨어지는 값을 버리고, 재선택 되는 과정을 반복한다. 
    # stddev는 표준편차 값.
    wei_init = tf.truncated_normal(filt,stddev=0.1) # ?? 이부분 이해안감. 꼭 이렇게 해야한다는 것이 아니라, 하나의 가정, 예시 
    W = tf.Variable(wei_init, name='W_'+name)
    return W

In [10]:
def makeBias(name,size):
    bia_init =tf.constant(0.1, shape=[size])
    b = tf.Variable(bia_init, name='b_'+name)
    return b

In [11]:
# 합성곱 계층을 만드는 함수 구성
def conv2d(x, W):
    # x=> [batch, height, width, channels] # 크기를 모를때 None 말고도 -1 도 가능하다.
    # W : [filter_h, filter_w, in_channels, out_channels]
    # strides : 크기가 4인 1차원 리스트
    # 0 , 3번째는 무조건 1, ?? 이건 왜 그런가?
    # 1,2 번째는 이동에 관련 크기 지정.
    return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME')# padding 나가는거 크기? stride는 그림에 나옴

In [12]:
# 최대 풀링층 생성 함수
# 4*4 => 2*2 ->strides 2 
def max_pool(x):
    # x=> [batch, height, width, channels] => ReLU를 통과한 값 #합성공에서 POOLING으로넘어 올때 CHANNEL 주의
    # ksize :  자리수 4개, 입력 데이터의 각 차원의 윈도우 크기(우리는 2*2) #뭔말 님아??
    # 2칸씩 이동하여 출력 결과 1을 만들어 내는 의미
    return tf.nn.max_pool(x,ksize=[1,2,2,1],
                          strides=[1,2,2,1], 
                          padding='SAME') # SAME이라고는 하지만 실제로는 크기가 줄어듬(정사각형태 유지)

In [13]:
# 합성곱층 1번 구성
NAME1='conv1'
with tf.name_scope(NAME1) as scope:
    # 가중치 준비
    # [5,5,1,32] : 5x5크기의 1개 채널이 들어가서 32개 
    # 채널로 나오는 구성
    W_conv1 = makeWeight(NAME1,[5,5,1,32]) # output이 자꾸 늘어난다는 말의 의미를 모르겟음. 64 1028
    # 바이어스 몇개? 32개(wight의 32개 채널과 동일)
    b_conv1 = makeBias(NAME1, 32)    
    # 합성곱 계층을 만드는 함수
    # x => [~784~] => [batch, heigh,width, channels]
    x_img = tf.reshape(x,[-1, pixel_size, pixel_size, 1]) # 여기서 channel 값이 1인게 현재    
    h_conv1 = tf.nn.relu(conv2d(x_img, W_conv1)+b_conv1) # 역할 : 값이 0 이하이면 0, 그이상이면 그대로 세팅 함수, bias로 인해서 음수가 나올 수도 있음.
    #성능이 좋아서 씀
    
    

In [14]:
# 풀링층 생성
with tf.name_scope('pool1') as scope:
    h_pool1 = max_pool(h_conv1) # 풀링을 통해 반으로 줄어듬. ?? 위에 그림에서 필터를 쓰면 차원이 줄어 드는것 처럼 보였는데..

In [15]:
h_pool1.shape

TensorShape([Dimension(None), Dimension(14), Dimension(14), Dimension(32)])

In [16]:
# 합성곱층 2번 구성
NAME2='conv2'
with tf.name_scope(NAME2) as scope:
    W_conv2 = makeWeight(NAME1,[5,5,32,64]) #왜 곱하기 2가 됫나??     
    b_conv2 = makeBias(NAME1, 64)            
    h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2)+b_conv2) 
    
    

In [17]:
# 두번째 풀링층
with tf.name_scope('pool2') as scope:
    h_pool2 = max_pool(h_conv2)

In [18]:
h_pool2.shape

TensorShape([Dimension(None), Dimension(7), Dimension(7), Dimension(64)])

In [24]:
# 전 결합층 구성
# 픽셀의 현재 크기는 28/2/2 => 7이다.
NAME3 = 'fully_connected'
with tf.name_scope(NAME3) as scope:
    n = 7 * 7 * 64
    # 전 결합층은 최종 입력대비 몇개의 출력이 나올 것인지 정하면 됨
    W_fc = makeWeight(NAME3,[n,1024]) #왜 곱하기 2가 됫나??     
    b_fc = makeBias(NAME3, 1024)            
    
    h_pool2_reshape = tf.reshape(h_pool2,[-1, n])
    h_fc = tf.nn.relu(tf.matmul(h_pool2_reshape,W_fc)+b_fc)
    

In [25]:
h_fc.shape

TensorShape([Dimension(None), Dimension(1024)])

In [26]:
# 출력층
# 드롭아웃(과잉 적합) 처리
with tf.name_scope('dropout') as scope:
    # 과잉 적합 처리를 위해 float형 placeholder 배치
    prob = tf.placeholder(tf.float32)
    h_fc_drop = tf.nn.dropout(h_fc,prob)

In [29]:
# 출력 진행 => 소프트맥스
NAME4 = 'out'
with tf.name_scope(NAME4) as scope:
    # 최종 결과물은 h_fc_drop => 1024 => 10으로
    W_out = makeWeight(NAME4,[1024,10]) #왜 곱하기 2가 됫나??     
    b_out = makeBias(NAME4, 10)  
    y_out=tf.nn.softmax(tf.matmul(h_fc_drop, W_out)+b_out)

In [30]:
# 모델 학습
with tf.name_scope('loss') as scope:
    # cross entropy
    cross_entropy = -tf.reduce_sum(y_*tf.log(y_out))

In [32]:
# 모델 학습
with tf.name_scope('training') as scope:
    # 확률적 경사 하강법 ; 무작위로 초기화한 매개변수를 손실 함수 최소화
    Optimizer = tf.train.AdamOptimizer(1e-4)
    train = Optimizer.minimize(cross_entropy)

In [33]:
# 모델 평가
with tf.name_scope('predict') as scope:
    # 예측
    predict = tf.equal(tf.argmax(y_out,1),tf.argmax(y_,1))
    # 정확도
    accuracy = tf.reduce_mean(tf.cast(predict,tf.float32))
    

In [47]:
# feed_dict용 함수
def make_feed(img, label, prob1):
    # 이미지 데이터, 레이블(특성) 데이터, prob:(평가:1 / 훈련 0.5 ) ??? 뭔말임? 평가일때 1 을 넣으라는 말이다.
    return {x:img, y_:label, prob:prob1}

In [50]:
# 세션 시작
with tf.Session() as sess:
    # 1. tensorflow 변수 초기화
    sess.run(tf.global_variables_initializer())
    # 2. 텐서보드 준비
    tf.summary.FileWriter('./data/log_cnn', graph=sess.graph)
    # 3. 테스트용 전용 피드 ??피드가 뭐냐?
    test_feed = make_feed(mnist.test.images, mnist.test.labels, 1)
    # 훈련의 횟수는 총 데이터를 기준으로 산정
    # 여기서는 시간 관계상 100번만 수행 
    for step in range(100):
        # 데이터 50개씩만 사용
        batch = mnist.train.next_batch(50) 
        # print(batch) # images, labels 
        # print(batch[0].shape, batch[1].shape)
        # break
        # 훈련데이터 피드구성
        train_feed = make_feed(batch[0], batch[1], 0.5)
        
        # 훈련
        t, loss = sess.run([train, cross_entropy],feed_dict=train_feed) 
        # 중간점검
        if step % 10 == 0:
            acc = sess.run(accuracy, feed_dict=test_feed)
            print('step:',step,'accuracy:',accuracy,'loss:',loss)
    
    # 최종결과
    
    acc= sess.run(accuracy, feed_dict=test_feed)
    print('최종 loss=', loss, 'acc=', acc)

step: 0 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 539.8864
step: 10 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 259.38525
step: 20 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 246.81769
step: 30 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 191.8215
step: 40 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 98.25636
step: 50 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 128.51935
step: 60 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 89.919876
step: 70 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 81.05855
step: 80 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 79.21171
step: 90 accuracy: Tensor("predict/Mean:0", shape=(), dtype=float32) loss: 58.88674
최종 loss= 59.70147 acc= 0.8305
