In [None]:
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("./mnist/data/", one_hot=True)

# None 은 입력 데이터의 개수, 1은 특징의 개수
X = tf.placeholder(tf.float32, [None, 28, 28, 1])
Y = tf.placeholder(tf.float32, [None, 10])
keep_prob = tf.placeholder(tf.float32)

# 컨볼루션 계층을 만듬
W1 = tf.Variable(tf.random_normal([3, 3, 1, 32], stddev=0.01))
# 입력층 X와 가중치 W1을 가지고 오른쪽과 아래쪽으로 한칸 씩 움직이는 32개의 커널을 가진 컨볼루션 계층을 만듬
# padding='SAME' 은 커널 슬라이딩 시 이미지의 가장 외곽에서 한 칸 밖으로 움직이는 옵션
L1 = tf.nn.conv2d(X, W1, strides=[1, 1, 1, 1], padding='SAME')
L1 = tf.nn.relu(L1)
# 풀링계층을 만듬
# 컨볼루션 계층을 입력층으로 사용하고, 커널 크기를 2*2로 하는 풀링계층을 만듬. 
# strides 는 슬라이딩 시 두칸씩 움직이겠다는 옵션
L1 = tf.nn.max_pool(L1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
# tf.layers 모듈을 이용하면 위 네줄을 더욱 간단히 구현 가능
# L1 = tf.layers.conv2d(X, 32, [3,3])
# L1 = tf.layers.max_pooling2d(L1, [2,2], [2, 2])

# 3*3 크기의 커널 64개로 구성한 컨볼루션 계층과 2*2 크기의 풀링 계층으로 구성
W2 = tf.Variable(tf.random_normal([3, 3, 32, 64], stddev=0.01))
L2 = tf.nn.conv2d(L1, W2, strides=[1,1,1,1], padding='SAME')
L2 = tf.nn.relu(L2)
L2 = tf.nn.max_pool(L2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

# 10개의 분류를 만들어 내는 계층을 구성
W3 = tf.Variable(tf.random_normal([7*7*64,256], stddev =0.01))
# 1차원으로 줄이기 위해 tf.reshape 함수를 이용해 7*7*64 크기의 1차원 계층으로 만들고, 
# 이 배열 전체를 최종 출력값의 중간 단계인 256개의 뉴런으로 연결하는 신경망을 만들어줌
# 이처럼 인접한 계층의 모든 뉴런과 상호 연결된 계층을 완전 연결 꼐층 이라고 함
L3 = tf.reshape(L2, [-1, 7*7*64])
L3 = tf.matmul(L3, W3)
L3 = tf.nn.relu(L3)
# 위를 tf.layer를 사용한다면?
# L3 = tf.contrib.layers.flatten(L2)
# L3 = tf.layers.dense(L3, 256, activation=tf.nn.relu)
L3 = tf.nn.dropout(L3, keep_prob)

# 256개를 받아 10개의 출력값을 만듬
W4 = tf.Variable(tf.random_normal([256, 10], stddev=0.01))
model = tf.matmul(L3, W4)

# 손실함수와 최적화 함수를 만듬
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=model, labels=Y))
optimizer = tf.train.AdamOptimizer(0.001).minimize(cost)
# optimizer = tf.train.RMSPropOptimizer(0.001, 0.9).minimize(cost)

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

batch_size = 100
total_batch = int(mnist.train.num_examples/batch_size)

for epoch in range(15):
    total_cost = 0
    
    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        batch_xs = batch_xs.reshape(-1, 28, 28, 1)
        
        _, cost_val = sess.run([optimizer, cost], 
                              feed_dict= {X: batch_xs,
                                          Y: batch_ys,
                                          keep_prob: 0.7})
        total_cost += cost_val
    
    print('Epoch:', '%04d' % (epoch + 1),
         'Avg. cost = ', '{:.3f}'.format(total_cost / total_batch))
    
print('최적화 완료!')

is_correct = tf.equal(tf.argmax(model, 1), tf.argmax(Y,1))
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))

print('정확도:', sess.run(accuracy,
                      feed_dict={X: mnist.test.images.reshape(-1, 28, 28, 1),
                                 Y:mnist.test.labels,
                                 keep_prob: 1}))
    

Extracting ./mnist/data/train-images-idx3-ubyte.gz
Extracting ./mnist/data/train-labels-idx1-ubyte.gz
Extracting ./mnist/data/t10k-images-idx3-ubyte.gz
Extracting ./mnist/data/t10k-labels-idx1-ubyte.gz
Epoch: 0001 Avg. cost =  0.351
Epoch: 0002 Avg. cost =  0.109
Epoch: 0003 Avg. cost =  0.080
Epoch: 0004 Avg. cost =  0.062
Epoch: 0005 Avg. cost =  0.050
