In [2]:
import tensorflow as tf

import numpy as np
#########

# 신경망 모델 구성

######

# 기존 모델에서는 입력 값을 28x28 하나의 차원으로 구성하였으나,

# CNN 모델을 사용하기 위해 2차원 평면과 특성치의 형태를 갖는 구조로 만듭니다.

X = tf.placeholder(tf.float32, [None, 100, 100, 1])

Y = tf.placeholder(tf.float32, [None, nb_classes])

keep_prob = tf.placeholder(tf.float32)

 

# 각각의 변수와 레이어는 다음과 같은 형태로 구성됩니다.

# W1 [3 3 1 32] -> [3 3]: 커널 크기, 1: 입력값 X 의 특성수, 32: 필터 갯수

# L1 Conv shape=(?, 28, 28, 32)

#    Pool     ->(?, 14, 14, 32)

#W1 = tf.Variable(tf.random_normal([3, 3, 1, 32], stddev=0.01))

W1 = tf.get_variable("W1", shape=[3, 3, 1, 32], initializer = tf.contrib.layers.xavier_initializer())

loss1 = tf.nn.l2_loss(W1)

# tf.nn.conv2d 를 이용해 한칸씩 움직이는 컨볼루션 레이어를 쉽게 만들 수 있습니다.

# padding='SAME' 은 커널 슬라이딩시 최외곽에서 한칸 밖으로 더 움직이는 옵션

L1 = tf.nn.conv2d(X, W1, strides=[1, 1, 1, 1], padding='SAME')

L1 = tf.nn.relu(L1)

# Pooling 역시 tf.nn.max_pool 을 이용하여 쉽게 구성할 수 있습니다.

L1 = tf.nn.max_pool(L1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

# L1 = tf.nn.dropout(L1, keep_prob)

 

# L2 Conv shape=(?, 14, 14, 64)

#    Pool     ->(?, 7, 7, 64)

# W2 의 [3, 3, 32, 64] 에서 32 는 L1 에서 출력된 W1 의 마지막 차원, 필터의 크기 입니다.

#W2 = tf.Variable(tf.random_normal([3, 3, 32, 64], stddev=0.01))

W2 = tf.get_variable("W2", shape=[3, 3, 32, 64], initializer = tf.contrib.layers.xavier_initializer())

loss2 = tf.nn.l2_loss(W2)

L2 = tf.nn.conv2d(L1, W2, strides=[1, 1, 1, 1], padding='SAME')

L2 = tf.nn.relu(L2)

L2 = tf.nn.max_pool(L2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

# L2 = tf.nn.dropout(L2, keep_prob)

 

# FC 레이어: 입력값 7x7x64 -> 출력값 256

# Full connect를 위해 직전의 Pool 사이즈인 (?, 7, 7, 64) 를 참고하여 차원을 줄여줍니다.

#    Reshape  ->(?, 256)

#W3 = tf.Variable(tf.random_normal([25 * 25 * 64, 256], stddev=0.01))

W3 = tf.get_variable("W3", shape=[25*25*64, 256], initializer = tf.contrib.layers.xavier_initializer())

loss3 = tf.nn.l2_loss(W3)

L3 = tf.reshape(L2, [-1, 25 * 25 * 64])

L3 = tf.matmul(L3, W3)

B3 = tf.Variable(tf.random_normal([256]))

L3 = tf.nn.relu(L3 + B3)

L3 = tf.nn.dropout(L3, keep_prob)

 

# 최종 출력값 L3 에서의 출력 256개를 입력값으로 받아서 0~9 레이블인 10개의 출력값을 만듭니다.

#W4 = tf.Variable(tf.random_normal([256, nb_classes], stddev=0.01))

W4 = tf.get_variable("W4", shape=[256, nb_classes], initializer = tf.contrib.layers.xavier_initializer())

loss4 = tf.nn.l2_loss(W4)

B4 = tf.Variable(tf.random_normal([nb_classes]))

model = tf.matmul(L3, W4) + B4

loss = loss1 + loss2 + loss3 + loss4

 

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=model, labels=Y))

reg_factor = 1

grade = cost + reg_factor * loss

optimizer = tf.train.AdamOptimizer(0.00001).minimize(grade)

# 최적화 함수를 RMSPropOptimizer 로 바꿔서 결과를 확인해봅시다.

# optimizer = tf.train.RMSPropOptimizer(0.001, 0.9).minimize(cost)

 

#########

# 신경망 모델 학습

######

init = tf.global_variables_initializer()

config = tf.ConfigProto()

config.gpu_options.per_process_gpu_memory_fraction = 0.4

sess = tf.Session(config = config)

sess.run(init)

 

batch_size = 100

total_batch = int(dset['train']['data'].shape[0] / batch_size)

is_correct = tf.equal(tf.argmax(model, 1), tf.argmax(Y, 1))

accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))

test_images, test_labels = get_test()

for epoch in range(10000):

    total_cost = 0

 

    for i in range(total_batch):

        batch_xs, batch_ys = get_next_batch(batch_size)

        # 이미지 데이터를 CNN 모델을 위한 자료형태인 [28 28 1] 의 형태로 재구성합니다.

        batch_xs = batch_xs.reshape(-1, 100, 100, 1)

        _, cost_val = sess.run([optimizer, cost],

                               feed_dict={X: batch_xs,

                                          Y: batch_ys,

                                          keep_prob: 0.4})

        # print("cost: ", cost_val)

        total_cost += cost_val

    if epoch % 10 == 0:

        print('Epoch:', '%04d' % (epoch + 1),

          'Avg. cost =', '{:.3f}'.format(total_cost / total_batch))

        print('loss : ', sess.run(loss,

                                  feed_dict = {X: batch_xs,

                                            Y: batch_ys,

                                            keep_prob: 1}

                                 ))

        print('train 정확도:', sess.run(accuracy,

                                feed_dict = {X: batch_xs,

                                            Y: batch_ys,

                                            keep_prob: 1}))

        print('정확도:', sess.run(accuracy,

                        feed_dict={X: test_images[0:100,:].reshape(-1, 100, 100, 1),

                                   Y: test_labels[0:100],

                                   keep_prob: 1}))

 

print('최적화 완료!')

 

#########

# 결과 확인

######

NameError: name 'nb_classes' is not defined