In [18]:
import tensorflow as tf
import numpy as np
from tensorflow.python.keras._impl.keras.datasets.cifar10 import load_data

In [2]:
# 다음 배치를 읽어오기 위한 next_batch 함수를 정의합니다.
def next_batch(num,data,labels):
    """
    랜덤 샘플링 숫자와 라벨을 읽어줌
    """
    idx=np.arange(0,len(data))
    np.random.shuffle(idx)
    idx=idx[:num]
    data_shuffle=[data[i] for i in idx]
    labels_shuffle=[labels[i] for i in idx]
    
    return np.asarray(data_shuffle), np.asarray(labels_shuffle)

In [8]:
# cnn 모델을 만듭니다.
def build_CNN_classifier(x):
    """
    x:(n_examples,32,32,3) 차원을 가진 input tensor,cifar 10 데이터의 크기는 32X32크기의 rgb채널의 컬러이미지다
    return: tuple(y,keep_prob). y는(n_examples,10)형태의 숫자(0-9)tensor이다.
    keep_prob는 drop out을 위한 scaler placeholder이다.
    """
    
    # 입력이미지
    x_image=x
    
    # 첫번쨰 합성곱- 하나의 grayscle 이미지를 64개의 특징들로 맵핑한다. 
    w_conv1=tf.Variable(tf.truncated_normal(shape=[5,5,3,64],stddev=5e-2))
    b_conv1=tf.Variable(tf.constant(0.1,shape=[64]))
    h_conv1=tf.nn.relu(tf.nn.conv2d(x_image,w_conv1,strides=[1,1,1,1],padding="SAME")+b_conv1)  #필터의 따른 수??
    
    #첫번쨰 pooling
    h_pool1=tf.nn.max_pool(h_conv1,ksize=[1,3,3,1],strides=[1,2,2,1],padding="SAME")
    
    #두번쨰 합성곱  32개의 특징들을 64개의 특징드로 맵핑한다. 
    w_conv2=tf.Variable(tf.truncated_normal(shape=[5,5,64,64],stddev=5e-2))
    b_conv2=tf.Variable(tf.constant(0.1,shape=[64]))
    h_conv2=tf.nn.relu(tf.nn.conv2d(h_pool1,w_conv2,strides=[1,1,1,1],padding="SAME")+b_conv2)
    
    #두번째 pooling
    h_pool2=tf.nn.max_pool(h_conv2,ksize=[1,3,3,1],strides=[1,2,2,1],padding="SAME")
    
    #세번쨰 합성곱
    w_conv3=tf.Variable(tf.truncated_normal(shape=[3,3,64,128],stddev=5e-2))
    b_conv3=tf.Variable(tf.constant(0.1,shape=[128]))
    h_conv3=tf.nn.relu(tf.nn.conv2d(h_pool2,w_conv3,strides=[1,1,1,1],padding="SAME")+b_conv3)
    
    
    w_conv4=tf.Variable(tf.truncated_normal(shape=[3,3,128,128],stddev=5e-2)) #왜여기부터는 컨볼루션만 하는가?
    b_conv4=tf.Variable(tf.constant(0.1,shape=[128]))
    h_conv4=tf.nn.relu(tf.nn.conv2d(h_conv3,w_conv4,strides=[1,1,1,1],padding="SAME")+b_conv4)
    
    w_conv5=tf.Variable(tf.truncated_normal(shape=[3,3,128,128],stddev=5e-2))
    b_conv5=tf.Variable(tf.constant(0.1,shape=[128]))
    h_conv5=tf.nn.relu(tf.nn.conv2d(h_conv4,w_conv5,strides=[1,1,1,1],padding="SAME")+b_conv5)
    
    # fully_connected layer1    2번의 downsampling 이후에 ,우리의 32X32 이미지는 8X8X128특징맵으로 변했다.
    w_fc1=tf.Variable(tf.truncated_normal(shape=[8*8*128,384],stddev=5e-2))  #flatten 하는데 왜 저렇게 줄이나??
    b_fc1=tf.Variable(tf.constant(0.1,shape=[384]))
    
    h_conv5_flat=tf.reshape(h_conv5,[-1,8*8*128])
    h_fc1=tf.nn.relu(tf.matmul(h_conv5_flat,w_fc1)+b_fc1)
    
    # drop out으로 모델의 복잡도를 컨트롤한다.
    h_fc1_drop=tf.nn.dropout(h_fc1,keep_prob)
    
    # 384개의 특징들을 10개의 클래스로 맵핑한다.
    w_fc2=tf.Variable(tf.truncated_normal(shape=[384,10],stddev=5e-2))
    b_fc2=tf.Variable(tf.constant(0.1,shape=[10]))
    logits=tf.matmul(h_fc1,w_fc2)+b_fc2
    y_pred=tf.nn.softmax(logits)
    
    return y_pred,logits
    
    
    

In [None]:
# 인풋 아웃푸스 드롭아웃 확률을 받기위한 플레이스 홀더 지정
x=tf.placeholder(tf.float32,shape=[None,32,32,3])
y=tf.placeholder(tf.float32,shape=[None,10])
keep_prob=tf.placeholder(tf.float32)

(x_train,y_train),(x_test,y_test)=load_data()
y_train_one_hot=tf.squeeze(tf.one_hot(y_train,10),axis=1)
y_test_one_hot=tf.squeeze(tf.one_hot(y_test,10),axis=1)


# convolutional neural networks그래프 실행
y_pred,logits=build_CNN_classifier(x)

#loss,최적화
loss=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y,logits=logits))
train_step=tf.train.RMSPropOptimizer(1e-3).minimize(loss)

#정확도계산
correct_prediction=tf.equal(tf.argmax(y_pred,1),tf.argmax(y,1))
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for i in range(1000):
        batch=next_batch(128,x_train,y_train_one_hot.eval())
        
        if i%100==0:
            train_accuracy=accuracy.eval(feed_dict={x:batch[0],y:batch[1],keep_prob:1.0})
            loss_print=loss.eval(feed_dict={x:batch[0],y:batch[1],keep_prob:1.0})
            
            print("반복(epoch): %d, 트레이닝 데이터 정확도: %f, 손실함수: %f" %(i,train_accuracy,loss_print))
#             print("반복(Epoch): %d, 트레이닝 데이터 정확도: %f, 손실 함수(loss): %f" % (i, train_accuracy, loss_print))
        sess.run(train_step,feed_dict={x:batch[0],y:batch[1],keep_prob:0.8})
        
    test_batch=next_batch(100000,x_test,y_test_one_hot.eval())
    print("테스트 정확도: %f" %(accuracy.eval(feed_dict={x:test_batch[0],y:test_batch[1],keep_prob:1.0})))

반복(epoch): 0, 트레이닝 데이터 정확도: 0.070312, 손실함수: 150.651978
반복(epoch): 100, 트레이닝 데이터 정확도: 0.250000, 손실함수: 2.171059
반복(epoch): 200, 트레이닝 데이터 정확도: 0.351562, 손실함수: 1.969630
반복(epoch): 300, 트레이닝 데이터 정확도: 0.445312, 손실함수: 1.706453
반복(epoch): 400, 트레이닝 데이터 정확도: 0.367188, 손실함수: 1.723992
반복(epoch): 500, 트레이닝 데이터 정확도: 0.484375, 손실함수: 1.556555
