### 라이브러리 설치

In [2]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPool2D
from tensorflow.keras.layers import Flatten, Dense, Dropout   

### 데이터 불러오기

In [5]:
(x_train, y_train),(x_test, y_test) = cifar10.load_data() #tensorflow에 내장된 데이터셋 불러오기
x_train=x_train.reshape(-1, 32, 32, 3) #3차원 이미지 데이터를 텐서로 변환, 이때 컬러이미지이기 때문에 맨 마지막 채널은 3
x_test=x_test.reshape(-1, 32, 32, 3)

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
[1m170498071/170498071[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 0us/step


#reshape 3차원 텐서 변환 개념
CIFAR 데이터는 10개의 정답으로 분류된 이미지이며, 각각의 이미지는 32X32크기의 컬러이미지입니다. 
이미지 데이터는 CNN이 학습하기 위해 3차원 텐서 (가로,세로,채널)로 변환해야합니다.
흑백이미지는 높이,너비,1로 변환되고, 컬러이미지는 높이,너비,3으로 변환됩니다.
위 데이터는 32x32크기를 가진 컬러 이미지이기 때문에 32,32,3 3차원 벡터이며
reshape의 첫번째 인자는 전체 데이터갯수를 입력해야하는데 -1을 입력하면 컴퓨터가 알아서 데이터 갯수를 반환합니다.

In [7]:
print(x_train.shape, x_test.shape)
print(y_train.shape, y_test.shape)

(50000, 32, 32, 3) (10000, 32, 32, 3)
(50000, 1) (10000, 1)


In [9]:
#정규화
x_train = x_train.astype(np.float32) / 255.0
x_test = x_test.astype(np.float32) / 255.0

### CNN 모델 구축

In [16]:
cnn=Sequential()

In [18]:
cnn.add(Conv2D(input_shape=(32,32,3), kernel_size=(3,3),
               filters=32, activation='relu'))
cnn.add(Conv2D(kernel_size=(3,3), filters=64, activation='relu'))
cnn.add(MaxPool2D(pool_size=(2,2)))
cnn.add(Dropout(0.25))

cnn.add(Flatten()) #3차원 텐서를 1차원으로 변환하는 Flat Layer

cnn.add(Dense(128, activation='relu')) #은닉층 개념
cnn.add(Dropout(0.5))
cnn.add(Dense(10, activation='softmax')) #출력층 : 10개의 분류값이기때문에 10

In [20]:
cnn.compile(loss='sparse_categorical_crossentropy',
            optimizer=tf.keras.optimizers.Adam(), metrics=['accuracy'])

cnn.summary()

In [None]:
#모델학습
hist = cnn.fit(x_train, y_train, batch_size=128, 
               epochs=30, validation_data=(x_test, y_test))

Epoch 1/30
[1m391/391[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m32s[0m 80ms/step - accuracy: 0.3239 - loss: 1.8405 - val_accuracy: 0.5420 - val_loss: 1.3088
Epoch 2/30
[1m391/391[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m30s[0m 77ms/step - accuracy: 0.5159 - loss: 1.3432 - val_accuracy: 0.6080 - val_loss: 1.1167
Epoch 3/30
[1m391/391[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m31s[0m 80ms/step - accuracy: 0.5738 - loss: 1.2055 - val_accuracy: 0.6463 - val_loss: 1.0252
Epoch 4/30
[1m391/391[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m32s[0m 83ms/step - accuracy: 0.6114 - loss: 1.0949 - val_accuracy: 0.6564 - val_loss: 0.9806
Epoch 5/30
[1m391/391[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m31s[0m 80ms/step - accuracy: 0.6321 - loss: 1.0376 - val_accuracy: 0.6660 - val_loss: 0.9662
Epoch 6/30
[1m391/391[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m31s[0m 79ms/step - accuracy: 0.6537 - loss: 0.9812 - val_accuracy: 0.6847 - val_loss: 0.9133
Epoch 7/30
[1m3

In [None]:
cnn.evaluate(x_test, y_test)

In [None]:
#epoch이 증가해도 validation의 성능 증가하지 않음.
#기초적인 학습 외에도 다양한 variation을 통해 성능 증가 방안을 모색해볼 수 있음
#레이어를 더 쌓거나, 애초에 고해상도의 이미지를 확보하거나, 학습 데이터를 더 증가시키거나, 규제/배치/정규화 등을 통한 방안이 있음.

import matplotlib.pyplot as plt

plt.plot(hist.history['accuracy'])
plt.plot(hist.history['val_accuracy'])
plt.title('Accuracy Trend')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train','validation'], loc='best')
plt.grid()
plt.show()

In [None]:
plt.plot(hist.history['loss'])
plt.plot(hist.history['val_loss'])
plt.title('Loss Trend')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train','validation'], loc='best')
plt.grid()
plt.show()