<a href="https://colab.research.google.com/github/jong9810/TensorFlow-2.0/blob/main/5_4_CNN_Ex3_CIFAR_10_v1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# CNN Ex3 : CIFAR 10

### CIFAR 10 데이터 : 
- 0 : airplane
- 1 : automobile
- 2 : bird
- 3 : cat
- 4 : deer
- 5 : dog
- 6 : frog
- 7 : horse
- 8 : ship
- 9 : truck

In [None]:
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPool2D, Dropout, Flatten, Dense
from tensorflow.keras.datasets import cifar10

tf.__version__

In [None]:
(x_train, t_train), (x_test, t_test) = cifar10.load_data()

x_train = x_train.reshape(-1,32,32,3)
x_test = x_test.reshape(-1,32,32,3)

print(x_train.shape, t_train.shape)
print(x_test.shape, t_test.shape)

In [None]:
x_train = x_train.astype(np.float32) / 255.0
x_test = x_test.astype(np.float32) / 255.0

In [None]:
from tensorflow.keras.optimizers import Adam

In [None]:
cnn = Sequential()

cnn.add(Conv2D(input_shape=(32,32,3), activation='relu', kernel_size=(3,3), filters=32))
cnn.add(Conv2D(activation='relu', kernel_size=(3,3), filters=64))
cnn.add(MaxPool2D(pool_size=(2,2)))
cnn.add(Dropout(0.25))

cnn.add(Flatten())
cnn.add(Dense(128, activation='relu'))
cnn.add(Dropout(0.5))
cnn.add(Dense(10, activation='softmax'))

In [None]:
from tensorflow.keras.optimizers import Adam

In [None]:
cnn.compile(optimizer=Adam(), loss='sparse_categorical_crossentropy', metrics=['accuracy'])
cnn.summary()

In [None]:
hist = cnn.fit(x_train, t_train, validation_data=(x_test, t_test), batch_size=128, epochs=30)

In [None]:
cnn.evaluate(x_test, t_test)

In [None]:
plt.title('Accuracy Trend')
plt.xlabel('epochs')
plt.ylabel('accuracy')
plt.grid()

plt.plot(hist.history['accuracy'], label='train')
plt.plot(hist.history['val_accuracy'], label='validation')

plt.legend(loc='best')
plt.show()

In [None]:
plt.title('Loss Trend')
plt.xlabel('epochs')
plt.ylabel('loss')
plt.grid()

plt.plot(hist.history['loss'], label='train')
plt.plot(hist.history['val_loss'], label='validation')

plt.legend(loc='best')
plt.show()

In [None]:
# cnn.predict()

## CNN 성능 향상 (오버피팅은 줄이고, 정확도는 높이는 방안)
1. 더 많은 층 쌓기 : Architecture 관점에서 개선방안
- 컨볼루션층이 중첩된 더 깊은 구조가 될수록 성능은 크게 개선됨.
- 예) AlexNet(2012, 8layers), VGGNet(2014, 19layers), GoogleLeNet(2014, 22layers), ResNet(2015, 152layers) 등등

2. 이미지 데이터 보강(Image Data Augmentation)
- 딥러닝에서는 많은 학습 데이터를 사용하면 성능을 개선시킬 수 있음.
- 기존의 (이미지)데이터가 있을 때, 해당 데이터를 원본으로 해서 다양한 변형(rotate, shear, zoom, shift, horizontal flip 등)을 주고, 이렇게 생성된 데이터를 원본 학습 데이터에 포함시켜 수많은 학습 데이터를 확보할 수 있음.

3. 높은 해상도(High Resolution) 학습 데이터 확보
- 동일한 CNN 구조라면, 상대적으로 높은 해상도의 학습 데이터를 통해 성능을 개선시킬 수 있음. 
- 예) [CIFAR10] 32 * 32 ->> [ImageNet image] 469 * 387

4. L1 Norm, L2 Norm 등의 가중치 규제(Regularization), Dropout, 배치 정규화(Batch Normalization) 등을 통해 성능을 개선시킬 수 있음.