# CNN 코드 (3)

## 1. Load Data
- 데이터 셋은 총 60,000장의 머신러닝/딥러닝 이미지 데이터 셋으로, 50,000장의 훈련데이터와 10,000장의 테스트 데이터로 구분되며, 총 10개 class의 이미지 데이터 셋이 있음 (이미지 size = 32 x 32)

In [1]:
from keras.datasets import cifar10
(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()

### 1.1 데이터 전처리

#### (1) 크기 변형 (Reshape)
- 훈련 시작 전에, 훈련 이미지 데이터 크기 (32, 32)를 네트워크 크기 (32, 32, 3)에 맞게 reshape 하기

In [2]:
import numpy as np

train_data = train_images.reshape(50000, 32, 32, 3)
test_data = test_images.reshape(10000, 32, 32, 3)

#### (2) 정규화 (Normalization)
- 이미지 데이터 차이 최소화 및 CNN 훈련 속도 증가를 위해 데이터 정규화를 진행
- 정규화는 이미지 픽셀 최대값인 255로 나눠 0과 1 사이의 값을 변형

In [3]:
train_data = train_data/255
test_data = test_data/255

#### (3) 레이블 인코딩 (Lable Encoding)
- 0 ~ 9 사이의 이미지 레이블 데이터를 10개의 숫자 벡터 값으로 변형시켜 주기 위해 원-핫-인코딩을 진행

In [7]:
import keras
import keras.utils
from keras import utils as np_utils
from keras.utils import to_categorical

train_labels_one_hot = to_categorical(train_labels)
test_labels_one_hot = to_categorical(test_labels)

print('Original label 0 : ', train_labels[0])
print('After conversion to categorical ( one-hot ) : ', train_labels_one_hot[0])

Original label 0 :  [6]
After conversion to categorical ( one-hot ) :  [0. 0. 0. 0. 0. 0. 1. 0. 0. 0.]


## 2. Create Model 
- CNN 모델은 2개의 convolution 레이어와 Max 풀링 레이어를 연결함  
- 과대적합(overfitting)을 방지하기 위해 dropout 층 추가 
- 위의 과정을 3번 반복하도록 모델을 구성함

In [8]:
import tensorflow as tf
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation, Flatten
from tensorflow.keras.layers import Conv2D, MaxPooling2D

def createModel():
    model = Sequential()
    model.add(Conv2D(32, (3, 3), padding='same', activation='relu', input_shape=(32, 32, 3))) # 150, 150, 3
    model.add(Conv2D(32, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))

    model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
    model.add(Conv2D(64, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))

    model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
    model.add(Conv2D(64, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))

    model.add(Flatten())
    model.add(Dense(512, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(10, activation='softmax'))
    
    return model

In [9]:
# model.summary() 함수를 이용해 전체 모델 구조 확인
model = createModel()
model.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_6 (Conv2D)            (None, 32, 32, 32)        896       
_________________________________________________________________
conv2d_7 (Conv2D)            (None, 30, 30, 32)        9248      
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 15, 15, 32)        0         
_________________________________________________________________
dropout_4 (Dropout)          (None, 15, 15, 32)        0         
_________________________________________________________________
conv2d_8 (Conv2D)            (None, 15, 15, 64)        18496     
_________________________________________________________________
conv2d_9 (Conv2D)            (None, 13, 13, 64)        36928     
_________________________________________________________________
max_pooling2d_4 (MaxPooling2 (None, 6, 6, 64)         

## 3. Compile Model 
- model.compile() 함수를 이용해 모델 훈련을 위한 환경을 정하기
- 옵티마이저는 'rmsprop'를 사용 (보폭을 갈수록 줄이되, 이전 기울기 변화의 맥락을 살피자는 뜻)

In [10]:
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

![image.png](attachment:image.png)

## 4. Train Model
- model.fit() 함수를 이용해 모델을 훈련시켜줌
- 검증을 진행하기 위해 validation_data를 추가

In [11]:
history = model.fit(train_data, train_labels_one_hot, batch_size=256, epochs=10, verbose=1, 
                   validation_data=(test_data, test_labels_one_hot))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


## 5. Evaluate Model

In [12]:
# 테스트 데이터에 대해 모델 평가
model.evaluate(test_data, test_labels_one_hot)



[0.8943981528282166, 0.6880000233650208]

## 6. loss and accuracy curves
- 모델 훈련 과정에서 훈련이 제대로 진행되고 있는지 그래프로 확인 할 수 있음
- 훈련된 모델에서 손실 그래프(Loss Curves)와 정확도 그래프(Accuracy Curves)를 확인할 수 있음

![image.png](attachment:image.png)

In [13]:
history = model.fit(train_data, train_labels_one_hot, batch_size=256, epochs=10, verbose=1, 
                   validation_data=(test_data, test_labels_one_hot))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [17]:
# [loss curves]
import matplotlib.pyplot as plt

plt.plot(history.history['loss'],'r',linewidth=3.0)
plt.plot(history.history['val_loss'],'b',linewidth=3.0)
plt.legend(['Training loss', 'Validation Loss'],fontsize=18)
plt.xlabel('Epochs ',fontsize=16)
plt.ylabel('Loss',fontsize=16)
plt.title('Loss Curves',fontsize=16)

Text(0.5, 1.0, 'Loss Curves')

In [18]:
# [accuracy curves]

plt.figure(figsize=[8,6])
plt.plot(history.history['accuracy'],'r',linewidth=3.0)
plt.plot(history.history['val_accuracy'],'b',linewidth=3.0)
plt.legend(['Training Accuracy', 'Validation Accuracy'],fontsize=18)
plt.xlabel('Epochs ',fontsize=16)
plt.ylabel('Accuracy',fontsize=16)
plt.title('Accuracy Curves',fontsize=16)


Text(0.5, 1.0, 'Accuracy Curves')

## 7. Data Augmentation
- Data Augmentation : 입력된 이미지를 회전, 대칭, 스케일 변환 등의 작업으로 새로운 이미지를 생성해 이미지 데이터가 부족할 경우 그 문제를 해결해 주고 성능을 높여줌
- Data Augmentation을 하기 위해서는 ImageDataGenerator를 이용해서 할 수 있음

In [19]:
from keras.preprocessing.image import ImageDataGenerator

datagen = ImageDataGenerator()

##### rotation_range : 0~n 각도 내에서 이미지 회전

##### width_shift_range : 수평 방향으로 n 배수만큼 이미지 이동

#####  height_shift_range : 수직 방향으로 n 배수만큼 이미지 이동

#####  horizontal_flip : 상하 반전

##### vertical_flip : 좌우 반전

In [None]:
from keras import models
from keras.preprocessing.image import ImageDataGenerator

batch_size = 64
model2 = createModel()
model2.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

datagen = ImageDataGenerator(width_shift_range=0.1, height_shift_range=0.1, horizontal_flip=True, vertical_flip=False)  
datagen.fit(train_data)

history2 = model2.fit_generator(datagen.flow(train_data, train_labels_one_hot, batch_size=256), 
                                steps_per_epoch=int(np.ceil(train_data.shape[0] / float(batch_size))), 
                                epochs=50, validation_data=(test_data, test_labels_one_hot), workers=4)

Instructions for updating:
Please use Model.fit, which supports generators.
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
102/782 [==>...........................] - ETA: 4:32 - loss: 1.0108 - accuracy: 0.6437