<a href="https://colab.research.google.com/github/cserock/colab-examples/blob/main/04_CNN_%EC%A0%84%EC%9D%B4%ED%95%99%EC%8A%B5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# CNN

10개의 클래스로 분류되는 이미지 데이터셋인 [CIFAR-10](https://www.cs.toronto.edu/~kriz/cifar.html)을 사용하여 CNN을 어떻게 구현하는지 알아보자.

1. 패키지 및 라이브러리 불러오기

In [1]:
from tensorflow.keras.datasets import cifar10
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, Conv2D, MaxPooling2D, Flatten
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.models import Sequential
from tensorflow.keras.datasets import cifar10

from sklearn.model_selection import train_test_split

import numpy as np
import tensorflow as tf

2. 시드(seed) 고정하기

In [2]:
np.random.seed(42)
tf.random.set_seed(42)

3. 데이터셋 불러오기 & 훈련 / 검증 / 테스트셋으로 나누기 & 이미지 픽셀값 정규화

In [3]:
(X_train, y_train), (X_test, y_test) = cifar10.load_data()

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
[1m170498071/170498071[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 0us/step


In [4]:
X_train = X_train.astype('float32') / 255.
X_test = X_test.astype('float32') / 255.

In [5]:
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=.2)

In [6]:
X_train.shape

(40000, 32, 32, 3)

훈련 데이터셋으로 가로 32, 세로 32 픽셀의 컬러(RGB, 3개 채널) 이미지 40000개가 있다.

4. 합성곱 신경망 모델 구축

In [7]:
model = Sequential()

# 특징 추출 부분
# 합성곱 층(Conv2D)와 풀링 층(MaxPooling2D)를 번갈아가며 사용
# input_shape 파라미터 추가 - 예: CIFAR-10 데이터셋 (32x32x3)
model.add(Conv2D(32, (3,3), padding='same', activation='relu', input_shape=(32, 32, 3)))
model.add(MaxPooling2D(2,2))
model.add(Conv2D(32, (3,3), padding='same', activation='relu'))
model.add(MaxPooling2D(2,2))
model.add(Conv2D(32, (3,3), padding='same', activation='relu'))
model.add(MaxPooling2D(2,2))

# 분류기 역할의 완전 연결 신경망
# 특징 추출 부분을 거쳐온 데이터를 신경망에 입력할 수 있도록 1차원으로 변환
model.add(Flatten())
model.add(Dense(128, activation='relu'))
# 10개의 클래스 분류이므로 출력층에 10개의 노드를, 활성화 함수로 softmax를 지정
model.add(Dense(10, activation='softmax'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Conv2D에서 반드시 지정해야 하는 첫 번째 파라미터는 필터의 수(filters), 두 번째는 필터(커널)의 크기(kernel_size)이다.  
padding은 'valid' 또는 'same'로 지정 가능하다.  
'valid'는 패딩을 적용하지 않아 Conv2D를 지나면 입력된 이미지의 shape이 작아진다.  
'same'은 패딩을 적용하여 Conv2D 전후의 이미지 shape이 동일하게 만든다.  
  
MaxPooling2D에서 풀링할 영역의 크기(pool_size)는 (2, 2)가 기본값이다.  
strides 파라미터를 지정하여 몇 칸 단위로 움직이며 풀링을 할지 지정할 수 있다.   기본값은 None으로, 이대로 두면 pool_size와 동일하게 설정된다. 즉, 풀링 영역이 겹치지 않게 된다.

In [8]:
model.summary()

Output Shape은 (행 수, 가로 픽셀 수, 세로 픽셀 수, 채널 수) 라고 생각하면 쉽다.  
여기서 행(row) 수는 None으로 표시되어 있는데, 이는 특정한 숫자로 지정되지 않았음을 의미한다. 배치 사이즈처럼 32, 64 등 다양한 숫자가 올 수도 있기 때문이다.  
채널 수는 각 Conv2D에서 지정한 filters의 값에 맞춰 나온 것을 볼 수 있다.  
  
MaxPooling2D는 입력으로 들어온 이전의 Conv2D의 shape을 줄였다.  
채널의 수는 입력 데이터와 동일하며, 학습되는 가중치가 없기 때문에 Param #도 0으로 표기되었다.  
  
Flatten에서는 (4, 4, 32)의 데이터가 1차원으로 변환되었기 때문에 4*4*32=512의 shape을 갖게 되었다.

In [9]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

10개 클래스의 다중 분류 문제이므로 'loss'를 'sparse_categorical_crossentropy'로 지정했다.

In [10]:
model.fit(X_train, y_train,
          batch_size=128,
          validation_data=(X_val, y_val),
          epochs=10)

Epoch 1/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 17ms/step - accuracy: 0.2909 - loss: 1.9107 - val_accuracy: 0.4779 - val_loss: 1.4379
Epoch 2/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 6ms/step - accuracy: 0.5066 - loss: 1.3668 - val_accuracy: 0.5528 - val_loss: 1.2644
Epoch 3/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 6ms/step - accuracy: 0.5794 - loss: 1.1869 - val_accuracy: 0.6079 - val_loss: 1.1197
Epoch 4/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 6ms/step - accuracy: 0.6220 - loss: 1.0735 - val_accuracy: 0.6246 - val_loss: 1.0683
Epoch 5/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 6ms/step - accuracy: 0.6486 - loss: 1.0038 - val_accuracy: 0.6411 - val_loss: 1.0141
Epoch 6/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 7ms/step - accuracy: 0.6697 - loss: 0.9446 - val_accuracy: 0.6534 - val_loss: 0.9795
Epoch 7/10
[1m313/313[0m

<keras.src.callbacks.history.History at 0x78658c4d64b0>

5. 모델 평가

In [11]:
model.evaluate(X_test, y_test, verbose=2)

313/313 - 1s - 5ms/step - accuracy: 0.6799 - loss: 0.9124


[0.9124175906181335, 0.6798999905586243]

# 전이 학습

위의 CIFAR-10 데이터셋을 그대로 사용하되,  
모델은 사전 학습 모델(VGG16)을 이용한 전이 학습 모델로 구축

패키지 및 라이브러리 불러오기

In [12]:
from tensorflow.keras.applications.vgg16 import VGG16
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D

사전 학습 모델(VGG16) 불러오기  
- weights='imagenet' : 사전 학습된 가중치를 ImageNet 데이터셋으로부터 불러옴  
- include_top=False : 최종 분류층(완전 연결 계층들)을 포함하지 않고 특징 추출용 특성 맵만 반환하도록 설정

In [13]:
pretrained_model = VGG16(weights='imagenet', include_top=False)

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg16/vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5
[1m58889256/58889256[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 0us/step


사전 학습 모델 위에 분류기 추가하기  
아래에 추가된 GlobalAveragePooling2d() 층은 데이터 Shape을 (None, None, None, 512) 에서 (None, 512)로 변환하는 역할을 한다.

In [14]:
model = Sequential()
model.add(pretrained_model)
model.add(GlobalAveragePooling2D())
model.add(Dense(128,activation='relu'))
model.add(Dense(10,activation='softmax'))

In [15]:
model.summary()

In [16]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [17]:
model.fit(X_train, y_train,
          batch_size=128,
          validation_data=(X_val, y_val),
          epochs=10)

Epoch 1/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m51s[0m 118ms/step - accuracy: 0.1923 - loss: 2.0623 - val_accuracy: 0.4100 - val_loss: 1.5729
Epoch 2/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m25s[0m 81ms/step - accuracy: 0.4710 - loss: 1.3804 - val_accuracy: 0.6016 - val_loss: 1.1193
Epoch 3/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m26s[0m 82ms/step - accuracy: 0.6583 - loss: 0.9740 - val_accuracy: 0.6876 - val_loss: 0.8904
Epoch 4/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m26s[0m 82ms/step - accuracy: 0.7345 - loss: 0.7872 - val_accuracy: 0.7469 - val_loss: 0.7727
Epoch 5/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m26s[0m 82ms/step - accuracy: 0.7769 - loss: 0.6652 - val_accuracy: 0.7482 - val_loss: 0.7611
Epoch 6/10
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m26s[0m 83ms/step - accuracy: 0.8142 - loss: 0.5596 - val_accuracy: 0.7758 - val_loss: 0.7116
Epoch 7/10
[1m

<keras.src.callbacks.history.History at 0x7865545690d0>

In [18]:
model.evaluate(X_test, y_test, verbose=2)

313/313 - 4s - 12ms/step - accuracy: 0.7654 - loss: 0.8504


[0.8504144549369812, 0.7653999924659729]