## 합성곱 신경망 (CNN)을 사용한 이미지 분류

In [1]:
import tensorflow as tf

tf.keras.utils.set_random_seed(42)
tf.config.experimental.enable_op_determinism()

ModuleNotFoundError: No module named 'tensorflow'

### 패션 MNIST 데이터 불러오기

In [3]:
from tensorflow import keras
from sklearn.model_selection import train_test_split

(train_input, train_target), (test_input, test_target) = \
    keras.datasets.fashion_mnist.load_data()

train_scaled = train_input.reshape(-1, 28, 28, 1) / 255.0

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

### 합성곱 신경망

#### 합성곱 신경망 만들기

In [11]:
model = keras.Sequential()

In [12]:
# 32개의 필터, 커널의 크기는 (3,3), 렐루활성화함수와 세임패딩을 사용
model.add(keras.layers.Conv2D(32, kernel_size=3, activation='relu',
                             padding='same', input_shape=(28,28,1)))

In [13]:
# 풀링층 추가, 2*2사이즈의 풀링 적용
model.add(keras.layers.MaxPooling2D(2))

In [14]:
# 첫번째 합성곱 - 풀링층 다음에 두번째 합성곱 - 풀링층을 추가해보자
model.add(keras.layers.Conv2D(64, kernel_size=(3,3), activation='relu',
                             padding='same'))
model.add(keras.layers.MaxPooling2D(2))

#64개의 필터를 사용했으므로 맵의 크기는 (7,7,64)

In [15]:
# 특성맵을 일렬로 펼쳐서 바로 출력층에 전달하지않고
# 중간에 하나의 밀집 은닉층을 하나 더 둔다.

# Flatten클래스 다음 Dense 은닉층 마지막으로 Dense 출력층
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dropout(0.4))
model.add(keras.layers.Dense(10, activation='softmax'))

In [16]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_3 (Conv2D)           (None, 28, 28, 32)        320       
                                                                 
 max_pooling2d_3 (MaxPooling  (None, 14, 14, 32)       0         
 2D)                                                             
                                                                 
 conv2d_4 (Conv2D)           (None, 14, 14, 64)        18496     
                                                                 
 max_pooling2d_4 (MaxPooling  (None, 7, 7, 64)         0         
 2D)                                                             
                                                                 
 flatten_1 (Flatten)         (None, 3136)              0         
                                                                 
 dense_2 (Dense)             (None, 100)              

In [17]:
keras.utils.plot_model(model)

You must install pydot (`pip install pydot`) and install graphviz (see instructions at https://graphviz.gitlab.io/download/) for plot_model to work.


In [18]:
keras.utils.plot_model(model, show_shapes=True, to_file='cnn-architecture.png', dpi=300)

You must install pydot (`pip install pydot`) and install graphviz (see instructions at https://graphviz.gitlab.io/download/) for plot_model to work.


## 모델 컴파일과 훈련
- Adam 옵티마이저를 사용하고 콜백을 사용해 조기 종료 기법을 구현

In [20]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', 
              metrics=['accuracy'])

checkpoint_cb = keras.callbacks.ModelCheckpoint('best-cnn-model.h5', 
                                                save_best_only=True)

early_stopping_cb = keras.callbacks.EarlyStopping(patience=2,
                                                  restore_best_weights=True)

history = model.fit(train_scaled, train_target, epochs=20,
                    validation_data=(val_scaled, val_target),
                    callbacks=[checkpoint_cb, early_stopping_cb])

In [None]:
import matplotlib.pyplot as plt

plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])

plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend(['train','val'])

plt.show()

# 검증세트에 대한 손실이 점차 감소하다가 정체되기시작하고 훈련세트에 데한 손실은 점점 더 낮아지고있음.
# 이 그래프를 기반으로 네번째 에포크를 최적으로 생각할 수 있음

In [None]:
model.evaluate(val_scaled, val_target)

#### predict()메서드를 사용한 훈련모델

In [None]:
plt.imshow(val_scaled[0].reshape(28,28), cmap='gray_r')
plt.show()

In [None]:
preds = model.predict(val_scaled[0:1])
print(preds)

# 출력결과를 보면 아홉번째값이 1이고 다른값은 거의 0에 가까운걸 볼 수 있다
# 다시 말해 9번째 클래스라고 강하게 예측

In [None]:
classes = ['티셔츠', '바지', '스웨터', '드레스', '코트',
           '샌달', '셔츠', '스니커즈', '가방', '앵클 부츠']

In [None]:
import numpy as np
print(classes[np.argmax(preds)])

In [None]:
test_scaled = test_input.reshape(-1,28,28,1) / 255.0

In [None]:
model.evaluate(test_scaled, test_target)