# CNN(Convolution Neural Network)
---
- 이미지, 영상 처리에 사용되는 신경망 모델
- DNN의 한 분야
- 텍스트 처리에도 사용되는 모델
- 사용되는 Layer
    * Conv2D  : 이미지 형태 그대로 입력 받아 특징을 추출하는 레이어
    * Pooling : 특징맵에서 특징을 다시 추출하여 다운샘플링하는 레이어, 크기를 반으로 줄임

In [2]:
# 모듈 로딩
from tensorflow.keras.utils import set_random_seed, plot_model
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, Conv2D, Flatten, MaxPool2D
from tensorflow.keras.datasets.fashion_mnist import load_data
import numpy as np
import matplotlib.pyplot as plt

In [3]:
# W, b 고정하도록 seed 설정
set_random_seed(11)

### [1] 데이터 준비 및 로딩

In [4]:
# load_data() 함수를 호출하면 NumPy 어레이의 튜플을 반환
(X_train, y_train), (X_test, y_test) = load_data()
print(f'X_train.shape : {X_train.shape}, y_train.shape : {y_train.shape}')
print(f'X_test.shape  : {X_test.shape}, y_test.shape  : {y_test.shape}')

X_train.shape : (60000, 28, 28), y_train.shape : (60000,)
X_test.shape  : (10000, 28, 28), y_test.shape  : (10000,)


### [2] 데이터 전처리 및 학습형태로 변환

In [5]:
# 스케일링 => 픽셀 / 255.0
X_train = X_train/255.0
X_test = X_test/255.0

In [6]:
# Conv 레이어에서는 입력할 때, 채널값이 있어야 되니까 형태를 바꿔야 함
X_train = X_train.reshape(-1, 28, 28, 1)  # 마지막의 1은 흑백을 의미
X_test = X_test.reshape(-1, 28, 28, 1)   

In [7]:
print(f'X_train.shape : {X_train.shape}')  # 학습용
print(f'X_test.shape  : {X_test.shape}')   # 테스트용

X_train.shape : (60000, 28, 28, 1)
X_test.shape  : (10000, 28, 28, 1)


In [8]:
# 검증용 데이터셋 준비
from sklearn.model_selection import train_test_split
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train,
                                                  stratify = y_train,
                                                  random_state=11)

In [9]:
print(f'X_train.shape : {X_train.shape}\nX_val.shape   : {X_val.shape}\nX_test.shape  : {X_test.shape}')
print(f'y_train.shape : {y_train.shape}\ny_val.shape   : {y_val.shape}\ny_test.shape  : {y_test.shape}')

X_train.shape : (45000, 28, 28, 1)
X_val.shape   : (15000, 28, 28, 1)
X_test.shape  : (10000, 28, 28, 1)
y_train.shape : (45000,)
y_val.shape   : (15000,)
y_test.shape  : (10000,)


### [3] 모델 구성 및 생성
---
- 입력 형태 : 채널 정보까지 포함 3차원 (28, 28, 1)
- 출력 형태 : 0-9까지 정수 (10개 출력)
- 학습 방식 : 각각의 확률값, 가장 큰 확률 => 다중분류 

- 전반부 : 이미지 특징 추출
    * Conv2D, MaxPool2D
- 후반부 : 이미지 데이터 학습
    * Flatten(3차원->1차원 펴기), Dense(연산)

### [3-1] 모델 구상

In [10]:
model = Sequential()

In [11]:
# 이미지 특징 추출 Layer => 첫번째 입력값 설정
model.add(Conv2D(10, kernel_size=3, padding='same', input_shape=(28,28,1)))

In [12]:
# Conv와 MaxPool2D는 한 세트로 생각하고 바로 입력
# 이미지 특징 다운샘플링 layer => MaxPool2D
model.add(MaxPool2D())

In [13]:
# 더이상 한 세트를 실행하지 않겠다 => 출력전 1차원으로 펴줘야 함
# 1차원으로 데이터 형태 변환 Layer => Flatten
model.add(Flatten())

In [14]:
# 결과 출력층 => Node : 0-9까지 10개, activation : softmax
model.add(Dense(10, activation='softmax'))

In [15]:
# 아웃풋으로 보는 것
model.summary()
# (None, 28, 28, 10)에서 None은 -1이라고 생각하면 됨 <= 몇 개 들어올지 모름
# 피처는 786개인데
# 왜 Param #이 10 ?
# -> 커널 한개 특징맵 1개
# -> 커널에는 가중치가 들어 있음 (3x3+1) => 10개 (1개는 bias)

# 커널마다 특징맵에 2개가 되니까, 커널을 2개로 바꾸면
# => (None, 28, 28, 1) -> (None, 28, 28, 2)

# pedding = 'same'을 없애면
# (None, 28, 28, 2) -> (None, 26, 26, 2)

# MaxPool2D -> 연산x, 가로세로 줄어듦 : (28->14)

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 28, 28, 10)        100       
                                                                 
 max_pooling2d (MaxPooling2D  (None, 14, 14, 10)       0         
 )                                                               
                                                                 
 flatten (Flatten)           (None, 1960)              0         
                                                                 
 dense (Dense)               (None, 10)                19610     
                                                                 
Total params: 19,710
Trainable params: 19,710
Non-trainable params: 0
_________________________________________________________________


In [16]:
# 과정 시각화 (인풋도 볼 수 있즤)
# plot_model(model, show_shapes=True, to_file='CNN.png')

### [3-2] 모델 생성
---
- compile 메서드
    * loss 손실함수 => sparse_categorical_crossentropy
    * optimizer 최적화 방식 => adam
    * metrics 평가 항목 => accuracy (loss값은 기본)

In [17]:
model.compile(loss='sparse_categorical_crossentropy',
              optimizer = 'adam', metrics='accuracy')

### [3-3] 모델 학습
---
- fit 메서드
    * 학습 데이터, 타겟
    * epochs 학습 횟수
    * batch_size 학습 분량
    * (경사하강법의 learning rate와는 다름)
    * validation_date (검증 데이터, 검증 타겟)
    * validation_split 학습 데이터의 일부 비율 설정  ex) 0.2
    * callbacks
    * verbose 학습 진행도 화면 출력 여부 설정 (=False 면 안나옴)

In [18]:
model.fit(X_train, y_train, epochs=20)
# 정확도를 높이고 싶음면
# 에포크 늘리고, 
# 테스트와 검증을 시각화해보고, 멈추고 싶은 지점 확인
# -> callback 설정
# Conv2D와 MaxPool2D 세트를 여러번 돌려도 보고

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x1a1c3171040>

In [None]:
filters : 컨볼루션 필터의 수 입니다.
kernel_size : 컨볼루션 커널의 (행, 열) 입니다.
padding : 경계 처리 방법을 정의합니다.
 = 'valid' : 유효한 영역만 출력이 됩니다. 따라서 출력 이미지 사이즈는 입력 사이즈보다 작습니다.
 = 'same' : 출력 이미지 사이즈가 입력 이미지 사이즈와 동일합니다.
input_shape : '샘플 수를 제외한' 입력 형태를 정의 합니다. 모델에서 첫 레이어일 때만 정의하면 됩니다.
 = (행, 열, 채널 수)로 정의합니다. 흑백영상인 경우에는 채널이 1이고, 컬러(RGB)영상인 경우에는 채널을 3으로 설정합니다.
activation : 활성화 함수 설정합니다.
 = 'linear' : 디폴트 값, 입력뉴런과 가중치로 계산된 결과값이 그대로 출력으로 나옵니다.
 = 'relu' : rectifier 함수, 은익층에 주로 쓰입니다.
 = 'sigmoid' : 시그모이드 함수, 이진 분류 문제에서 출력층에 주로 쓰입니다.
 = 'softmax' : 소프트맥스 함수, 다중 클래스 분류 문제에서 출력층에 주로 쓰입니다.

### [4] 평가
---
- evaluate 메서드
- 테스트 데이터, 테스트 타겟

In [19]:
model.evaluate(X_test, y_test)



[0.3231715261936188, 0.8898000121116638]

### [5] 테스트
---
- 새로운 데이터 

In [20]:
# 테스트 값에서 하나 뽑아서
X_test[0]

array([[[0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ]],

       [[0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        [0.        ],
        

In [24]:
pre_y = model.predict(X_test[0].reshape(-1,28,28,1))



In [25]:
# 0-9 순서대로 나올 확률이 적힌 것인데, 9일 확률이 0.99로 가장 높음
pre_y.round(2), pre_y.shape

(array([[0.  , 0.  , 0.  , 0.  , 0.  , 0.02, 0.  , 0.  , 0.  , 0.98]],
       dtype=float32),
 (1, 10))

In [57]:
y_test[0]

9