# 5-2. Pooling

![image.png](attachment:image.png)
- Max Pooling, Average Pooling
- 연산량을 크게 늘이지 않고 다운 샘플링

![image.png](attachment:image.png)
- 데이터가 가진 지나치게 디테일한 정보를 없애고 적절하게(?) 중요한 정보만 뽑아냄.

### Q. Pooling은 어떤 역할을 하고 Pooling을 사용하였을 때 장점에 대해서 설명해 봅시다.
- Feature map으로 표현된 정보를 축약(down sampling) 
- 비선형성 강화하고 Feature map의 크기를 줄여서 연산 성능 향상

# 5-3. Convolution + Pooling 종합

![image.png](attachment:image.png)
- Feature Extractor : Feature map을 뽑아내고(Convolution) 다운 샘플링(Pooling) 하는 과정을 반복
- CNN 깊이 증가 = 레이어를 많이 쌓음

### Q. Convolution Neural Network를 구성하고 있는 가장 핵심적인 연산 Convolution 연산과 Pooling 연산에 대해서 알아보았습니다. 이제 2가지 연산이 다 적용된 CNN은 어떻게 구성되어 있고 어떤 특징을 가지고 있는지 설명해 봅시다.

CNN은 크게 Feature Extraction과 Classification 영역으로 구성됩니다. 연속적인 CNN 연산(Convolution + Pooling)을 순차적으로 수행하면서 일련의 Feature Map을 생성합니다. CNN 연산을 통해 순차적으로 생성된 Feature map의 크기(높이x너비)는 줄어들지만 채널(깊이)은 증가합니다. 최근에는 더 복잡하고 다양한 Feature 정보를 반영하기 위해, CNN 깊이를 증가시키는 방향으로 점차 발전하고 있습니다.


# 5-4. CNN 구조 구현하기

In [1]:
import tensorflow as tf

In [2]:
# 가로 28, 세로 28, 채널 수 1의 input 데이터를 받는 input layer 생성하기
input_layer = tf.keras.layers.Input(shape=(28, 28, 1)) 

# 커널의 가로 세로 사이즈는 3이고, 채널 수는 4, zero-padding을 넣고,
# stride는 1로 한 Conv2D layer
x = tf.keras.layers.Conv2D(filters=4, kernel_size=3, strides=1, padding='same', activation='relu')(input_layer)

print(type(x))
print(x)

<class 'keras.engine.keras_tensor.KerasTensor'>
KerasTensor(type_spec=TensorSpec(shape=(None, 28, 28, 4), dtype=tf.float32, name=None), name='conv2d/Relu:0', description="created by layer 'conv2d'")


패딩을 사용했기 때문에 input과 동일한 가로 세로 사이즈를 가지고 있고, 채널 수를 4로 했기 때문에 feature map의 채널 수도 4입니다.

## pooling layer가 포함된 CNN 모델 구현

In [6]:
# Q. 가로 27, 세로 27, 채널 수 1의 input 데이터를 받는 input layer 생성해 보세요.
input_tensor = tf.keras.layers.Input(shape = (27, 27, 1))

In [8]:
# Q. 커널의 가로 세로 사이즈는 2이고, 채널 수는 6, zero-padding을 넣고,
# stride는 2인 Conv2D layer x1을 생성해 보세요. (활성화 함수 : relu)
x1 = tf.keras.layers.Conv2D(filters = 6, kernel_size = (2, 2), padding = "same", activation = "relu")(input_tensor)


In [9]:
# 가로 세로 사이즈가 2인 영역에서 최대값을 뽑는 Maxpooling을 적용
x2 = tf.keras.layers.MaxPooling2D(2)(x1) 
print(x1)
print(x2)

KerasTensor(type_spec=TensorSpec(shape=(None, 27, 27, 6), dtype=tf.float32, name=None), name='conv2d_3/Relu:0', description="created by layer 'conv2d_3'")
KerasTensor(type_spec=TensorSpec(shape=(None, 13, 13, 6), dtype=tf.float32, name=None), name='max_pooling2d/MaxPool:0', description="created by layer 'max_pooling2d'")


In [10]:
input_layer = tf.keras.layers.Input(shape=(7, 7, 5))
convlayer1 = tf.keras.layers.Conv2D(filters=4, kernel_size=3, strides=1, padding='same')(input_layer)
convlayer2 = tf.keras.layers.Conv2D(filters=8, kernel_size=3, strides=1, padding='valid')(convlayer1)
pooling = tf.keras.layers.MaxPooling2D(2)(convlayer2)

model = tf.keras.Model(inputs=input_layer, outputs=pooling)
model.summary()

Model: "model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_5 (InputLayer)         [(None, 7, 7, 5)]         0         
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 7, 7, 4)           184       
_________________________________________________________________
conv2d_5 (Conv2D)            (None, 5, 5, 8)           296       
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 2, 2, 8)           0         
Total params: 480
Trainable params: 480
Non-trainable params: 0
_________________________________________________________________


In [11]:
input_layer = tf.keras.layers.Input(shape=(13, 13, 5))
convlayer1 = tf.keras.layers.Conv2D(filters=8, kernel_size=5, strides=2, padding='valid')(input_layer)
convlayer2 = tf.keras.layers.Conv2D(filters=16, kernel_size=5, strides=2, padding='valid')(convlayer1)
pooling = tf.keras.layers.MaxPooling2D(2)(convlayer2)

model = tf.keras.Model(inputs=input_layer, outputs=pooling)
model.summary()

ValueError: Negative dimension size caused by subtracting 2 from 1 for '{{node max_pooling2d_2/MaxPool}} = MaxPool[T=DT_FLOAT, data_format="NHWC", explicit_paddings=[], ksize=[1, 2, 2, 1], padding="VALID", strides=[1, 2, 2, 1]](Placeholder)' with input shapes: [?,1,1,16].

### 오류 발생 이유
- convlayer1의 output size = (13 - 5) // 2 + 1 = 5  -> 5 x 5 x 4
- convlayer2의 output size = (5 -  5) // 2 + 1 = 1 -> 1 x 1 x 16
- MaxPooling2D(2)에서 2 > 1 -> 오류

## 이미지 분류 CNN 모델

In [12]:
input_tensor = tf.keras.layers.Input(shape=(28, 28, 1))
x = tf.keras.layers.Conv2D(filters=32, kernel_size=(3,3), strides=1, padding='same', activation='relu')(input_tensor) 
x = tf.keras.layers.Conv2D(filters=64, kernel_size=3, activation='relu')(x)
x = tf.keras.layers.MaxPooling2D(2)(x)

# 3차원으로 되어있는 Feature map 결과를 Fully Connected 연결하기 위해서는 Flatten()을 적용해야 합니다.
x = tf.keras.layers.Flatten()(x) 

# Flatten 된 결과를 100의 노드를 가진 Fuly Connected Layer와 연결 
x = tf.keras.layers.Dense(100, activation='relu')(x) 
output = tf.keras.layers.Dense(10, activation='softmax')(x)

In [13]:
# Q. tf.keras.Model을 사용하여 model을 정의해 주세요. (위에 코드 참고해서 작성해 보세요.)
model = tf.keras.Model(inputs = [input_tensor], outputs = [output])


In [14]:
# Q. 정의해 준 model이 잘 만들어졌는지 summary를 통해 확인해 보세요.
model.summary()

Model: "model_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_7 (InputLayer)         [(None, 28, 28, 1)]       0         
_________________________________________________________________
conv2d_8 (Conv2D)            (None, 28, 28, 32)        320       
_________________________________________________________________
conv2d_9 (Conv2D)            (None, 26, 26, 64)        18496     
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 13, 13, 64)        0         
_________________________________________________________________
flatten (Flatten)            (None, 10816)             0         
_________________________________________________________________
dense (Dense)                (None, 100)               1081700   
_________________________________________________________________
dense_1 (Dense)              (None, 10)                1010

### Q. 실습 코드의 맨 아래 코드의 실행 결과로 나온 Total params의 수가 어떻게 나온 값인지, 손으로 계산하고 설명해 보세요.

Conv2D layer의 파라미터 수 = {(커널의 사이즈)
2
2
  x 입력 이미지의 채널 개수 x 커널의 개수} + bias 파라미터 개수(커널 개수와 같음)

Dense layer의 파라미터 수 = (입력 레이어의 노드 개수 x 출력 레이어의 노드 개수) + bias 파라미터 개수(출력 레이어의 노드 개수와 같음)

전체 네트워크의 parameter 개수는 각 layer 파라미터 개수의 합입니다.

• 첫 번째 Conv2D의 param #: 3x3x1x32+32 = 320
• 두 번째 Conv2D의 param #: 3x3x32x64+64 = 18496
• 첫 번째 Dense의 param #: 13x13x64x100+100 = 1081700
• 두 번째 Dense(output)의 param #: 100x10+10 = 1010
• Total param #: 320+18496+1081700+1010 = 1,101,526

### Q. Pooling 연산은 어떤 장점이 있었는지 설명해 보세요.

Pooling을 통해 Parameter 연산 없이 Feature map의 차원을 축소할 수 있다는 장점이 있습니다. 차원을 축소 즉, down sampling을 해준다고 표현할 수도 있습니다.

### Q. CNN 구조를 크게 2가지로 나눠본다면 어떤 영역들로 구성이 되어 있는지 설명해 보세요. 또한, CNN 구조의 깊이를 증가시키면 어떤 장점이 있는지 설명해 보세요.
CNN 구조는 크게 특징을 찾아내는 feature extraction과 실제적으로 이미지 분류를 하는 classification 영역으로 나뉩니다. 또한, CNN 구조의 깊이를 증가시키면 다양하고 복잡한 feature를 찾아낼 수 있습니다.