# 知識點
- Kernel 用來學習圖像的特徵，張數 (filters) 決定學習的參數量，大小決定特徵接受域 (Receptive field)，也就是看到特徵的大小。
    - 起始值：Kernel 中的值就是我們要訓練的權重，通常用常態分佈隨機產生，再經由訓練更新。
    - 張數：控制張數主要就是控制學習的參數量，常見是16、32 或 64，如果使用16張 Kernels 就能達到很好的效果，也就不需要浪費額外的參數去增加學習與計算量。
    - 大小影響：Receptive field 直觀來說就是 Kernel 提取資訊的尺度，現在普遍流行的方式是選用不同大小的 Kernel 對圖像做卷積後，再把輸出的 Feature maps 合併或平均。 

> 有人提出兩層 3x3 的Kernel 卷積與一層的 5x5 Kernel 卷積擁有相近的Receptive field，並且使用較少的參數量，因此大家不妨去嘗試看看不同組合的效果。

- 奇數 Kernel 有幾個先天上的優勢，第一個原因是由於奇數卷積核有中心點，較容易對齊確認位置資訊，再者是因為奇數卷積核能確保 Padding 的對稱性。

- 參數量
    - 全連接網路 (FCN): inputs x outputs + outputs(bias)，優點是可以保留語意資訊。
    - 卷積網路 (CNN): (kernel_H x kernel_W x channels + 1) x kernel_number，優點是可以保留空間資訊。

## 『本次練習內容』
#### 運用Keras搭建簡單的Dense Layer與 Convolution2D Layer，使用相同Neurons數量，計算總參數量相差多少。


## 『本次練習目的』
  #### 本次練習主要是要讓各位同學們了解CNN與FC層的參數使用量差異
  #### Convolution2D有許多參數可以設置，之後章節會細談
  #### 不熟Keras的學員們也可以藉此了解NN層的不同搭法

In [1]:
import numpy as np
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.layers import Convolution2D, Dense, Input, Flatten

In [2]:
# 輸入照片的尺寸
input_size = (28, 28, 1)

# 建造一個一層的 CNN
cnn_clf = Sequential([
    Convolution2D(kernel_size=3, filters=32, input_shape=input_size)
])

#看看model結構
print(cnn_clf.summary())

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d (Conv2D)              (None, 26, 26, 32)        320       
Total params: 320
Trainable params: 320
Non-trainable params: 0
_________________________________________________________________
None


> 320 = (3 x 3 x 1 + 1) x 32

In [3]:
#建造一個一層的FC層
fc_clf = Sequential([
    Flatten(input_shape=input_size),
    Dense(288)
])

##看看model結構
print(fc_clf.summary())

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
flatten (Flatten)            (None, 784)               0         
_________________________________________________________________
dense (Dense)                (None, 288)               226080    
Total params: 226,080
Trainable params: 226,080
Non-trainable params: 0
_________________________________________________________________
None


In [4]:
# 另一種建造法
flatten_size = tuple([np.prod(input_size)])

# 輸入為28*28*1攤平==784
inputs = Input(shape=flatten_size)

# CNN中用了(3*3*1)*32個神經元，我們這邊也用相同神經元數量
x = Dense(288)(inputs)
model = Model(inputs=inputs, outputs=x)

# 看看model結構
print(model.summary())

Model: "model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         [(None, 784)]             0         
_________________________________________________________________
dense_1 (Dense)              (None, 288)               226080    
Total params: 226,080
Trainable params: 226,080
Non-trainable params: 0
_________________________________________________________________
None


> 226080 = 784 x 288 + 288