# 了解什么是CNN

#### CNN 模型能夠輕易易辨別這兩兩隻狗的品種
<img src="imgs/keras15_CNN0.png" width="90%">

#### CNN 在圖像辨識競賽中超越⼈人類表現
ImageNet Challenge 是電腦視覺的競賽，需要對影像進⾏行行 1000 個類別的預測，在 CNN 出現後⾸首次有超越⼈人類準確率的模型
<img src="imgs/keras15_CNN1.png" width="70%">

### 卷积是什么
- 卷積其實只是簡單的數學乘法與加法
- 利⽤用濾波器 (filter) 對圖像做卷積來找尋規則
- 下圖的濾波器是⼀一個斜直線，可⽤來搜尋圖像上具有斜直線的區域ImageFilter
<img src="imgs/keras15_CNN2.png" width="100%">

#### 卷積是將影像與 filter 的值相乘後再進⾏加總，即可得到特徵圖
[点击观看gif链接](https://i.imgur.com/XsO8YzY.gifv)

### 卷积的目的
- 透過卷積，我們可以找出圖像上與濾波器具有相同特徵的區域
- 兩個不同濾波器(filter) 得到的特徵圖 (Feature map) 也不相同

### 滤波器（filter）
- 我們已經了解濾波器是⽤來找圖像上是否有同樣特徵
- 那濾波器 (filter) 中的數字是怎麼得來來的呢?•其實是透過資料學習⽽來的! 這也就是 CNN 模型中的參數 (或叫權重weights)
- CNN 會自動從訓練資料中學習出適合的濾波器來完成你的任務 (分類、偵測等)

### 滤波器视觉化
- 透過⼀層又⼀層的神經網路疊加，可以看到底層的濾波器在找線條與顏⾊的特徵，中層則是輪廓與形狀 (輪胎)，高層的則是相對完整的特徵 (如⾞車窗、後照鏡等)


### 延伸阅读
[卷積神經網路的運作原理](https://brohrer.mcknote.com/zh-Hant/how_machine_learning_works/how_convolutional_neural_networks_work.html)

# 卷积神经网路架构细节
> 深度學習(Deep learning)中的CNN較傳統的DNN多了了Convolutional（卷積）及池化（Pooling）兩層layer，⽤以維持形狀狀資訊並且避免參數大幅增加。

- Convolution原理是透過⼀個指定尺⼨的window，由上⽽下依序滑動取得圖像中各局部特徵作為下⼀層的輸入，這個sliding window在CNN中稱為Convolution kernel
- 利用此⽅式來取得圖像中各局部的區域加總計算後，透過 ReLU activation function輸出為特徵值再提供給下一層使⽤


### 卷积网路的组成
- Convolution Layer 卷積層
- Pooling Layer 池化層
- Flatten Layer 平坦層
- Fully connection Layer 全連接層
<img src="imgs/keras15_CNN3.png" width="100%">

#### 平坦层 - Flatten
> Flatten：將特徵資訊丟到Full connected layer來進⾏分類，其神經元只與上一層kernel 的像素連結，⽽且各連結的權重在同層中是相同且共享的

#### 全連接層 - Fully connected layers
> 卷積和池化層，其最主要的目的分別是提取特徵及減少圖像參數，然後將特徵資訊丟到Full connected layer 來進行分類，其神經元只與上⼀層 kernel的像素連結，⽽且各連結的權重在同層中是相同且共享的
<img src="imgs/keras15_CNN4.png" width="100%">


### Convolutional over volume

#### input 上的变化
- 單⾊圖片的 input，是 2D， Width x Height 
- 彩⾊圖片的 input，是 3D， Width x Height x Channels

#### filter 上的变化
- 單⾊圖片的 filter，是 2D, Width x Height 
- 彩⾊色圖片的 filter，是 3D, Width x Height x Channels 
- 但2個 filter 的數值是一樣的

#### feature map 上的变化
- 單⾊圖片，一個 filter，是 2D, Width x Height 
- 多個 filters，Width x Height x filter 數量
- 彩⾊圖片，也是如此

## [3x3 convolution kernels with online demo](http://matlabtricks.com/post-5/3x3-convolution-kernels-with-online-demo#demo)

### 目標:
    運用 Keras 模組建構CNN, 了解 CNN 的架構
   

### 範例重點
    CNN 模型必要的: Convolution, Pooling, Flatten, Fully connection, Output, 

In [3]:
#導入相關模組
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras import models
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, Activation, MaxPooling2D, Flatten, Dense

#確認keras 版本
print(keras.__version__)

2.2.4-tf


In [4]:
#建立一個序列模型
model = models.Sequential()

#建立一個卷績層, 32 個內核, 內核大小 3x3, 
#輸入影像大小 28x28x1
model.add(layers.Conv2D(32, (3, 3), input_shape=(28, 28, 1)))

#新增一池化層, 採用maxpooling
model.add(MaxPooling2D(2,2))

#建立第二個卷績層, 池化層, 
#請注意, 不需要再輸入 input_shape
model.add(layers.Conv2D(25, (3, 3)))
model.add(MaxPooling2D(2,2))

#新增平坦層
model.add(Flatten())

#建立一個全連接層
model.add(Dense(units=100))
model.add(Activation('relu'))

#建立一個輸出層, 並採用softmax
model.add(Dense(units=10))
model.add(Activation('softmax'))

#輸出模型的堆疊
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d (Conv2D)              (None, 26, 26, 32)        320       
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 13, 13, 32)        0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 11, 11, 25)        7225      
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 5, 5, 25)          0         
_________________________________________________________________
flatten (Flatten)            (None, 625)               0         
_________________________________________________________________
dense (Dense)                (None, 100)               62600     
_________________________________________________________________
activation (Activation)      (None, 100)               0

# 卷积层与参数调整

### 卷积的超参数 （Hyper parameter）
- 卷積內核 (kernel)
- Depth (kernels的總數)
- Padding (是否加一圈0值的pixel)
- Stride(選框每次移動的步數)
<img src="imgs/keras15_CNN5.png" width="100%">

### 填充或移动步数（Padding / Stride）的用途
- padding = ‘VALID’ 等於最⼀開始敘述的卷積計算，圖根據 filter ⼤小和 stride⼤小⽽變⼩
> new_height = new_width = (W - F + 1) / S
- padding = ‘ Same’的意思是就是要讓輸入和輸出的⼤小是⼀樣的
- pad=1，表⽰示圖外圈額外加 1 圈 0
- pad=2，圖外圈額外加 2 圈 0，以此類推
<img src="imgs/keras16_CNN1.png" width="100%">

#### 举例
- Model.add(Convolution2D(32, 3, 3), input_shape=(1, 28, 28), strides=2, padding=1)
> 這代表卷積層 filter 數設定為 32，filter 的 kernel size 是 3，步伐 stride 是 2，pad 是1。
- pad = 1，表⽰示圖外圈額外加 1 圈 0，假設 pad = 2，圖外圈額外加 2 圈 0，以此類
- kernel size是 3 的時候，卷積後圖的寬高不要變，pad 就要設定為 1
- kernel size是 5 的時候，卷積後圖的寬高不要變，pad 就要設定為 2
>  new_height = new_width = (W + 2p - F + 1) / S


### 多个通道（channels）的卷积作法
- 考虑多种颜色 - 针对 RGB
- 会有3个对应的kernel

<img src="imgs/keras16_CNN2.png" width="100%">
<img src="imgs/keras16_CNN3.png" width="100%">


### [An Intuitive Explanation of Convolutional Neural Networks](https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/)

### 範例內容:
    定義單步的卷積
    
    輸出卷積的計算值


In [6]:
import numpy as np

In [7]:
# GRADED FUNCTION: conv_single_step
def conv_single_step(a_slice_prev, W, b):
    """
    定義一層 Kernel (內核), 使用的參數說明如下
    Arguments:
        a_slice_prev -- 輸入資料的維度
        W -- 權重, 被使用在 a_slice_prev
        b -- 偏差參數 
    Returns:
        Z -- 滑動窗口（W，b）卷積在前一個 feature map 上的結果
    """

    # 定義一個元素介於 a_slice and W
    s = a_slice_prev * W
    # 加總所有的 "s" 並指定給Z.
    Z = np.sum(s)
    # Add bias b to Z. 這是 float() 函數, 
    Z = float(Z + b)

    return Z

In [8]:
'''
seed( ) 用於指定隨機數生成時所用算法開始的整數值，
如果使用相同的seed( )值，則每次生成的隨即數都相同，
如果不設置這個值，則係統根據時間來自己選擇這個值，
此時每次生成的隨機數因時間差異而不同。
'''
np.random.seed(1)
#定義一個 4x4x3 的 feature map
a_slice_prev = np.random.randn(4, 4, 3)
W = np.random.randn(4, 4, 3)
b = np.random.randn(1, 1, 1)

#取得計算後,卷績矩陣的值
Z = conv_single_step(a_slice_prev, W, b)
print("Z =", Z)

Z = -6.999089450680221


# 池化（Pooling）层与参数调整

### 调用Pooling Layer
> keras.layers.MaxPooling2D(pool_size=(2, 2), strides=None, padding='valid', data_format=None)

- pool_size：整數，沿（垂直，⽔平）方向縮⼩比例的因數。
> (2，2)會把輸入張量的兩個維度都縮⼩⼀半。
- strides：整數，2 個整數表⽰的元組，或者是”None”。表⽰步長值。
> 如果是 None，那麼默認值是 pool_size。
- padding："valid"或者"same"（區分⼤小寫）。
- data_format：channels_last(默認)或 channels_first 之⼀。表⽰輸入各維度的顺序
> channels_last 代表尺⼨寸是(batch, height, width, channels)的輸入張量量
> channels_first 代表尺⼨寸是(batch, channels, height, width)的輸入張量量


### Pooling Layer 常用的类型

- Max pooling (最⼤池化)
- Average pooling (平均池化)

#### 特徵提取的誤差主要來自兩個⽅面
- 鄰域⼤小受限造成的估計值方差增⼤
- 卷積層超參數與內核造成估計均值的偏移

#### ⼀般來說
- average-pooling 能減⼩第⼀種誤差，更多的保留圖像的背景信息
- max-pooling 能減小第⼆種誤差，更多的保留紋理信息

### [卷积神经网络可视化](https://blog.csdn.net/weiwei9363/article/details/79112872)