# 教學目標:
    
回顧 CNN 網路

# 範例說明:
    
使用 keras 預載的模型

使用 keras VGG16 預訓練的權重

了解預測後的結果輸出

# 作業:

    回答 Q&A

In [1]:
#載入套件
import keras
import tensorflow as tf
from keras.applications.vgg16 import VGG16
from keras.preprocessing import image
from keras.applications.vgg16 import preprocess_input
import numpy as np

# 確認版本
print("keras_version:",keras.__version__)
print("tensorflow_version:",tf.__version__)

config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.15
sess = tf.Session(config=config)

# 載入預訓練模型
model = VGG16(weights='imagenet', include_top=False)
'''
參數說明
weights='imagenet':代表加载在 ImageNet 上預訓練的權值
include_top: 是否包括頂層的全連接層。
'''

# VGG 現存模型要找到一張名為elephant.jpg做處理的預設路徑
img_path = 'elephant.jpg'
# 載入影像
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img) #image.img_to_array圖片轉化為陣列(Array)
x.flags.writeable = True
# 擴展維度
x = np.expand_dims(x, axis=0) #np.expand_dims:用於擴充套件陣列的形狀，axis=0:在0位置新增資料。
# 預處理
x = preprocess_input(x)

# 執行預測
features = model.predict(x)
print(features)
# decode_predictions 輸出5個最高概率：(類別, 語義概念, 預測概率)

Using TensorFlow backend.
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])


keras_version: 2.3.1
tensorflow_version: 1.13.2
Instructions for updating:
Colocations handled automatically by placer.
[[[[ 0.          0.          0.         ...  0.          0.
     0.        ]
   [ 0.          0.          0.22743171 ...  0.          0.
     0.        ]
   [ 0.          0.          0.         ...  0.          0.
     0.        ]
   ...
   [ 0.          0.          0.         ...  0.          0.
     0.        ]
   [ 0.          0.          0.         ...  0.          0.
     0.        ]
   [ 0.          0.          0.         ...  0.          0.
     0.        ]]

  [[ 0.          0.          0.         ...  0.          0.
     0.        ]
   [14.766544    0.         16.267675   ...  0.          0.
     0.        ]
   [13.843505    0.          4.02565    ...  0.          2.1663551
     0.        ]
   ...
   [ 0.          0.          8.84956    ...  0.          0.
     0.        ]
   [ 5.332777    0.          9.823476   ...  0.          0.
     0.        ]
   [ 0.   

# 問題:

為什麼在CNNs中激活函數選用ReLU，而不用sigmoid或tanh函數？

第一個問題：為什麼引入非線性激勵函數？

Ans: 如果不用激勵函數（其實相當於激勵函數是f(x) = x），在這種情況下你每一層輸出都是上層輸入的線性函數，很容易驗證，無論你神經網絡有多少層，輸出都是輸入的線性組合，與沒有隱藏層效果相當，這種情況就是最原始的感知機（Perceptron）了。
    
     正因為上面的原因，我們決定引入非線性函數作為激勵函數，這樣深層神經網絡就有意義了（不再是輸入的線性組合，可以逼近任意函數）。最早的想法是sigmoid函數或者tanh函數，輸出有界，很容易充當下一層輸入。
        
第二個問題：為什麼引入ReLU呢？

Ans:第一，採用sigmoid等函數，算激活函數時（指數運算），計算量大，反向傳播求誤差梯度時，求導涉及除法，計算量相對大，而採用ReLU激活函數，整個過程的計算量節省很多。
    
    第二，對於深層網絡，sigmoid函數反向傳播時，很容易就會出現梯度消失的情況（在sigmoid接近飽和區時，變換太緩慢，導數趨於0，這種情況會造成信息丟失，參見@ Haofeng Li 答案的第三點），從而無法完成深層網路的訓練。
    
    第三，ReLU會使一部分神經元的輸出為0，這樣就造成了網絡的稀疏性，並且減少了參數的相互依存關係，緩解了過擬合問題的發生。


### 答案參考來源:
https://blog.csdn.net/benniaofei18/article/details/79868689