# Deep Learning: Image Classification with MNIST dataset
> AHSNCCU/NTNU CSIE 王修佑

## 清理GPU記憶體

In [None]:
import IPython
app = IPython.Application.instance()
app.kernel.do_shutdown(True)

## 查看GPU狀態

In [None]:
!nvidia-smi

---

## MNIST 資料集

由 70,000 張從 0 到 9 手寫數字灰階影像組成

以下是 MNIST 資料集包含的其中 40 張影像：

<img src="images/mnist.png" style="width: 600px;">

## 訓練及驗證資料與標籤

1. `x_train`：用於訓練神經網路的影像<br>
2. `y_train`：`x_train` 影像的正確標籤，用於評估模型在訓練過程中的預測表現<br>
3. `x_valid`：另外一組影像，用於驗證模型經過訓練後的效能<br>
4. `y_valid`：`x_valid` 影像的正確標籤，用於評估模型經過訓練後的預測表現<br>

+ Definitions of Train, Validation, and Test Datasets
    + Training Dataset: The sample of data used to fit the model.
    + Validation Dataset: The sample of data used to provide an unbiased evaluation of a model fit on the training dataset while tuning model hyperparameters. The evaluation becomes more biased as skill on the validation dataset is incorporated into the model configuration.
    + Test Dataset: The sample of data used to provide an unbiased evaluation of a final model fit on the training dataset.


> + Training set: A set of examples used for learning, that is to fit the parameters of the classifier.
> + Validation set: A set of examples used to tune the parameters of a classifier, for example to choose the number of hidden units in a neural network.
> + Test set: A set of examples used only to assess the performance of a fully-specified classifier.  
>
> Brian Ripley, page 354, Pattern Recognition and Neural Networks, 1996

## 將資料載入記憶體 (透過 Keras)

載入 MNIST 的 Keras 資料集模組

In [None]:
from tensorflow.keras.datasets import mnist

載入 MNIST 資料，資料已分割成影像和標籤，可用於訓練與驗證

In [None]:
# the data, split between train and validation sets
(x_train, y_train), (x_valid, y_valid) = mnist.load_data()

## 探索 MNIST 資料

In [None]:
x_train.shape

In [None]:
x_valid.shape

+ 影像本身是尺寸 28x28 的 2D 陣列
+ 介於 0 到 255 的 8 bits unsinged integer (正整數值)

In [None]:
x_train.dtype

In [None]:
x_train.min()

In [None]:
x_train.max()

In [None]:
x_train[0]

data視覺化

In [None]:
import matplotlib.pyplot as plt

image = x_train[0]
plt.imshow(image, cmap='gray')

上面的那張圖是多少？(看`label`)

In [None]:
y_train[0]

## 準備資料以進行訓練
1. 扁平化 (Flatten) 影像資料，以簡化輸入至模型的影像資料
2. 正規化影像資料，讓影像輸入值更適合用於模型
3. 分類標籤，讓標籤值更適合用於模型

### 扁平化 (Flatten) 影像資料

調整為連續像素的單一陣列

In [None]:
# Keras API Helper
x_train = x_train.reshape(60000, 784)
x_valid = x_valid.reshape(10000, 784)

In [None]:
x_train.shape

In [None]:
x_train[0]

### 正規化影像資料

將整數值轉換為介於 0 和 1 的浮點值

In [None]:
x_train = x_train / 255
x_valid = x_valid / 255 

In [None]:
x_train.dtype

In [None]:
x_train.min()

In [None]:
x_train.max()

### 分類編碼

舉例：
|實際色彩| 是紅色嗎？| 是藍色嗎？| 是綠色嗎？|
|------------|---------|----------|----------|
|紅色|1|0|0|
|綠色|0|0|1|
|藍色|0|1|0|
|綠色|0|0|1|

也就是

```python
values = ['red, green, blue, green']
```

轉換為

```python
values = [
    [1, 0, 0],
    [0, 0, 1],
    [0, 1, 0],
    [0, 0, 1]
]
```

In [None]:
import tensorflow.keras as keras
num_categories = 10

y_train = keras.utils.to_categorical(y_train, num_categories)
y_valid = keras.utils.to_categorical(y_valid, num_categories)

In [None]:
y_train[0:9]

## 建立模型

1. 輸入層(Input Layer)，負責接收某種預期格式的資料
2. 數個隱藏層(Hidden Layer)，各由多個神經元(NN)組成。每個神經元都會依權重(Weight)影響到網路的猜測，權重值會隨著網路獲得效能和學習的回饋而在多次迭代中更新。
3. 輸出層(Output Layer)，負責呈現網路對特定影像的猜測

### 具現化模型

In [None]:
from tensorflow.keras.models import Sequential

model = Sequential()

### 建立輸入層
+ 使用 Keras 的Dense，其中的每個神經元及其權重，都會影響下一層的每個神經元。
+ 使用 `relu`激活函數(Activation Function)，使我們的network學會如何對資料進行更複雜的推測
+ `input_shape`值會指定傳入資料的形狀
+ `unit`引數(argument)為神經元數量

> NN中Weight更新全中是如何運作的👉[何謂BP](https://medium.com/ai-academy-taiwan/back-propagation-3946e8ed8c55)

In [None]:
from tensorflow.keras.layers import Dense

model.add(Dense(units=512, activation='relu', input_shape=(784,)))

### 建立隱藏層

In [None]:
model.add(Dense(units = 512, activation='relu'))

### 建立輸出層
+ 使用激活函數 `softmax`，這會使層中每一個值成為介於 0 和 1 的機率

In [None]:
model.add(Dense(units = 10, activation='softmax'))

### 總結模型
模型的摘要

In [None]:
model.summary()

> Hyperparameter, Parameter, Weight, Argument...?

### 編譯模型

In [None]:
model.compile(loss='categorical_crossentropy', metrics=['accuracy'])

## 訓練模型

In [None]:
history = model.fit(
    x_train, y_train, epochs=5, verbose=1, validation_data=(x_valid, y_valid)
)

> fit model vs. tune model?

### 觀察準確度

+ 從 `accuracy`可以看出模型在這個 Epoch 對所有訓練資料的表現如何
+ 從 `val_accuracy`可以看出模型在驗證資料上的表現

## 清除記憶體

In [None]:
import IPython
app = IPython.Application.instance()
app.kernel.do_shutdown(True)

---

## Extra 小試身手

In [None]:
import numpy as np
from numpy.polynomial.polynomial import polyfit
import matplotlib.pyplot as plt

m = 4  # -2 to start, change me please
b = 19  # 40 to start, change me please

# Sample data
x = np.array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9])
y = np.array([10, 20, 25, 30, 40, 45, 40, 50, 60, 55])
y_hat = x * m + b

plt.plot(x, y, '.')
plt.plot(x, y_hat, '-')
plt.show()

print("Loss:", np.sum((y - y_hat)**2)/len(x))

In [None]:
import IPython
app = IPython.Application.instance()
app.kernel.do_shutdown(True)