In [1]:
%matplotlib inline

import numpy as np
import matplotlib.pyplot as plt

In [None]:
# 讀入 Tensorflow

In [None]:
import tensorflow as tf

### 1. 讀入 MNIST 數據集

在這裡面有六萬筆手寫資料

In [None]:
from tensorflow.keras.datasets import mnist
# keras 由純 python 編寫，基於 theano/tensorflow 的深度學習框架。
# keras 是一個高層神經網絡 API，支持快速實驗，能夠把你的 idea 迅速轉換為結果。
# mnist 是由美國度量衡標準局他們建立的手寫辨識數據庫，經過 Yann LeCun 修改後而成，共有六萬筆訓練資料、一萬筆測試資料。

In [None]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

### 2. 欣賞數據集內容

In [None]:
len(x_train)
# 看訓練資料有幾筆

In [None]:
len(x_test)
# 看測試資料有幾筆

In [None]:
n = 9487

In [None]:
x_train[n]
# 這裡用中括號[]是「索引」的意思
# 看第 9487 筆資料長什麼樣子

In [None]:
y_train[n]

In [None]:
plt.imshow(x_train[n], cmap='Greys')
# imshow 就是把矩陣當成圖形秀出來
#出現為手寫辨識的 1

In [None]:
n = 8888

plt.imshow(x_train[n], cmap='Greys')
print('正確答案:', y_train[n])
#看他的正確答案是否等於真正的正確答案

In [None]:
n = 3627

plt.imshow(x_train[n], cmap='Greys')
print('正確答案:', y_train[n])

### 3. 資料整理

In [None]:
np.array([3, 78, 95, 99])/255
# np.array 的功用是可以把所有數字一次相除
# 把所有數字都壓在 0~1 之間

In [None]:
x_train = x_train/255
x_test = x_test/255

In [None]:
x_train.shape
# 看此資料庫原本的形狀長怎樣
# 顯示出共有六萬筆資料，每一筆資料都是 28*28 的形式

In [None]:
28*28

In [None]:
x_train = x_train.reshape(60000, 784)
#現在要把他拉平變 784維的向量 

In [None]:
x_train

In [None]:
x_test = x_test.reshape(10000, 784)

In [None]:
len(x_test)

In [None]:
x_train = x_train.reshape(60000, 784)/255

In [None]:
x_test = x_test.reshape(10000, 784)/255

In [None]:
from tensorflow_core.keras.utils import to_categorical
# to_categorical 是為了要把一般的數字轉成 one-hot encoding，為了要解決分類的問題

In [None]:
y_train = to_categorical(y_train, 10)
# 打原本的 training data 改成 one-hot encoding
# 因為電腦不知道總共有幾種，所以要告訴他我們目前資料有10種

In [None]:
y_test = to_categorical(y_test, 10)

In [None]:
y_train[9487]
# 由前述可看到在此資料庫中第 9487筆資料的手寫辨識為 1
# 因此在這裡將它轉成 one-hot encoding

### 打造神經網路

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
# layers 一層層的套件
# 如果一個隱藏層和前面的輸入鄫和後面的輸出層有很多連結，就可以稱為是 dense（緊密連接的意思）
from tensorflow.keras.optimizers import SGD
# 神經網路會有很多種學習方法（優化），目前讀入的是最標準的學習方式 SGD，未來可以試試如果改成不同學習方式是否會學習的更好

In [None]:
# 開一台空白函數學習機
model = Sequential()
# 以前用的機器學習結構都比較簡單，調整的東西都可以用預設值
# 但神經網路要自己一層層去打造出來

In [None]:
model.add(Dense(784, input_dim=784, activation='relu'))
# 現在要做的就是把我們的神經網路一層層加上去
# 要設計 87 個神經元，輸入為 784 維

In [None]:
model.add(Dense(784, activation='relu'))
# 這一層不用再放輸入，因為上一層已經設定好，但激勵函數仍要再告訴電腦

In [None]:
model.add(Dense(10, activation='softmax'))
# 輸出要有 10 個神經元
# 這裡使用 softamx，因為 relu 的功用是數入＝輸出，但目前我們無法得知神經網路會算出哪十個數字，但會有大有小，這些數字代表他的強度，因此我們要將這些數字做轉換，將他們全部變成介於 0~1 之間的數，而且相加等於 1
# softmax 作用就是讓最後的輸出相加為 1

### 4. 組裝我們的神經網路

In [None]:
model.compile(loss='mse', optimizer=SGD(lr=0.001), metrics=['accuracy'])
# mse 把誤差
# 組裝

In [None]:
model.summary()
# 共有 68295 個參數

In [None]:
784*87 + 87
# 有 784 個神經元
# 有 87 個偏值要調整

### 5. 訓練

In [None]:
model.fit(x_train, y_train, batch_size=100, epochs=20)

### 6. 訓練成果

In [None]:
result = model.predict_classes(x_test)

In [None]:
result[9487]

In [None]:
n = 9487

print('神經網路預測是:', result[n])
plt.imshow(x_test[n].reshape(28, 28), cmap='Greys')

In [None]:
n = 9999

print('神經網路預測是:', result[n])
plt.imshow(x_test[n].reshape(28, 28), cmap='Greys')