# **MNIST資料集深度學習訓練2**
MNIST為手寫辨識資料集，含有60000筆手寫數字訓練資料，以及10000筆測試資料 本範例利用傳統的深度學習模型進行訓練 並且把手寫數字標籤(正確數字)利用onehot encoding進行轉換，加速訓練過程

In [1]:
# import Keras、mnist手寫資料集、模型、層數、Dropout、規則、Conv2D、優化器
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, LeakyReLU, Conv2D
from keras.optimizers import RMSprop
from keras.utils import np_utils
import numpy as np

# 讀取手寫資料集，x_train、y_train為訓練資料，x_test, y_test為測試資料
# x_train、y_train分別為訓練資料的Data與Data的答案，x_test, y_test同樣
# y_train與y_test資料的正確數字介於0~9之間(0,1,2,3,4,5,6,7,8,9)
(x_train, y_train), (x_test, y_test) = mnist.load_data()
# 定義分類數量 = 10
num_classes = 10

# 使用reshape將訓練資料切分為單筆最大為784的大小，共計6萬筆及1萬筆
x_train = x_train.reshape(60000, 784)
x_test = x_test.reshape(10000, 784)
# 將訓練資料的型態轉換為float32，目的為之後的正規化
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
# 對訓練資料做正規化，手寫資料集的資料每一pixel為灰階（1~255），除以255讓數值正規化介於0~1之間
x_train /= 255
x_test /= 255
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')
# 使用.to_categorical方法，將測試資料轉換成one_hot encoding的方式
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

model = Sequential()
# 第一層為20個點，輸入資料為一個784維的張量（上面已經切好了）
model.add(Dense(20, activation=LeakyReLU(), input_shape=(784,)))
# 第二層為20個點
model.add(Dense(20, activation=LeakyReLU()))
# 第三層為10個點，並總結輸出結果
model.add(Dense(10, activation='softmax'))
model.summary()
# 編譯模型
model.compile(loss='categorical_crossentropy',
              optimizer=RMSprop(),
              metrics=['accuracy'])
# 倒入訓練資料、測試資料，每次的樣本大小為128，跑10輪，以進度條方式顯示
history = model.fit(x_train, y_train,
                    batch_size=128,
                    epochs=10,
                    verbose=1,
                    validation_data=(x_test, y_test))
# 在測試中，返回loss及metrics values
scores = model.evaluate(x_test, y_test)
# 輸出
print(scores[1])

Using TensorFlow backend.


Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz
60000 train samples
10000 test samples


  identifier=identifier.__class__.__name__))


Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 20)                15700     
_________________________________________________________________
dense_2 (Dense)              (None, 20)                420       
_________________________________________________________________
dense_3 (Dense)              (None, 10)                210       
Total params: 16,330
Trainable params: 16,330
Non-trainable params: 0
_________________________________________________________________
Train on 60000 samples, validate on 10000 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
0.9503999948501587
