探討神經元增加到 `1024` 的效果

In [1]:
import tensorflow as tf

In [2]:
fashion_mnist = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = fashion_mnist.load_data()

**normalizing** 減少計算

In [3]:
training_images  = training_images / 255.0
test_images = test_images / 255.0
training_images_reshape = tf.reshape(training_images,(-1,(28*28)))
test_images_reshape = tf.reshape(test_images,(-1,(28*28)))

- relu：表示如果 `X>0` 返回 `X`，否則返回 `0`。它做的只是將值 `0` 或更大的值傳遞給網路中的下一層
- softmax：使用一組值並選擇最大的值。例如，如果最後一層的輸出看起來像[0.1、0.1、0.05、0.1、9.5、0.1、0.05、0.05、0.05]，然後將其變成 [0,0,0,0,1,0,0,0,0,0]

In [9]:
from tensorflow.keras.layers import Input
from tensorflow.keras.layers import Flatten, Dense
from tensorflow.keras.models import Model
visible = Input(shape=(28*28,))
input_flatten = Flatten()(visible) # 變成一維
hidden = Dense(1024, activation=tf.nn.relu)(input_flatten) # 128 變 1024
output = Dense(10, activation=tf.nn.softmax)(hidden)
model = Model(inputs=visible, outputs=output)

使用 `fit`  進行訓練，並使用 `optimizer`、`sparse_categorical_crossentropy`，要求將訓練數據擬合訓練標籤，也就是找出兩者之間的關係。

In [10]:
model.compile(optimizer = tf.optimizers.Adam(),
              loss = 'sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(training_images_reshape, training_labels, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1d295b0b148>

使用 `evaluate`，傳入兩個測試集合，它將報告每個集合的損失

In [11]:
model.evaluate(test_images_reshape, test_labels)



[0.33301299810409546, 0.8802000284194946]

預測

In [12]:
classifications = model.predict(test_images_reshape)
print(classifications[0]) # 9 的機率是最大的，輸出的數值是 It's the probability that this item is each of the 10 classes

[4.7693829e-06 1.1688599e-08 1.9159824e-08 5.7459876e-10 9.1895656e-09
 4.4642411e-02 1.4031658e-06 3.0229826e-02 2.4175774e-06 9.2511910e-01]


In [13]:
print(test_labels[0]) # 確實是 9

9


訓練時間相對拉長，但準確率有提升，`loss` 有在更低。