#### 加载Keras中的MNIST数据集

In [1]:
from tensorflow.keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [4]:
print(train_images.shape)
print(test_images.shape)

(60000, 28, 28)
(10000, 28, 28)


In [18]:
train_images

array([[[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       ...,

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]],

       [[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 

In [5]:
train_labels

array([7, 2, 1, ..., 4, 5, 6], dtype=uint8)

#### 构建神经网络
>神经网络的核心组件就是层(layer)。相当于是过滤器，进去一些数据，出来的数据变得更加有用。大多数深度学习工作涉及将简单的层链接起来，从而实现渐进式的数据蒸馏。深度学习模型就是处理数据筛子，包含了一系列越来越精细的数据过滤器（layer）。


In [19]:
from tensorflow import keras
from tensorflow.keras import layers
model = keras.Sequential([
    layers.Dense(512, activation="relu"),
    #返回一个由10个概率值（总和为1）组成的数组。每个概率值表示当前图像属于10个数字类别中某一个的概率。
    layers.Dense(10, activation="softmax") 
])

>执行编译步骤的3个参数
- 优化器（optimizer）：基于训练数据自我更新的机制，目的是提高模型的性能。
- 损失函数（loss function）：模型如何衡量在训练数据上的性能，从而引导自己朝正确的方向前进。
- 监控指标（metric）: 训练和测试过程中需要监控的指标


In [25]:
model.compile(optimizer="rmsprop",
              loss="sparse_categorical_crossentropy",
              metrics=["accuracy"])

> 图像数据预处理，将其变成模型要求的形状，并缩放所有值都在[0-1]之间。

In [26]:
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype("float32") / 255
test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype("float32") / 255

In [27]:
train_images.shape

(60000, 784)

> 拟合模型，通过调用模型的fit方法来完成。

In [28]:
model.fit(train_images,train_labels,epochs=5,batch_size=128)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x7fbf5cdc60a0>

> 利用模型进行预测

In [38]:
#获取一个待预测的图片
test_digits=test_images[0:1]
#预测
predict_res=model.predict(test_digits)
#预测结果，当前图片对应数字图像类别i的概率
print(predict_res)
#获取概率最大的索引
print(predict_res[0].argmax())
#概率值为
print(predict_res[0][7])
#检查预测图片对应的测试标签是否一致
print(test_labels[0])

[[3.9247701e-05 7.7609833e-08 2.7191067e-05 5.4058083e-04 2.0493217e-06
  3.0348121e-05 1.4608930e-08 9.9753189e-01 7.9109695e-06 1.8206477e-03]]
7
0.9975319
7


> 评估模型

In [39]:
test_loss, test_acc = model.evaluate(test_images, test_labels)
#测试精度约为91.3%，训练精度（90.7%）
print(f"test_acc: {test_acc}")


test_acc: 0.9139999747276306
