In [1]:
import os
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, optimizers, datasets

In [10]:
(x, y), (x_val, y_val) = datasets.mnist.load_data()
x = 2 * tf.convert_to_tensor(x, dtype=tf.float32) / 255. -1  # 转换为张量，缩放到-1~1
y = tf.convert_to_tensor(y, dtype=tf.int32)
y = tf.one_hot(y, depth=10)
print(x.shape, y.shape)

(60000, 28, 28) (60000, 10)


In [15]:
train_dataset = tf.data.Dataset.from_tensor_slices((x, y))
train_dataset = train_dataset.batch(512)

In [17]:
tf.data.Dataset.from_tensor_slices((x, y))

<TensorSliceDataset shapes: ((28, 28), (10,)), types: (tf.float32, tf.float32)>

In [18]:
tf.data.Dataset.from_tensor_slices((x, y)).batch(512)

<BatchDataset shapes: ((None, 28, 28), (None, 10)), types: (tf.float32, tf.float32)>

load_data()函数返回两个元组(tuple)对象，第一个是训练集，第二个是测试集，每个 tuple
的第一个元素是多个训练图片数据X， 第二个元素是训练图片对应的类别数字Y。 其中训练
集X的大小为(60000,28,28)，代表了 60000 个样本，每个样本由 28 行、 28 列构成，由于是
灰度图片，故没有 RGB 通道； 训练集Y的大小为(60000, )，代表了这 60000 个样本的标签
数字，每个样本标签用一个 0~9 的数字表示。测试集 X 的大小为(10000,28,28)，代表了10000张测试图片，Y的大小为(10000,)

从 TensorFlow 中加载的 MNIST 数据图片， 数值的范围在[0,255]之间。 在机器学习中
间，一般希望数据的范围在 0 周围小范围内分布。通过预处理步骤，我们把[0,255]像素范
围归一化(Normalize)到[0,1. ]区间， 再缩放到[−1,1]区间， 从而有利于模型的训练

每一张图片的计算流程是通用的，我们在计算的过程中可以一次进行多张图片的计
算， 充分利用 CPU 或 GPU 的并行计算能力。 一张图片我们用 shape 为[h, w]的矩阵来表
示， 对于多张图片来说，我们在前面添加一个数量维度(Dimension)，使用 shape 为[b ℎ, w]
的张量来表示， 其中的b代表了 batch size(批量)；多张彩色图片可以使用 shape 为[b, ℎ, w, c]
的张量来表示，其中的c表示通道数量(Channel)，彩色图片c = 3。 通过 TensorFlow 的
Dataset 对象可以方便完成模型的批量训练，只需要调用 batch()函数即可构建带 batch 功能
的数据集对象。

In [2]:
mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

In [3]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(10, activation='softmax')
])

In [4]:
model.compile(optimizer='adam',
             loss='sparse_categorical_crossentropy',
             metrics=['accuracy'])

In [5]:
model.fit(x_train, y_train, epochs=5)
model.evaluate(x_test, y_test, verbose=2)

Train on 60000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
10000/1 - 1s - loss: 0.0361 - accuracy: 0.9774


[0.07176540662792977, 0.9774]

In [10]:
x_train[1].shape

(28, 28)