In [None]:
import tensorflow as tf
import numpy as np  # numpy是一个常用的科学计算库，提供了矩阵运算的功能
import matplotlib.pyplot as plt  # matplotlib是一个常用的绘图库，提供了丰富的绘图功能

print(tf.__version__)

# 本指南使用 Fashion MNIST 数据集，该数据集包含 10 个类别的 70,000 个灰度图像。这些图像以低分辨率（28x28 像素）展示了单件衣物
# 为什么都是28x28的低分辨率图像呢？因为这样的图像处理起来更快，更容易训练模型
fashion_mnist = tf.keras.datasets.fashion_mnist

# 已经划分的训练集和测试集
# 图片以及对应的标签
# 因为是分类任务，所以标签是类别的索引，从0开始，有了标签模型才知道如何进行分类
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
# print(train_images.shape)  # (60000, 28, 28) shape是numpy数组的属性，表示数组的维度 tarin_images是一个60000x28x28的数组 60000张28x28的图片
# print(train_images[0, 23, 23])  # 194 第一张图片中第23行第23列的像素值
# print(train_labels[:10])  # [9 0 0 3 0 2 7 2 5 5] 前10张图片的标签

# 0 T-shirt/top（T恤） 1 Trouser（裤子） 2 Pullover（套衫） 3 Dress（连衣裙） 4 Coat（外套） 5 Sandal（凉鞋）
# 6 Shirt（衬衫） 7 Sneaker（运动鞋） 8 Bag（包） 9 Ankle boot（踝靴）
# 将类别索引映射到类别名称
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

# 数据预处理
# plt的使用
# plt.figure()  # 创建一个新的图像
# plt.imshow(train_images[0])  # imshow是显示图片的函数 train_images[0]是第一张图片
# plt.colorbar()  # colorbar是显示颜色条的函数
# plt.grid(False)  # grid是显示网格的函数
# plt.show()

# 归一化 为什么要进行归一化呢？因为神经网络处理较大值的数据更加困难，所以将像素值缩放到0到1之间
train_images = train_images / 255.0
test_images = test_images / 255.0

# 显示训练集中的前25张图片，并在每张图片下显示类别名称
plt.figure(figsize=(10, 10))  # figsize是设置图像的大小
for i in range(25):
    plt.subplot(5, 5, i + 1)  # subplot是在一张图中绘制多个子图，subplot(5, 5, i + 1)表示将图像分为5行5列，i+1表示图像的索引
    plt.xticks([])  # xticks是x轴刻度
    plt.yticks([])  # yticks是y轴刻度
    plt.grid(False)  # grid是显示网格的函数
    plt.imshow(train_images[i],
               cmap=plt.cm.binary)  # imshow是显示图片的函数 train_images[0]是第一张图片 cmap=plt.cm.binary表示以灰度图的形式显示
    plt.xlabel(class_names[train_labels[i]])  # xlabel是x轴标签
plt.show()
# 所以最终显示的是25张28x28的灰度图像，并且每张图下方有对应的标签

# 构建模型
# 神经网络的基本组成部分是层 层会从向其馈送的数据中提取表示形式
# keras.Sequential就是层的线性堆叠，这里有两个全连接层（Dense）的神经网络
model = tf.keras.Sequential([
    # 将图像格式从二维数组（28 x 28 像素）转换成一维数组（28 x 28 = 784 像素）
    tf.keras.layers.Flatten(input_shape=(28, 28)),  # Flatten层用于展平张量 我们的输入就是28x28的像素值矩阵，所以输入形状是(28, 28)
    tf.keras.layers.Dense(128, activation='relu'),  # 全连接层，128个节点，激活函数为relu，relu是一个线性整流函数
    tf.keras.layers.Dense(10)  # 全连接层，10个节点，因为我们有10个类别，激活函数为softmax，softmax是一个归一化指数函数
])

# 编译模型
# 优化器（Optimizer）：决定如何基于损失函数对网络进行更新
# 损失函数（Loss Function）：衡量网络输出和标签之间的距离 本例中使用的是tf.keras.losses.SparseCategoricalCrossentropy 交叉熵损失函数
# 指标（Metrics）：监控训练和测试步骤 本例中使用的是tf.keras.metrics.SparseCategoricalAccuracy 稀疏分类准确率
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# 训练模型
model.fit(train_images, train_labels, epochs=10) # model.fit()方法会返回一个History对象，它包含了训练过程中的loss和metrics
# Epoch 1/10
# 1875/1875 [==============================] - 1s 688us/step - loss: 0.5048 - accuracy: 0.8239
# Epoch 2/10
# 1875/1875 [==============================] - 1s 676us/step - loss: 0.3798 - accuracy: 0.8640
# Epoch 3/10
# 1875/1875 [==============================] - 1s 694us/step - loss: 0.3397 - accuracy: 0.8759
# Epoch 4/10
# 1875/1875 [==============================] - 1s 657us/step - loss: 0.3148 - accuracy: 0.8842
# Epoch 5/10
# 1875/1875 [==============================] - 1s 727us/step - loss: 0.2978 - accuracy: 0.8904
# Epoch 6/10
# 1875/1875 [==============================] - 1s 686us/step - loss: 0.2843 - accuracy: 0.8949
# Epoch 7/10
# 1875/1875 [==============================] - 1s 657us/step - loss: 0.2705 - accuracy: 0.8995
# Epoch 8/10
# 1875/1875 [==============================] - 1s 679us/step - loss: 0.2604 - accuracy: 0.9026
# Epoch 9/10
# 1875/1875 [==============================] - 1s 637us/step - loss: 0.2490 - accuracy: 0.9077
# Epoch 10/10
# 1875/1875 [==============================] - 1s 660us/step - loss: 0.2394 - accuracy: 0.9113
# 313/313 - 0s - loss: 0.3416 - accuracy: 0.8784 - 164ms/epoch - 525us/step
#
# Test accuracy: 0.8784000277519226

# 评估准确率
# model.evaluate()方法返回的是损失值和指标值 verbose=2表示静默模式，0表示进度条模式，1表示每个epoch输出一行记录
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)
print('\nTest accuracy:', test_acc)

# 保存模型
# tf.keras.models.save_model(model, 'fashion_mnist_model.h5')

# 模型推理 softmax层将模型的原始输出转换为概率
probability_model = tf.keras.Sequential([model, tf.keras.layers.Softmax()])
predictions = probability_model.predict(test_images) # 预测test_images中所有样本的输出
print(predictions[0]) # [1.0125039e-06 1.0487580e-08 1.2652463e-07 1.0734065e-08 1.0948872e-07 1.0871145e-02 1.1369725e-06 1.3498602e-02 1.0213277e-05 9.7562889e-01]
print(np.argmax(predictions[0])) # 9 查看最大值的索引
print(test_labels[0])
# Test accuracy: 0.8774999976158142
# 313/313 [==============================] - 0s 362us/step
# [1.7611395e-05 1.2961021e-07 1.6398500e-08 1.3516286e-08 1.3992171e-07
#  2.6378641e-02 1.6936543e-06 1.4795704e-01 2.8115863e-05 8.2561660e-01]
# 9
# 9