In [1]:
from tensorflow.keras.datasets import mnist
from tensorflow.keras. utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

In [2]:
#1.载入mnist数据集，分为训练集和测试集
#x是28x28的手写数字像素单通道灰度图(灰度图的每个像素取值范围是[0-255])
#y是该手写图片集所对应的0到9的标签
(x_train,y_train),(x_test,y_test)=mnist.load_data()

#2.改变数据尺寸
# 训练集数据 x_train 的数据形状为（60000，28，28），6000张28*28的图片
# 训练集标签 y_train 的数据形状为（60000）
# 测试集数据 x_test 的数据形状为（10000，28，28）
# 测试集标签 y_test 的数据形状为（10000）
# 将（60000，28，28）->（60000，784），三维数据集转为二维的数据集
# x_train.shape[0]表示第一个维度的值，-1表示自动将剩下两个维度值相乘
x_train=x_train.reshape(x_train.shape[0],-1)
x_test=x_test.reshape(x_test.shape[0],-1)

#3.对x数据归一化
#对训练集和测试集的数据进行归一化处理，有助于提升模型训练速度
#本例中,归一化处理输入数据,就是把每个像素点的数据范围由[0-255]转为[0-1]
x_train=x_train/255.0
x_test=x_test/255.0

#4.对y标签进行one-hot（独热编码）处理
#通常会把分类问题的标签转化为独热编码的格式。
#在手写数字识别的任务中，数字有0-9一共 10 中状态，所以每个数字都可以转换为长度为 10 的编码
y_train=to_categorical(y_train,num_classes=10)
y_test=to_categorical(y_test,num_classes=10)

In [3]:
#1.创建模型，输入784个神经元，输出10个神经元,无隐藏层
#激活函数softmax，表示将输出结果转为概率
model=Sequential([
    Dense(units=10,input_dim=784,activation='softmax')
])

#2.编译模型(代价函数是交叉熵)
model.compile(optimizer='sgd',loss='categorical_crossentropy',metrics=['accuracy'])

#3.训练模型
#训练集中有60000张图片，每次训练拿到图片32张，直到60000张图片遍历一遍，叫做一个epoch
model.fit(x_train,y_train,batch_size=32,epochs=10)

#4.评估模型
loss,accuracy=model.evaluate(x_test,y_test)
print('loss:',loss)
print('accuracy',accuracy)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
loss: 0.30632904171943665
accuracy 0.9168999791145325
