# 库导入

In [1]:
import tensorflow.keras as keras #keras整框架导入
from tensorflow.keras.datasets import mnist #数据集
import matplotlib.pyplot as plt #matplotlib包用于打印、输出图或图表
from tensorflow.keras.layers import Dense, Dropout # 神经网络层导入
from tensorflow.keras.models import Sequential # 网络神经模式（模型）分为Sequential序列模型和Model函数模型
import numpy as np # 导入numpy包


In [2]:
# 加载官方mnist数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
# x_train训练样本，y_train对应训练样本的标签 、、 x_test测试样本，y_test对应测试样本的标签

# 数据预处理


### 归一化
第一步数据的预先处理 之 归一化
即
将0-255之间的数据压缩到0-1之间

In [3]:
x_train = x_train / 255.0   #特别注意是255.0不是255
x_test = x_test / 255.0

In [4]:
print(x_train.shape)
print(x_test.shape)

(60000, 28, 28)
(10000, 28, 28)


### 根据网络要求改变数组输入的shape
因为我们使用的全连接层，全连接层就是一排解一排，那么数据结构不能是28*28矩阵，
需要做一个reshape，把28*28 做成一排
即 28*28 = 784

In [1]:
x_train = x_train.reshape(60000, 784).astype('float32') # astype('float32') 是告诉系统用的是float32位的
x_test = x_test.reshape(10000, 784).astype('float32')
print(x_train.shape)

NameError: name 'x_train' is not defined

### 标签转 one hot 操作
one hot处理，将所有数据从1 2 3 4...标注改编为：                                                         
如 1 表达为 [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
               如 5 表达为[0, 0, 0, 0, 0, 1, 0, 0, 0, 0]

In [6]:
y_train = keras.utils.to_categorical(y_train, num_classes=10)
y_test = keras.utils.to_categorical(y_test, num_classes=10)

# 模型结构搭建

In [7]:
# 搭建网络结构
model = Sequential() # 实例化

# 向模型中添加层Dense层为全连接层
model.add(Dense(units=128, input_shape=(784, ), activation='relu'))
model.add(Dense(units=128, activation='relu')) # relu为一个算法的名称
model.add(Dropout(0.25)) # dropout是一个层，防止网络过度学习，比如学了100个东西就保留一部分
model.add(Dense(units=10, activation='softmax')) # 该层为输出层、分类层，unit必须为10


# 训练
### 模型编译即训练设置

In [8]:
# 模型编译-设置模型的损失loss、优化器optimizier
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

### 启动训练

In [9]:
# 启动训练，同时加入训练的样本、标签、训练数量和批次数量
model.fit(
    x = x_train,
    y = y_train,
    batch_size = 64,  #batch_size至少为32次，但太多会超过内存容量
    epochs=10,
)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x18036363730>

# 测试

In [10]:
# 使用模型的evaluate方法即评估模型，并载入test数据集，对模型进行测试
loss, acc = model.evaluate(x_test, y_test)
print(loss, acc)

0.07083231210708618 0.9822999835014343


# 模型保存

In [11]:
# 保存模型和权重
model.save('mnistTrain.h5')

# 保存后，我们后期可以再使用这次的训练结果用于推理、预测