# 用Python的Keras库来学习手写数字（MNIST）分类

@zhouxi

将手写数字的灰度图像（像素为28* 28)划分到10个class中去（数字0，1，2....9）

In [10]:
import tensorflow as tf
from tensorflow.keras.datasets import mnist

In [14]:
#train_images&train_labels组成了训练集，test_images&test_labels组成了测试集
(train_images,train_labels),(test_images,test_labels)= mnist.load_data()

In [17]:
#调shape看一下training set和test set的大小，6000个training samples（with labels），1000个test samples（with labels）
print(train_images.shape)
print(train_labels.shape)
print(test_images.shape)
print(test_labels.shape)

(60000, 28, 28)
(60000,)
(10000, 28, 28)
(10000,)


In [26]:
train_labels

array([5, 0, 4, ..., 5, 6, 8], dtype=uint8)

In [19]:
#将训练集图像以及对应labels输入神经网络，神经网络学习映射规则，再将测试数据输入神经网络得到预测标签，验证预测标签与真正的标签的区别
#首先搭建一个两层（密集连接）的网络
from tensorflow.keras import layers
from tensorflow.keras import models
network=models.Sequential()
network.add(layers.Dense(512,activation='relu',input_shape=(28*28,)))
network.add(layers.Dense(10,activation='softmax'))
#使用了2个全连接（即密集连接）的神经层（layer），每层都对数据进行一次变化，经过层层变化，获取data中的有用信息，第二层有10个unit，返回一个由10个概率值（对应于10个class的分别概率）组成的数组

Instructions for updating:
Colocations handled automatically by placer.


In [20]:
#compile：为了训练以上网络，需要指定 loss function(损失函数) optimizer(优化器）和 measure metrics
network.compile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])

In [29]:
print(train_images.dtype)
print(train_images.shape)

uint8
(60000, 28, 28)


In [31]:
#对图片进行预处理，将图片reshape成input的size
#之前的training images形状为(60000, 28, 28)，是一个uint8数组，将其astype为float32，size为28*28的数组,缩放到[0,1]之间（对256*256的图片来说就是除以255）
train_images=train_images.reshape(60000,28*28)
train_images=train_images.astype('float32')/255

In [32]:
#test set也一样
test_images=test_images.reshape(10000,28*28)
test_images=test_images.astype('float32')/255

In [33]:
#对标签进行分类编码,解释待补充
from tensorflow.keras.utils import to_categorical
train_labels=to_categorical(train_labels)
test_labels=to_categorical(test_labels)

In [34]:
#用fit方法来拟合模型
network.fit(train_images,train_labels,epochs=5,batch_size=128)

Instructions for updating:
Use tf.cast instead.
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0xb34ffe390>

In [37]:
#上面显示，这个model在training set上达到了0.9893的精确度
#试着用到test set上
test_loss,test_acc=network.evaluate(test_images,test_labels)
print('loss:',test_loss)
print('acc:',test_acc)

loss: 0.06537875325451604
acc: 0.9799
