## MNST数据集

来自http://yann.lecun.com/
专门做手写数字识别的数据集，60000行的训练数据集（mnist.train）和10000行的测试数据集（mnist.test）  ；
每一张图片包含了28*28个像素，像素点的用0-1间的值表示其明暗强度， 像素点为1表示为黑色，像素点为0表示为白色，然后是0.1到0.9依次接近黑色1。  
所以可以把这些像素排成一行数组，展开成一个向量，长度为28*28=784.所以我们用TensorFlow的时候可以当做一个形状为[60000,784]的张量，第一个维度数字用来索引图片，第二个维度数字用来索引每个图片中的像素点。

数据集的分类标签是节约0-9的数字，我们可以将其one-hot编码为10个值得向量，如[0,0,1,0,0,0,0,0,0,0]表示2.
因此mnist.train.labels是一个[60000,10]的数字矩阵。

## 构建神经网络
这里可以看出是有10个类别的多分类任务，建立简单的神经网络模型，输入层784个神经元，输出10个神经元。  


![image.png](image/mnist.png)

## Softmax函数
输出结果为10个神经元，每个神经元的值为其对应数字的概率，比如最终推测一张图片是9的概率为80%，并且10个点的概率和为1。  
使用softmax函数模型可以用来给不同的对象分配概率。  
$softmax(x)_i = \frac{exp(x_i)}{\sum^{j \to 9}_{j = 1}{exp(x_j)}}$

如输出结果为[1,5,3]:

$e^1 = 2.718$ ,
$e^5 = 148.413$,
$e^3 = 20.086$;  
$p1 = \frac{e^1}{e^1+e^5+e^3} = 0.016$  
$p2 = \frac{e^5}{e^1+e^5+e^3} = 0.867$   
$p3 = \frac{e^3}{e^1+e^5+e^3} = 0.117$ 

In [1]:
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

In [6]:
#载入数据集
mnist = input_data.read_data_sets("MNIST_data",one_hot=True)
#将训练数据分成几个批次导入训练
#每个批次的大小，100个样本量
batch_size = 100 
#计算一共有多少个批次
n_batch = mnist.train.num_examples // batch_size   #//为floor除，向下取整

#定义两个placeholder
x = tf.placeholder(tf.float32,[None,784])  ## Here None means that a dimension can be of any length
y = tf.placeholder(tf.float32,[None,10])

#创建一个简单的神经网络
W = tf.Variable(tf.zeros([784,10]))  #权重，in_size*out_size
b = tf.Variable(tf.zeros([10]))      #biases，out_size
prediction = tf.nn.softmax(tf.matmul(x,W)+b)  #计算预测值 ，softmax  

#二次代价函数
loss = tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step = tf.train.GradientDescentOptimizer(0.2).minimize(loss)

#初始化变量
init = tf.global_variables_initializer()

#结果存放在一个布尔型列表中
correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))#argmax返回一维张量中最大的值所在的位置
#求准确率
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

with tf.Session() as sess:
    sess.run(init)
    for epoch in range(30):  #迭代次数
        for batch in range(n_batch):   #批次数
            batch_xs,batch_ys =  mnist.train.next_batch(batch_size)
            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})  #训练
        #计算准确率
        acc = sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
        print("Iter " + str(epoch) + ",Testing Accuracy " + str(acc))

Extracting MNIST_data/train-images-idx3-ubyte.gz
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz
Iter 0,Testing Accuracy 0.8304
Iter 1,Testing Accuracy 0.8716
Iter 2,Testing Accuracy 0.882
Iter 3,Testing Accuracy 0.889
Iter 4,Testing Accuracy 0.8934
Iter 5,Testing Accuracy 0.8962
Iter 6,Testing Accuracy 0.8998
Iter 7,Testing Accuracy 0.9016
Iter 8,Testing Accuracy 0.9033
Iter 9,Testing Accuracy 0.905
Iter 10,Testing Accuracy 0.9063
Iter 11,Testing Accuracy 0.907
Iter 12,Testing Accuracy 0.9084
Iter 13,Testing Accuracy 0.9093
Iter 14,Testing Accuracy 0.9097
Iter 15,Testing Accuracy 0.9114
Iter 16,Testing Accuracy 0.9117
Iter 17,Testing Accuracy 0.912
Iter 18,Testing Accuracy 0.9129
Iter 19,Testing Accuracy 0.9133
Iter 20,Testing Accuracy 0.9143
Iter 21,Testing Accuracy 0.915
Iter 22,Testing Accuracy 0.9159
Iter 23,Testing Accuracy 0.9153
Iter 24,Testing Accuracy 0.9163
Iter 25,Testing Accura