![](./graphs/dl_banner.jpg)

# 用tensorflow low level API构建softmax分类器
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

## 问题背景：MNIST 手写数字
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

这是一个非常经典的问题，我们的对象是手写数字图片，我们需要根据手写数字图片的输入，构建线性的分类器(softmax分类器)去区分图片是手写数字0-9中的哪一个。这个问题的数据集，每一张图片的表示是长宽为28的矩阵，我们有时候会把它展开成784维的向量。MNIST手写数据集长成下面这样。

![MNIST Dataset](http://neuralnetworksanddeeplearning.com/images/mnist_100_digits.png)

更多的信息可以参考: http://yann.lecun.com/exdb/mnist/

## 0.softmax分类器
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)
softmax是线性分类器，我们对WX+b得到的得分，做e的指数次方变换并进行归一化，视作每个类别的概率。如下是一个3分类的softmax分类器。
![](./graphs/softmax.png)

## 1.引入工具库

In [2]:
import tensorflow as tf
import warnings
warnings.filterwarnings('ignore')
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.3
session = tf.Session(config=config)   # tf.Session()的括号内还可以添加其他参与进行设置

## 2.设定超参数

In [3]:
learning_rate = 0.01 # 学习率
training_epochs = 40 # 迭代轮次
batch_size = 100 # 一批数据的大小
display_step = 1 # 展示间隔轮次

## 3.准备数据，设定参数变量

In [7]:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/data/Deep_learning/MNIST_data", one_hot=True)

Extracting /data/MNIST_data/train-images-idx3-ubyte.gz
Extracting /data/MNIST_data/train-labels-idx1-ubyte.gz
Extracting /data/MNIST_data/t10k-images-idx3-ubyte.gz
Extracting /data/MNIST_data/t10k-labels-idx1-ubyte.gz


In [8]:
# 占位符
x = tf.placeholder(tf.float32, [None, 784]) # mnist数据集维度为28*28=784
y = tf.placeholder(tf.float32, [None, 10]) # 0-9总共有10个不同的手写数字类别

# 设定模型权重
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))

## 4.完成模型构建

In [9]:
# 构建线性模型
pred = tf.nn.softmax(tf.matmul(x, W) + b) # Softmax

## 5.计算损失与优化器设定

In [10]:
# 计算损失函数
cost = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred), reduction_indices=1))
# 梯度下降优化器
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

# 初始化计算图中的变量（用默认值去赋值）
init = tf.global_variables_initializer()

## 6.在session当中完成计算图计算(损失计算与优化、参数更新迭代)
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [11]:
# 在一个session中开始训练
with tf.Session() as sess:
    sess.run(init)

    # 训练多轮
    for epoch in range(training_epochs):
        avg_cost = 0.
        total_batch = int(mnist.train.num_examples/batch_size)
        # 遍历整个batch中的数据
        for i in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            # 用一个batch的数据进行计算
            _, c = sess.run([optimizer, cost], feed_dict={x: batch_xs,
                                                          y: batch_ys})
            # 计算损失
            avg_cost += c / total_batch
        # 输出信息
        if (epoch+1) % display_step == 0:
            print("第%03d轮" % (epoch+1), "当前损失为:", "{:.9f}".format(avg_cost))

    print("训练完成")

    # 测试准确率
    correct_prediction = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
    # 计算3000个样本上的准确率
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
    print("模型在测试集上的准确率为:", accuracy.eval({x: mnist.test.images[:3000], y: mnist.test.labels[:3000]}))

第001轮 当前损失为: 1.184057028
第002轮 当前损失为: 0.665516272
第003轮 当前损失为: 0.552934921
第004轮 当前损失为: 0.498698776
第005轮 当前损失为: 0.465524674
第006轮 当前损失为: 0.442535270
第007轮 当前损失为: 0.425554796
第008轮 当前损失为: 0.412231688
第009轮 当前损失为: 0.401333827
第010轮 当前损失为: 0.392426639
第011轮 当前损失为: 0.384791511
第012轮 当前损失为: 0.378171671
第013轮 当前损失为: 0.372441453
第014轮 当前损失为: 0.367276647
第015轮 当前损失为: 0.362725584
第016轮 当前损失为: 0.358590473
第017轮 当前损失为: 0.354867438
第018轮 当前损失为: 0.351498647
第019轮 当前损失为: 0.348300745
第020轮 当前损失为: 0.345436346
第021轮 当前损失为: 0.342771339
第022轮 当前损失为: 0.340219269
第023轮 当前损失为: 0.337930693
第024轮 当前损失为: 0.335715040
第025轮 当前损失为: 0.333687778
第026轮 当前损失为: 0.331791264
第027轮 当前损失为: 0.329913907
第028轮 当前损失为: 0.328241467
第029轮 当前损失为: 0.326575357
第030轮 当前损失为: 0.325047551
第031轮 当前损失为: 0.323519590
第032轮 当前损失为: 0.322162600
第033轮 当前损失为: 0.320807652
第034轮 当前损失为: 0.319525292
第035轮 当前损失为: 0.318305898
第036轮 当前损失为: 0.317124124
第037轮 当前损失为: 0.316001304
第038轮 当前损失为: 0.314899550
第039轮 当前损失为: 0.313886847
第040轮 当前损失为: 0.312833868


### 版权归 © 稀牛学院 所有 保留所有权利
![](./graphs/xiniu_neteasy.png)