![](./graphs/dl_banner.jpg)

# 用tensorflow low level API构建softmax分类器
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

## 问题背景：MNIST 手写数字
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

这是一个非常经典的问题，我们的对象是手写数字图片，我们需要根据手写数字图片的输入，构建线性的分类器(softmax分类器)去区分图片是手写数字0-9中的哪一个。这个问题的数据集，每一张图片的表示是长宽为28的矩阵，我们有时候会把它展开成784维的向量。MNIST手写数据集长成下面这样。

![MNIST Dataset](http://neuralnetworksanddeeplearning.com/images/mnist_100_digits.png)

更多的信息可以参考: http://yann.lecun.com/exdb/mnist/

## 0.softmax分类器
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)
softmax是线性分类器，我们对WX+b得到的得分，做e的指数次方变换并进行归一化，视作每个类别的概率。如下是一个3分类的softmax分类器。
![](./graphs/softmax.png)

## 1.引入工具库

In [1]:
import tensorflow as tf
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.3
session = tf.Session(config=config, ...)

SyntaxError: positional argument follows keyword argument (<ipython-input-1-ebfc32748798>, line 4)

## 2.设定超参数

In [2]:
learning_rate = 0.01 # 学习率
training_epochs = 40 # 迭代轮次
batch_size = 100 # 一批数据的大小
display_step = 1 # 展示间隔轮次

## 3.准备数据，设定参数变量

In [3]:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use urllib or similar directly.


URLError: <urlopen error [Errno 104] Connection reset by peer>

In [None]:
# 占位符
x = tf.placeholder(tf.float32, [None, 784]) # mnist数据集维度为28*28=784
y = tf.placeholder(tf.float32, [None, 10]) # 0-9总共有10个不同的手写数字类别

# 设定模型权重
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))

## 4.完成模型构建

In [None]:
# 构建线性模型
pred = tf.nn.softmax(tf.matmul(x, W) + b) # Softmax

## 5.计算损失与优化器设定

In [7]:
# 计算损失函数
cost = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred), reduction_indices=1))
# 梯度下降优化器
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

# 初始化计算图中的变量（用默认值去赋值）
init = tf.global_variables_initializer()

## 6.在session当中完成计算图计算(损失计算与优化、参数更新迭代)
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [8]:
# 在一个session中开始训练
with tf.Session() as sess:
    sess.run(init)

    # 训练多轮
    for epoch in range(training_epochs):
        avg_cost = 0.
        total_batch = int(mnist.train.num_examples/batch_size)
        # 遍历整个batch中的数据
        for i in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            # 用一个batch的数据进行计算
            _, c = sess.run([optimizer, cost], feed_dict={x: batch_xs,
                                                          y: batch_ys})
            # 计算损失
            avg_cost += c / total_batch
        # 输出信息
        if (epoch+1) % display_step == 0:
            print("第%03d轮" % (epoch+1), "当前损失为:", "{:.9f}".format(avg_cost))

    print("训练完成")

    # 测试准确率
    correct_prediction = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
    # 计算3000个样本上的准确率
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
    print("模型在测试集上的准确率为:", accuracy.eval({x: mnist.test.images[:3000], y: mnist.test.labels[:3000]}))

第001轮 当前损失为: 1.183818436
第002轮 当前损失为: 0.665096398
第003轮 当前损失为: 0.552753121
第004轮 当前损失为: 0.498719098
第005轮 当前损失为: 0.465534159
第006轮 当前损失为: 0.442602484
第007轮 当前损失为: 0.425550613
第008轮 当前损失为: 0.412202658
第009轮 当前损失为: 0.401395418
第010轮 当前损失为: 0.392460036
第011轮 当前损失为: 0.384764009
第012轮 当前损失为: 0.378210436
第013轮 当前损失为: 0.372443716
第014轮 当前损失为: 0.367306434
第015轮 当前损失为: 0.362693102
第016轮 当前损失为: 0.358619540
第017轮 当前损失为: 0.354874160
第018轮 当前损失为: 0.351471949
第019轮 当前损失为: 0.348304359
第020轮 当前损失为: 0.345452699
第021轮 当前损失为: 0.342723163
第022轮 当前损失为: 0.340294046
第023轮 当前损失为: 0.337940708
第024轮 当前损失为: 0.335773496
第025轮 当前损失为: 0.333699900
第026轮 当前损失为: 0.331792934
第027轮 当前损失为: 0.329947298
第028轮 当前损失为: 0.328250528
第029轮 当前损失为: 0.326614243
第030轮 当前损失为: 0.325080024
第031轮 当前损失为: 0.323596105
第032轮 当前损失为: 0.322179264
第033轮 当前损失为: 0.320835774
第034轮 当前损失为: 0.319535086
第035轮 当前损失为: 0.318319274
第036轮 当前损失为: 0.317116945
第037轮 当前损失为: 0.315937209
第038轮 当前损失为: 0.314899189
第039轮 当前损失为: 0.313856568
第040轮 当前损失为: 0.312853739


### 版权归 © 稀牛学院 所有 保留所有权利
![](./graphs/xiniu_neteasy.png)