![](./graphs/dl_banner.jpg)

# 用tensorflow low level API构建卷积神经网络
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

## 0.知识背景：卷积神经网络
卷积神经网络是一种在计算机视觉当中广泛应用的神经网络，其特殊的网络结构，包含卷积层、池化层等，能在共享参数的同时保证对图像特征的高效抽取。经典的卷积神经网络结构如下。
![CNN](http://personal.ie.cuhk.edu.hk/~ccloy/project_target_code/images/fig3.png)

## 0.问题背景：MNIST 手写数字
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

这是一个非常经典的问题，我们的对象是手写数字图片，我们需要根据手写数字图片的输入，构建线性的分类器(softmax分类器)去区分图片是手写数字0-9中的哪一个。这个问题的数据集，每一张图片的表示是长宽为28的矩阵，我们有时候会把它展开成784维的向量。MNIST手写数据集长成下面这样。

![MNIST Dataset](http://neuralnetworksanddeeplearning.com/images/mnist_100_digits.png)

更多的信息可以参考: http://yann.lecun.com/exdb/mnist/

## 1.引入工具库

In [1]:
from __future__ import division, print_function, absolute_import
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.3
session = tf.Session(config=config)

import warnings
warnings.filterwarnings('ignore')

## 2.设定超参数
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [2]:
# 训练超参数
learning_rate = 0.001
num_steps = 600
batch_size = 128
display_step = 10

# 神经网络超参数
num_input = 784 # MNIST数据输入(数据形状: 28*28)
num_classes = 10 # MNIST总共类别(0-9总共10个手写数字)
dropout = 0.25 # Dropout随机失活概率


# 占位符
X = tf.placeholder(tf.float32, [None, num_input])
Y = tf.placeholder(tf.float32, [None, num_classes])
keep_prob = tf.placeholder(tf.float32) # dropout (keep probability)

# 变量
weights = {
    # 5x5 卷积核, 1 输入, 32 输出
    'wc1': tf.Variable(tf.random_normal([5, 5, 1, 32])),
    # 5x5 卷积核, 32 输入, 64 输出
    'wc2': tf.Variable(tf.random_normal([5, 5, 32, 64])),
    # 全连接, 7*7*64 输入, 1024 输出
    'wd1': tf.Variable(tf.random_normal([7*7*64, 1024])),
    # 1024 输入, 10 输出(总共1类)
    'out': tf.Variable(tf.random_normal([1024, num_classes]))
}

biases = {
    'bc1': tf.Variable(tf.random_normal([32])),
    'bc2': tf.Variable(tf.random_normal([64])),
    'bd1': tf.Variable(tf.random_normal([1024])),
    'out': tf.Variable(tf.random_normal([num_classes]))
}

## 3.准备数据

In [3]:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/data/Deep_learning/MNIST_data", one_hot=True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /data/MNIST_data/train-images-idx3-ubyte.gz
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /data/MNIST_data/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Extracting /data/MNIST_data/t10k-images-idx3-ubyte.gz
Extracting /data/MNIST_data/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.


## 4.构建模型
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [4]:
# 定义卷积层运算(卷积层+激活层)
def conv2d(x, W, b, strides=1):
    x = tf.nn.conv2d(x, W, strides=[1, strides, strides, 1], padding='SAME')
    x = tf.nn.bias_add(x, b)
    return tf.nn.relu(x)

# 定义池化层运算
def maxpool2d(x, k=2):
    return tf.nn.max_pool(x, ksize=[1, k, k, 1], strides=[1, k, k, 1],
                          padding='SAME')


# 构建卷积神经网络模型
def conv_net(x, weights, biases, dropout):
    # 原本MNIST数据输入是784维度向量
    # 调整成 宽*高*通道数 的标准图片输入格式
    # 总共是4个维度[Batch Size, Height, Width, Channel]，其中第一个维度-1表示暂时不确定一个batch多少张
    x = tf.reshape(x, shape=[-1, 28, 28, 1])

    # 卷积层
    conv1 = conv2d(x, weights['wc1'], biases['bc1'])
    # 池化层
    conv1 = maxpool2d(conv1, k=2)

    # 卷积层
    conv2 = conv2d(conv1, weights['wc2'], biases['bc2'])
    # 池化层
    conv2 = maxpool2d(conv2, k=2)

    # 全连接层，需要先把数据展开成一维向量，再接全连接
    fc1 = tf.reshape(conv2, [-1, weights['wd1'].get_shape().as_list()[0]])
    fc1 = tf.add(tf.matmul(fc1, weights['wd1']), biases['bd1'])
    fc1 = tf.nn.relu(fc1)
    # 随机失活层
    fc1 = tf.nn.dropout(fc1, dropout)

    # 最终预估结果
    out = tf.add(tf.matmul(fc1, weights['out']), biases['out'])
    return out

## 5.计算损失与优化

In [5]:
# 构建卷积神经网络预估结果
logits = conv_net(X, weights, biases, keep_prob)
prediction = tf.nn.softmax(logits)

# 定义损失与优化器
loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(
    logits=logits, labels=Y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)
train_op = optimizer.minimize(loss_op)


# 评估模型
correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# 初始化变量
init = tf.global_variables_initializer()

Instructions for updating:

Future major versions of TensorFlow will allow gradients to flow
into the labels input on backprop by default.

See `tf.nn.softmax_cross_entropy_with_logits_v2`.



## 6.在session当中完成计算图计算(损失计算与优化、参数更新迭代)
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [6]:
# 在session当中开始训练
with tf.Session() as sess:

    # 初始化
    sess.run(init)

    for step in range(1, num_steps+1):
        batch_x, batch_y = mnist.train.next_batch(batch_size)
        # 优化
        sess.run(train_op, feed_dict={X: batch_x, Y: batch_y, keep_prob: dropout})
        if step % display_step == 0 or step == 1:
            # 计算准确率
            loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x,
                                                                 Y: batch_y,
                                                                 keep_prob: 1.0})
            print("第" + str(step) + "步, 一个minibatch上的损失为 " + \
                  "{:.4f}".format(loss) + ", 训练准确率为 " + \
                  "{:.3f}".format(acc))

    print("完成训练！")

    # 计算准确率
    print("测试准确率为 ", \
        sess.run(accuracy, feed_dict={X: mnist.test.images[:256],
                                      Y: mnist.test.labels[:256],
                                      keep_prob: 1.0}))

第1步, 一个minibatch上的损失为 94273.9375, 训练准确率为 0.047
第10步, 一个minibatch上的损失为 35434.6797, 训练准确率为 0.180
第20步, 一个minibatch上的损失为 24230.7832, 训练准确率为 0.242
第30步, 一个minibatch上的损失为 12827.9004, 训练准确率为 0.477
第40步, 一个minibatch上的损失为 10220.4033, 训练准确率为 0.586
第50步, 一个minibatch上的损失为 5346.5376, 训练准确率为 0.734
第60步, 一个minibatch上的损失为 5682.7095, 训练准确率为 0.680
第70步, 一个minibatch上的损失为 5006.3652, 训练准确率为 0.719
第80步, 一个minibatch上的损失为 5189.5469, 训练准确率为 0.750
第90步, 一个minibatch上的损失为 3176.7327, 训练准确率为 0.797
第100步, 一个minibatch上的损失为 2512.3745, 训练准确率为 0.836
第110步, 一个minibatch上的损失为 2947.1016, 训练准确率为 0.805
第120步, 一个minibatch上的损失为 1838.0354, 训练准确率为 0.812
第130步, 一个minibatch上的损失为 3381.7510, 训练准确率为 0.789
第140步, 一个minibatch上的损失为 2609.5156, 训练准确率为 0.836
第150步, 一个minibatch上的损失为 2276.7642, 训练准确率为 0.812
第160步, 一个minibatch上的损失为 1564.4897, 训练准确率为 0.883
第170步, 一个minibatch上的损失为 2586.9688, 训练准确率为 0.828
第180步, 一个minibatch上的损失为 1718.2142, 训练准确率为 0.852
第190步, 一个minibatch上的损失为 2074.0142, 训练准确率为 0.812
第200步, 一个minibatch上的损失为 1209.2721, 训练准确率为 0.86

### 版权归 © 稀牛学院 所有 保留所有权利
![](./graphs/xiniu_neteasy.png)