![](./graphs/dl_banner.jpg)

# 用tensorflow low level API构建循环神经网络
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

## 0.知识背景：循环神经网络
循环神经网络或RNN是一类用于处理序列数据的神经网络，典型的时间序列数据场景是文本，RNN在自然语言处理中发挥着很大的作用。循环神经网络会对序列的每个时间点数据处理，典型结构如下。
![RNN](http://colah.github.io/posts/2015-08-Understanding-LSTMs/img/RNN-unrolled.png)

循环神经网络中最常用到的两个变种结构为LSTM和GRU，它们在对数据计算的cell结构上做了一些调整，分别如下：
![LSTM](http://colah.github.io/posts/2015-08-Understanding-LSTMs/img/LSTM3-chain.png)
![GRU](http://colah.github.io/posts/2015-08-Understanding-LSTMs/img/LSTM3-var-GRU.png)

## 0.问题背景：MNIST 手写数字
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

这是一个非常经典的问题，我们的对象是手写数字图片，我们需要根据手写数字图片的输入，构建线性的分类器(softmax分类器)去区分图片是手写数字0-9中的哪一个。这个问题的数据集，每一张图片的表示是长宽为28的矩阵，我们有时候会把它展开成784维的向量。MNIST手写数据集长成下面这样。

![MNIST Dataset](http://neuralnetworksanddeeplearning.com/images/mnist_100_digits.png)

更多的信息可以参考: http://yann.lecun.com/exdb/mnist/

## 1.引入工具库

In [1]:
from __future__ import division, print_function, absolute_import
import tensorflow as tf
from tensorflow.contrib import rnn
import matplotlib.pyplot as plt
import numpy as np
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.3
session = tf.Session(config=config)

import warnings
warnings.filterwarnings('ignore')

## 2.设定超参数
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [2]:
# 训练超参数
learning_rate = 0.001
training_steps = 10000
batch_size = 128
display_step = 10

# 神经网络超参数
num_input = 28 # MNIST数据输入(数据形状: 28*28)，一个时间点上输入28个值
timesteps = 28 # 总共会有28个timestep
num_hidden = 128 # 神经元个数
num_classes = 10 # MNIST总共类别(0-9总共10个手写数字)


# 占位符
X = tf.placeholder("float", [None, timesteps, num_input])
Y = tf.placeholder("float", [None, num_classes])

# 变量
weights = {
    'out': tf.Variable(tf.random_normal([num_hidden, num_classes]))
}
biases = {
    'out': tf.Variable(tf.random_normal([num_classes]))
}

## 3.准备数据

In [3]:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/data/Deep_learning/MNIST_data", one_hot=True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /data/MNIST_data/train-images-idx3-ubyte.gz
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /data/MNIST_data/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Extracting /data/MNIST_data/t10k-images-idx3-ubyte.gz
Extracting /data/MNIST_data/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.


## 4.构建模型
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [5]:
def RNN(x, weights, biases):

    # RNN是时间序列型网络结构，我们需要按照它的形式去组织数据
    # 我们把数据组织成这样的形式: (batch_size, timesteps, n_input)
    # 也就是说一批样本batch_size个样本，总共会以timesteps个长度为n_input的向量形式送入

    # 为了得到timesteps个(batch_size, n_input)形态的输入
    x = tf.unstack(x, timesteps, 1)

    # 定义RNN中单个cell的格式
    lstm_cell = rnn.BasicLSTMCell(num_hidden, forget_bias=1.0)

    # 用cell串成LSTM网络
    outputs, states = rnn.static_rnn(lstm_cell, x, dtype=tf.float32)

    # 结果要通过全连接层
    return tf.matmul(outputs[-1], weights['out']) + biases['out']

## 5.计算损失与优化
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [6]:
# 构建RNN网络进行预估
logits = RNN(X, weights, biases)
prediction = tf.nn.softmax(logits)

# 定义损失计算方法与优化器
loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(
    logits=logits, labels=Y))
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
train_op = optimizer.minimize(loss_op)

# 评估模型
correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# 初始化变量
init = tf.global_variables_initializer()

Instructions for updating:
This class is deprecated, please use tf.nn.rnn_cell.LSTMCell, which supports all the feature this cell currently has. Please replace the existing code with tf.nn.rnn_cell.LSTMCell(name='basic_lstm_cell').
Instructions for updating:

Future major versions of TensorFlow will allow gradients to flow
into the labels input on backprop by default.

See `tf.nn.softmax_cross_entropy_with_logits_v2`.



## 6.在session当中完成计算图计算(损失计算与优化、参数更新迭代)
#### \[稀牛学院 x 网易云课程\]《深度学习工程师(实战)》课程资料 by [@寒小阳](https://blog.csdn.net/han_xiaoyang)

In [7]:
# 在session当中开始训练
with tf.Session() as sess:

    # 初始化
    sess.run(init)

    for step in range(1, training_steps+1):
        batch_x, batch_y = mnist.train.next_batch(batch_size)
        batch_x = batch_x.reshape((batch_size, timesteps, num_input))
        # 优化
        sess.run(train_op, feed_dict={X: batch_x, Y: batch_y})
        if step % display_step == 0 or step == 1:
            # 计算准确率
            loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x,
                                                                 Y: batch_y})
            print("第" + str(step) + "步, 一个minibatch上的损失为 " + \
                  "{:.4f}".format(loss) + ", 训练准确率为 " + \
                  "{:.3f}".format(acc))

    print("完成训练！")

    # 计算准确率
    test_len = 128
    test_data = mnist.test.images[:test_len].reshape((-1, timesteps, num_input))
    test_label = mnist.test.labels[:test_len]
    print("测试准确率为 ", \
        sess.run(accuracy, feed_dict={X: test_data, Y: test_label}))

第1步, 一个minibatch上的损失为 2.6086, 训练准确率为 0.148
第10步, 一个minibatch上的损失为 2.5286, 训练准确率为 0.148
第20步, 一个minibatch上的损失为 2.4149, 训练准确率为 0.125
第30步, 一个minibatch上的损失为 2.4308, 训练准确率为 0.086
第40步, 一个minibatch上的损失为 2.4484, 训练准确率为 0.094
第50步, 一个minibatch上的损失为 2.3739, 训练准确率为 0.180
第60步, 一个minibatch上的损失为 2.2896, 训练准确率为 0.188
第70步, 一个minibatch上的损失为 2.1766, 训练准确率为 0.156
第80步, 一个minibatch上的损失为 2.1287, 训练准确率为 0.227
第90步, 一个minibatch上的损失为 2.1242, 训练准确率为 0.242
第100步, 一个minibatch上的损失为 2.2296, 训练准确率为 0.203
第110步, 一个minibatch上的损失为 2.1624, 训练准确率为 0.219
第120步, 一个minibatch上的损失为 2.1047, 训练准确率为 0.234
第130步, 一个minibatch上的损失为 2.1500, 训练准确率为 0.180
第140步, 一个minibatch上的损失为 2.0473, 训练准确率为 0.312
第150步, 一个minibatch上的损失为 2.1077, 训练准确率为 0.250
第160步, 一个minibatch上的损失为 2.0972, 训练准确率为 0.258
第170步, 一个minibatch上的损失为 2.0921, 训练准确率为 0.281
第180步, 一个minibatch上的损失为 2.0098, 训练准确率为 0.289
第190步, 一个minibatch上的损失为 1.9757, 训练准确率为 0.375
第200步, 一个minibatch上的损失为 2.0780, 训练准确率为 0.266
第210步, 一个minibatch上的损失为 2.0266, 训练准确率为 0.320
第220步, 一个minibatch上的损

第1810步, 一个minibatch上的损失为 1.3487, 训练准确率为 0.562
第1820步, 一个minibatch上的损失为 1.3043, 训练准确率为 0.609
第1830步, 一个minibatch上的损失为 1.4180, 训练准确率为 0.523
第1840步, 一个minibatch上的损失为 1.3675, 训练准确率为 0.555
第1850步, 一个minibatch上的损失为 1.3210, 训练准确率为 0.570
第1860步, 一个minibatch上的损失为 1.4378, 训练准确率为 0.539
第1870步, 一个minibatch上的损失为 1.4135, 训练准确率为 0.555
第1880步, 一个minibatch上的损失为 1.2750, 训练准确率为 0.617
第1890步, 一个minibatch上的损失为 1.1753, 训练准确率为 0.633
第1900步, 一个minibatch上的损失为 1.2817, 训练准确率为 0.617
第1910步, 一个minibatch上的损失为 1.3972, 训练准确率为 0.547
第1920步, 一个minibatch上的损失为 1.2829, 训练准确率为 0.594
第1930步, 一个minibatch上的损失为 1.3580, 训练准确率为 0.609
第1940步, 一个minibatch上的损失为 1.2240, 训练准确率为 0.633
第1950步, 一个minibatch上的损失为 1.3303, 训练准确率为 0.594
第1960步, 一个minibatch上的损失为 1.2059, 训练准确率为 0.703
第1970步, 一个minibatch上的损失为 1.2798, 训练准确率为 0.594
第1980步, 一个minibatch上的损失为 1.2980, 训练准确率为 0.609
第1990步, 一个minibatch上的损失为 1.2664, 训练准确率为 0.609
第2000步, 一个minibatch上的损失为 1.2162, 训练准确率为 0.625
第2010步, 一个minibatch上的损失为 1.3837, 训练准确率为 0.594
第2020步, 一个minibatch上的损失为 1.2318, 训

第3610步, 一个minibatch上的损失为 1.0545, 训练准确率为 0.711
第3620步, 一个minibatch上的损失为 0.9528, 训练准确率为 0.742
第3630步, 一个minibatch上的损失为 0.8894, 训练准确率为 0.742
第3640步, 一个minibatch上的损失为 0.8550, 训练准确率为 0.773
第3650步, 一个minibatch上的损失为 1.0548, 训练准确率为 0.680
第3660步, 一个minibatch上的损失为 0.8923, 训练准确率为 0.734
第3670步, 一个minibatch上的损失为 1.0205, 训练准确率为 0.695
第3680步, 一个minibatch上的损失为 0.9809, 训练准确率为 0.703
第3690步, 一个minibatch上的损失为 0.9454, 训练准确率为 0.703
第3700步, 一个minibatch上的损失为 0.9158, 训练准确率为 0.727
第3710步, 一个minibatch上的损失为 0.9742, 训练准确率为 0.703
第3720步, 一个minibatch上的损失为 0.8583, 训练准确率为 0.797
第3730步, 一个minibatch上的损失为 0.9263, 训练准确率为 0.711
第3740步, 一个minibatch上的损失为 0.9304, 训练准确率为 0.766
第3750步, 一个minibatch上的损失为 1.0957, 训练准确率为 0.609
第3760步, 一个minibatch上的损失为 1.0726, 训练准确率为 0.695
第3770步, 一个minibatch上的损失为 1.0752, 训练准确率为 0.664
第3780步, 一个minibatch上的损失为 1.1146, 训练准确率为 0.648
第3790步, 一个minibatch上的损失为 1.1250, 训练准确率为 0.664
第3800步, 一个minibatch上的损失为 0.9472, 训练准确率为 0.656
第3810步, 一个minibatch上的损失为 1.0464, 训练准确率为 0.672
第3820步, 一个minibatch上的损失为 0.9418, 训

第5400步, 一个minibatch上的损失为 0.6952, 训练准确率为 0.789
第5410步, 一个minibatch上的损失为 0.6639, 训练准确率为 0.820
第5420步, 一个minibatch上的损失为 0.8710, 训练准确率为 0.758
第5430步, 一个minibatch上的损失为 0.5752, 训练准确率为 0.820
第5440步, 一个minibatch上的损失为 0.7341, 训练准确率为 0.719
第5450步, 一个minibatch上的损失为 0.7805, 训练准确率为 0.766
第5460步, 一个minibatch上的损失为 0.7136, 训练准确率为 0.797
第5470步, 一个minibatch上的损失为 0.8435, 训练准确率为 0.719
第5480步, 一个minibatch上的损失为 0.8736, 训练准确率为 0.734
第5490步, 一个minibatch上的损失为 0.7513, 训练准确率为 0.734
第5500步, 一个minibatch上的损失为 0.7646, 训练准确率为 0.766
第5510步, 一个minibatch上的损失为 0.7619, 训练准确率为 0.789
第5520步, 一个minibatch上的损失为 1.0168, 训练准确率为 0.672
第5530步, 一个minibatch上的损失为 0.6837, 训练准确率为 0.789
第5540步, 一个minibatch上的损失为 0.7040, 训练准确率为 0.742
第5550步, 一个minibatch上的损失为 0.7842, 训练准确率为 0.758
第5560步, 一个minibatch上的损失为 0.8769, 训练准确率为 0.727
第5570步, 一个minibatch上的损失为 0.7072, 训练准确率为 0.750
第5580步, 一个minibatch上的损失为 0.8746, 训练准确率为 0.766
第5590步, 一个minibatch上的损失为 0.6786, 训练准确率为 0.797
第5600步, 一个minibatch上的损失为 0.7343, 训练准确率为 0.781
第5610步, 一个minibatch上的损失为 0.8145, 训

第7210步, 一个minibatch上的损失为 0.6890, 训练准确率为 0.797
第7220步, 一个minibatch上的损失为 0.6499, 训练准确率为 0.773
第7230步, 一个minibatch上的损失为 0.4979, 训练准确率为 0.852
第7240步, 一个minibatch上的损失为 0.7060, 训练准确率为 0.758
第7250步, 一个minibatch上的损失为 0.5485, 训练准确率为 0.836
第7260步, 一个minibatch上的损失为 0.5841, 训练准确率为 0.828
第7270步, 一个minibatch上的损失为 0.7559, 训练准确率为 0.773
第7280步, 一个minibatch上的损失为 0.5636, 训练准确率为 0.828
第7290步, 一个minibatch上的损失为 0.5184, 训练准确率为 0.844
第7300步, 一个minibatch上的损失为 0.4388, 训练准确率为 0.883
第7310步, 一个minibatch上的损失为 0.5579, 训练准确率为 0.828
第7320步, 一个minibatch上的损失为 0.5356, 训练准确率为 0.812
第7330步, 一个minibatch上的损失为 0.5423, 训练准确率为 0.828
第7340步, 一个minibatch上的损失为 0.6405, 训练准确率为 0.812
第7350步, 一个minibatch上的损失为 0.5971, 训练准确率为 0.797
第7360步, 一个minibatch上的损失为 0.6840, 训练准确率为 0.766
第7370步, 一个minibatch上的损失为 0.7141, 训练准确率为 0.758
第7380步, 一个minibatch上的损失为 0.5998, 训练准确率为 0.812
第7390步, 一个minibatch上的损失为 0.5659, 训练准确率为 0.844
第7400步, 一个minibatch上的损失为 0.6662, 训练准确率为 0.789
第7410步, 一个minibatch上的损失为 0.5729, 训练准确率为 0.797
第7420步, 一个minibatch上的损失为 0.6331, 训

第9000步, 一个minibatch上的损失为 0.5810, 训练准确率为 0.836
第9010步, 一个minibatch上的损失为 0.5101, 训练准确率为 0.852
第9020步, 一个minibatch上的损失为 0.5685, 训练准确率为 0.820
第9030步, 一个minibatch上的损失为 0.5202, 训练准确率为 0.836
第9040步, 一个minibatch上的损失为 0.4262, 训练准确率为 0.891
第9050步, 一个minibatch上的损失为 0.6041, 训练准确率为 0.797
第9060步, 一个minibatch上的损失为 0.5025, 训练准确率为 0.859
第9070步, 一个minibatch上的损失为 0.4624, 训练准确率为 0.852
第9080步, 一个minibatch上的损失为 0.3781, 训练准确率为 0.875
第9090步, 一个minibatch上的损失为 0.5483, 训练准确率为 0.773
第9100步, 一个minibatch上的损失为 0.3789, 训练准确率为 0.898
第9110步, 一个minibatch上的损失为 0.5875, 训练准确率为 0.812
第9120步, 一个minibatch上的损失为 0.4706, 训练准确率为 0.812
第9130步, 一个minibatch上的损失为 0.5435, 训练准确率为 0.805
第9140步, 一个minibatch上的损失为 0.5130, 训练准确率为 0.883
第9150步, 一个minibatch上的损失为 0.4468, 训练准确率为 0.875
第9160步, 一个minibatch上的损失为 0.4343, 训练准确率为 0.875
第9170步, 一个minibatch上的损失为 0.4912, 训练准确率为 0.867
第9180步, 一个minibatch上的损失为 0.5020, 训练准确率为 0.844
第9190步, 一个minibatch上的损失为 0.5217, 训练准确率为 0.844
第9200步, 一个minibatch上的损失为 0.5243, 训练准确率为 0.859
第9210步, 一个minibatch上的损失为 0.4165, 训

### 版权归 © 稀牛学院 所有 保留所有权利
![](./graphs/xiniu_neteasy.png)