Recurrent-Neural-Network

人工神经网络和卷积神经网络的前提假设是元素之间是相互独立的，输入和输出也是相互独立的。但在现实世界中，很多元素都是相互连接的，比如，我出生在中国，从小在这里长大，所以我能说一口流利的(___)。这里填空，都知道填“中文”，是因为能够根据上下文的内容进行推断，所以就出现了循环神经网络，循环神经网络的本质是像人一样拥有记忆能力，它的输出依赖于当前的输入和记忆。

循环神经网络（Recurrent Neural Network，RNN）是一种序列模型，用来处理序列化数据（比如，语音、文本、视频等等），它的应用场景比较多，比如，语音识别、文本分类、机器翻译以及分词标注等等。RNN不能处理比较长的序列，会出现梯度消失问题，它本质上是一个BP网络，但与BP网络的区别是BP网络没有反馈回路，而RNN有反馈回路，它可以记住上一次的输出，两者都存在梯度消失现象。

传统RNN虽然被设计成可以处理整个时间序列信息，但其记忆最深的还是最后输入的一些信号，而更早之前的信号的强度则越来越低，最后只能起到一点辅助作用，甚至不起作用。长程依赖是传统RNN的致命伤，LSTM被设计出来很好的解决了长程依赖问题，不需要特别复杂的调试参数，默认记住长期信息。

长短期记忆（Long Short Term Memory，LSTM）是一种特殊的RNN，主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题，简单来说，LSTM能够在更长的序列中有更好的表现。

LSTM内部结构的三个门：

1、忘记门：忘记门，决定哪些信息需要从细胞状态中被忘记，对上一个节点传进来的输入进行选择性忘记。

2、输入门：输入门，确定哪些信息能够被存放到细胞状态中。

3、输出门：输出门，确定输出什么值，用来控制该层的细胞状态有多少被过滤。

双向RNN（Bidirectional Recurrent Neural Networks，Bi-RNN）的主要目的是增加RNN可利用的信息，它可以同时使用时序数据中某个输入的历史及未来数据，将时序方向相反的两个循环神经网络连接到同一个输出，通过这种结构，输出层就可以同时获取历史和未来的信息，也就是说，Bi-RNN由两个普通的RNN所组成，一个正向的RNN，利用过去的信息，一个逆向的RNN，利用未来的信息，这样在t时刻，既能够使用t-1时刻的信息，右可以使用t+1时刻的信息。一般来说，由于双向RNN能够同时利用过去时刻的信息和未来时刻的信息，会比单向RNN最终的预测更加准确。

门控循环单元（Gated Recurrent Unit，GRU）是循环神经网络的一种，和LSTM一样，都是为了解决长期记忆和反向传播中的梯度等问题而设计出来的。相比LSTM，GRU的结构更加简单，比LSTM少了一个门，只有重置门和更新门，因此计算效率更高，同时占用的内存也相对较少。在实际使用中，LSTM和GRU的差异不大，一般最后的准确率等指标都近似，但相对来说，GRU达到收敛状态时所需的迭代次数少，训练速度快。

详细描述：https://blog.csdn.net/weixin_44766179/article/details/90512700

接下来用双向LSTM实现IMDB分类，分类准确率为99.84%。

数据来源：https://www.kaggle.com/c/digit-recognizer/data

数据下载地址：https://pan.baidu.com/s/1EYoqAcW238saKy3uQCfC3w

提取码：ilze

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
README.md		README.md
RNN.docx		RNN.docx
imdb.py		imdb.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Recurrent-Neural-Network

About

Releases

Packages

Languages

LeungFe/Recurrent-Neural-Network

Folders and files

Latest commit

History

Repository files navigation

Recurrent-Neural-Network

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages