## 多层LSTM连接示意图：
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/1025d061111540aea599b13f4afcb3dc43646758e0054fe28eb8fff52456031d" width=500></center>

## 单层LSTM的动态实现：
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/86cdfa2128c8400da4b09af94f6db4b70aeaaf3f01f14c0b9bd59fb5501d83d5" width=500></center>

![](https://ai-studio-static-online.cdn.bcebos.com/5d26984cabd24767a0249c02435397495e85e34d33b74862a5a0e81029fc2e55)


## 输入门、遗忘门、输出门：
<center><img src="https://ai-studio-static-online.cdn.bcebos.com/e5cb1ec719e94098b23bf20d7ce3af3bf27d163bff9146df8a64d624410cc822" width=300></center>

In [2]:
import paddle

# 输入数据向量维数6, 隐藏层维度8, 2个LSTM层串联(如果是1，可以省略，默认为1)
rnn = paddle.nn.LSTM(input_size=6, hidden_size=8, num_layers=2)

# batch_size=4, 序列长度seq_len=3, 输入数据向量维数=6
x = paddle.randn((4, 3, 6))
print('x',x)

# 初始化的隐藏层（prev_h）和记忆单元（prev_c）,通常它们的维度是一样的
# prev_h = paddle.randn((2, 4, 8)) # 2个LSTM层，batch_size=4,隐藏元维度8
# prev_c = paddle.randn((2, 4, 8)) # 2个LSTM层，batch_size=4,隐藏元维度8
# 输入数据向量维数、隐藏层维度、网路层数、序列长度确定后，prev_h和prev_c的维度已经固定，所以以上两行不需要亦可

# y, (h, c) = rnn(x, (prev_h, prev_c))
y, (h, c) = rnn(x) 
print(rnn)

# y/h/c表示的都是最后的输出，但输出不同

# y是最后一层lstm的每个词向量对应隐藏层的输出，h,c是所有层最后一个隐藏层和记忆元的输出

print('y',y)
print(y.shape)  # [4, 3, 8] # 这里有2层lstm，其与层数无关，只与序列长度相关（y是其实是句子的向量化表示）

print('h',h)
print(h.shape)  # [2, 4, 8]
# 注意最后的大结论：对于batch中的每一个句子，最后一层lstm网络的h向量结果，和y(也就是output)最后一个时间节点（或单词）的输出，是一样的。
print('c',c)
print(c.shape)  # [2, 4, 8]

paddle.summary(rnn,(4, 3, 6))
# 该网络中，共有1088个参数，计算过程如下：
# 2*4（14*8+3*8)=1088，其中：

#  2表示：2层网络
#  4表示：batch_size为4，也就是有一次计算4个句子

#  8表示：h的维度
# 14表示：8+6，h的维度（8）和单词维度(6)之和
#  3表示：单词（或者时间t）的个数
# 14*8表示：参数w 
#  3*8表示：4个单词

x Tensor(shape=[4, 3, 6], dtype=float32, place=CPUPlace, stop_gradient=True,
       [[[-0.39994577, -0.16884394, -1.09118211,  0.80282438,  0.77592939,  1.98887908],
         [-1.37776613, -0.50116003, -1.59069943, -0.92857558, -0.32358357,  0.40606323],
         [ 0.51607883, -0.90631920, -2.49934697,  0.52673978,  0.35466543, -1.23233390]],

        [[-0.35236493, -0.80131197,  0.41734406,  0.70300984,  2.56589055, -0.57770211],
         [ 0.52168477, -1.14594662,  0.89456636,  0.60237592, -0.64571965, -0.92338151],
         [-0.89197439,  2.07416654,  0.09576637,  0.51839197, -0.35192293, -0.34265402]],

        [[-1.20565021, -0.13362758, -1.21440089,  0.36546969,  0.29902026,  1.14574087],
         [ 0.16499370, -1.05054629,  0.60000432, -0.73830217,  1.45883906,  0.80631649],
         [ 0.90025264, -0.88333410,  1.86590922,  0.94177932,  0.25186336,  0.73045748]],

        [[ 0.59448457,  0.20400517,  0.10334436,  0.64043117,  1.15682471,  0.09200878],
         [-0.67695278,  0.5

{'total_params': 1088, 'trainable_params': 1088}