# LSTM层的参数

LSTM的第1个参数memory units是指hidden state的维度，也是输出向量的维度。   

## stateful

[?]  
默认情况下，LSTM的memory每个mini-batch会reset一次。  
设置参数`stateful=True`以后就不会自动reset。由开发者手动reset。    
以下情况会需要用到这一功能：  
1. batch_size = 1  
2. 一个长序列分成了几个子序列  
3. 一个非常长的序列所以要考虑效率问题  

## go_backwords

定义LSTM的方向，默认为False（正向），设置为True则是反向。  

# LSTM作为输入层

LSTM层要求的输入数据是三维的，分别代表样本数、时间步数、特征数。   
对应的，LSTM层也要通过参数`input_shape`定义可以接受的输入数据的形状。input_shape的参数代表输入数据的时间步数和特征数。  
默认的activation是linear。LSTM的第1个参数是输出向量的维度。   

In [7]:
import numpy as np
import tensorflow as tf

data = np.array([1,2,3,4,5,6,7,8,9,10])
data = data.reshape(1, 10, 1)
tf.keras.layers.LSTM(5, input_shape=(10, 1))

<tensorflow.python.keras.layers.recurrent_v2.LSTM at 0x63f97b210>

In [8]:
import numpy as np

data = np.array([[1,2],[3,4],[5,6],[7,8],[9,10]])
data = data.reshape(1, 5, 2)
tf.keras.layers.LSTM(5, input_shape=(5, 1))

<tensorflow.python.keras.layers.recurrent_v2.LSTM at 0x64074c710>

# LSTM作为隐藏层

In [9]:
import tensorflow as tf

vocab_size = 10000
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(vocab_size, 64),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64)),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

# 两个连续的LSTM层

In [10]:
import tensorflow as tf

vocab_size = 10000
model = tf.keras.Sequential([
    tf.keras.layers.Embedding(vocab_size, 64),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64, return_sequences=True)),
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(32)),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

# 双向LSTM

In [11]:
import tensorflow as tf

vocab_size = 10000
model = tf.keras.Sequential([
    tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(64, return_sequences=True)),
])