# RNN的output和state

In [1]:
import tensorflow as tf

tf.__version__

'2.0.0'

## 伪造输入张量

In [3]:
seq = tf.constant([1,2,3,4,5,6,7,8], shape=(2,4))
embedding = tf.keras.layers.Embedding(10,16)

inp = embedding(seq)

inp.shape

TensorShape([2, 4, 16])

## return_sequences=False, return_state=False

因为`return_sequences=False`和`return_state=False`，所以`LSTM`返回的只有最后一个timestep的输出，即`output`。

In [9]:
enc = tf.keras.layers.LSTM(16)

output = enc(inp)

print(output.shape)

(2, 16)


## return_sequences=True, return_state=False

因为`return_sequences=True`，所以会输出每一个timestep的`output`。因此，这里的`output`张量比上面增加了一个维度，`shape:(batch_size, time_steps, units)`

In [8]:
enc2 = tf.keras.layers.LSTM(16, return_sequences=True, return_state=False)

output = enc2(inp)

print(output.shape)


(2, 4, 16)


## return_sequences=False, return_state=True

因为`return_state=True`，所以LSTM会返回最后一个timestep的`state`，实际上`RNN`的`state`分为两个`state_h`和`state_c`。所以：


In [10]:
enc3 = tf.keras.layers.LSTM(16, return_sequences=False, return_state=True)

output, state_h, state_c = enc3(inp)

print(output.shape)
print(state_h.shape)
print(state_c.shape)

(2, 16)
(2, 16)
(2, 16)


## return_sequences=True, return_state=True

因为`return_sequences=True`并且`return_state=True`，所以LSTM会返回每个timestep的输出组成的`output`，以及最后一个timestep的`state`（分为`state_h`和`state_c`两个)。

In [11]:
enc4 = tf.keras.layers.LSTM(16, return_sequences=True, return_state=True)

output, state_h, state_c = enc4(inp)

print(output.shape)
print(state_h.shape)
print(state_c.shape)

(2, 4, 16)
(2, 16)
(2, 16)


通过以上小实验我们可以得出以下结论：

* RNN的输出，可以通过`return_sequences`和`return_state`两个参数控制
* `return_sequences=True`说明返回每一个timestep的输出，组成最终的`output`，`shape: (batch_size, time_steps, units)`
* `return_sequences=False`说明返回最后一个timestep的输出，组成最终的`output`，`shape: (batch_size, units)`
* `return_state=True`说明返回最后一个timestep的状态，组成最终的`state`
* `return_state=False`说明不返回最后一个timestep的状态，LSTM的输出仅仅有`output`


还有一个trick可以帮助理解：

* `return_sequences`用了`sequence`的复数表示`sequences`，说明返回的是一个序列的输出，组成最后的`output`
* `return_state`没用`state`的复数表示`states`，说明仅仅返回最后一个timestep的状态，组成最后的`state`