## 序列到序列学习（seq2seq）

使用循环神经网络编码器和循环神经网络解码器的序列到序列学习

![seq2seq.svg](https://zh.d2l.ai/_images/seq2seq.svg)

In [1]:
import sys
sys.path.append('..')
import collections
import math
import torch
from torch import nn
import d2l

In [None]:
class Seq3SeqEncoder(d2l.Encoder):
  '''用于序列到序列学习的循环神经网络编码器'''
  def __init__(self, vocab_size, embed_size, num_hiddens, num_layers, dropout=0):
    super().__init__()
    # 嵌入层
    self.embedding = nn.Embedding(vocab_size, embed_size)
    self.rnn = nn.GRU(embed_size, num_hiddens, num_layers, dropout=dropout)

  def forward(self, X):
    # 输出'X'的形状：(batch_size,num_steps,embed_size)
    X = self.embedding(X)
    # 在循环神经网络模型中，第一个轴对应于时间步
    X = X.permute(1, 0, 2)
    # 如果未提及状态，则默认为0
    output, state = self.rnn(X)
    # output的形状:(num_steps,batch_size,num_hiddens)
    # state的形状:(num_layers,batch_size,num_hiddens)
    return output, state