# 编码器-解码器架构

第一个组件是一个编码器（encoder）： 它接受一个长度可变的序列作为输入， 并将其转换为具有固定形状的编码状态。 第二个组件是解码器（decoder）： 它将固定形状的编码状态映射到长度可变的序列。

<div style="text-align:center">
        <img src="https://zh.d2l.ai/_images/encoder-decoder.svg" width="400">
</div>


## 编码器

In [2]:
from torch import nn


#@save
class Encoder(nn.Module):
    """编码器-解码器架构的基本编码器接口"""
    def __init__(self, **kwargs):
        super(Encoder, self).__init__(**kwargs)

    def forward(self, X, *args):
        raise NotImplementedError  # 该方法需要在子类中实现

## 解码器

其中`init_state()`函数就是初始化隐藏状态，也就是最上面的图中，编码器的输出。

In [3]:
#@save
class Decoder(nn.Module):
    """编码器-解码器架构的基本解码器接口"""
    def __init__(self, **kwargs):
        super(Decoder, self).__init__(**kwargs)

    def init_state(self, enc_outputs, *args):
        raise NotImplementedError

    def forward(self, X, state):
        raise NotImplementedError

## 编码器-解码器结构

In [5]:
#@save
class EncoderDecoder(nn.Module):
    """编码器-解码器架构的基类"""
    def __init__(self, encoder, decoder, **kwargs):
        super(EncoderDecoder, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder

    def forward(self, enc_X, dec_X, *args):
        enc_outputs = self.encoder(enc_X, *args)  # 首先调用编码器，获得解码器的输出
        dec_state = self.decoder.init_state(enc_outputs, *args)  # 使用编码器的输出来初始化解码器的隐藏状态
        return self.decoder(dec_X, dec_state) # 最后返回解码器的输出