这节课，我们要来看大名鼎鼎的encoder-decoder结构到底是个啥
* 这是最近几年可能非常有影响力的对模型的抽象解释
* 其实encoder-decoder的思想用CNN可以很方便的解释
    * 还记得CNN里面我们提过，CNN前面的层都可以视为在做特征提取，最后我们做回归的输出
    * 那其实我们也可以认为，前面的CNN层我们都是在对信息进行重新编码，encoder
    * 这里的encoder的目的就是为了把原始信息处理成机器学习容易理解的形式
    * 而最后，我们再用decoder把机器学习理解的东西解码成人类能理解的，这其实也就是CNN里面最后的softmax回归层
* 上面的思想放在RNN里面其实也是一样的
* 这样所有的模型其实我们都可以用一种模块化的思想来构造
    * 输入进入encoder，转化成机器学习容易理解的state
    * 然后state直接进入decoder，或者再加入一些别的input，通过decoder来获得最后的output
    * 仔细想一想，每个模型其实都是遵照这种规则弄出来的

接下来我们看看，通过框架如何抽象的大致实现encoder-decoder架构

In [1]:
from torch import nn


#@save
# 其实可以发现没啥东西，NotImplementedError只是为了让你不运行
# 因为我们这里实现的只是一个基类，我们只定义一些最最基本的函数的架构，后面我们会继承这些基类来使用这些函数架构
class Encoder(nn.Module):
    """编码器-解码器架构的基本编码器接口"""
    def __init__(self, **kwargs):
        super(Encoder, self).__init__(**kwargs)

    def forward(self, X, *args):
        raise NotImplementedError

In [2]:
#@save
class Decoder(nn.Module):
    """编码器-解码器架构的基本解码器接口"""
    def __init__(self, **kwargs):
        super(Decoder, self).__init__(**kwargs)

    def init_state(self, enc_outputs, *args):
        raise NotImplementedError

    def forward(self, X, state):
        raise NotImplementedError

In [3]:
#@save
class EncoderDecoder(nn.Module):
    """编码器-解码器架构的基类"""
    def __init__(self, encoder, decoder, **kwargs):
        super(EncoderDecoder, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder

    def forward(self, enc_X, dec_X, *args):
        enc_outputs = self.encoder(enc_X, *args)
        dec_state = self.decoder.init_state(enc_outputs, *args)
        return self.decoder(dec_X, dec_state)

上面我们定义的是最简单的encoder-decoder的样本，基本框架就是这样的，后面的具体实现，其实就是看forward/init_state这两个函数里面的具体内容怎样设置了