In [16]:
import numpy as np

class Affine(object):
    def __init__(self, W, b):
        self.W = W
        self.b = b

        self.x = None
        self.dW = None
        self.db = None

        self.original_x_shape = None
        # self.dx = None # 可以不设置，因为dx是直接返回的
    
    def forward(self, x): # x 传入的是二维数组(多个数据,或者单个数据reshape成二维)
        self.original_x_shape = x.shape # 如果传入的 x.shape 不是 [N,784] 的形式，而是 [N,1,28,28]的形式，先把shape备份下来再转换为[N,784]，之后反向传播输出dx时以 [N,1,28,28] 的形式输出
        x = x.reshape(x.shape[0],-1) # 如果 x.shape=[N,784]，则不变

        # 运行forward，输入的x会被类保留下来，后面反向传播求 dw=x.t*dout 用的到
        self.x = x  # 保留 self.x 用于 backward 计算 dw=x.T*dout
        
        out = np.dot(self.x, self.W) + self.b
        return out
    
    def backward(self, dout):
        # 虽然返回的是dx,但是dw和db会被类保留,dx=dout*W.T 中的W初始化就得到了，dw=x.T*dout 中的x在forward中传入
        self.dW = np.dot(self.x.T,dout) 
        self.db = np.sum(dout,axis=0)
        
        dx = np.dot(dout,self.W.T)
        # dx.shape 从 [N,784] 的形式还原成 [N,1,28,28]的形式
        dx = dx.reshape(self.original_x_shape)
        return dx