In [1]:
import torch
from torch import nn

# Module类

这里重载了Module类的__init__函数和forward函数。
它们分别用于创建模型参数和定义前向计算

In [3]:
class MLP(nn.Module):
    def __init__(self,**kwargs):
        super(MLP,self).__init__(**kwargs)
        self.hidden = nn.Linear(784,256)
        self.act = nn.ReLU()
        self.output = nn.Linear(256,10)
        
    def forward(self,x):
        a = self.act(self.hidden(x))
        return self.output(a)

MLP类中无需定义backward，系统通过autograd自动生成。

In [8]:
# 实例化
X = torch.rand(2,784)
net = MLP()
print(net)
print(X)
print(net(X))

MLP(
  (hidden): Linear(in_features=784, out_features=256, bias=True)
  (act): ReLU()
  (output): Linear(in_features=256, out_features=10, bias=True)
)
tensor([[0.3606, 0.1625, 0.5198,  ..., 0.1402, 0.0229, 0.1755],
        [0.8274, 0.3224, 0.3918,  ..., 0.4560, 0.2947, 0.1576]])
tensor([[ 0.1872, -0.0285, -0.0048,  0.1915, -0.0012,  0.2103,  0.0831, -0.1248,
          0.0165, -0.1123],
        [ 0.2310,  0.1230, -0.0301, -0.0125,  0.0896,  0.0670,  0.0664,  0.0432,
         -0.0810,  0.1020]], grad_fn=<AddmmBackward>)


# Module的子类
Sequential、
ModuleList、
ModuleDict、
等


## Sequential类
它可以接收一个子模块的有序字典（OrderedDict）或者一系列子模块作为参数来逐一添加Module的实例，
而模型的前向计算就是将这些实例按添加的顺序逐一计算。

In [10]:
class MySequential(nn.Module):
    from collections import OrderedDict
    def __init__(self,*args):
        super(MySequential,self).__init__()
        # 如果传入的是一个OrderedDict
        if len(args) == 1 and isinstance(args[0], OrderedDict):
            for key,module in args[0].items():
                self.add_module(key,module) ## add_module方法会将module添加进self._modules(一个OrderedDict)
        else: # 传入的是一些Module
            for idx,module in enumerate(args):
                self.add_module(str(idx), module)
    
    def forward(self,input):
        # self._modules返回一个 OrderedDict，保证会按照成员添加时的顺序遍历成员
        for module in self._modules.values():
            input = module(input)
        return input

In [13]:
net = MySequential(
    nn.Linear(784,256),
    nn.ReLU(),
    nn.Linear(256,10),
)
print(net)
print(net(X))

MySequential(
  (0): Linear(in_features=784, out_features=256, bias=True)
  (1): ReLU()
  (2): Linear(in_features=256, out_features=10, bias=True)
)
tensor([[ 0.2821, -0.1592,  0.0299, -0.1609,  0.0183,  0.0142, -0.0844,  0.0586,
         -0.1750, -0.0607],
        [ 0.2305, -0.0590,  0.0634, -0.2694,  0.0774,  0.2081, -0.1154, -0.0249,
         -0.1559, -0.0275]], grad_fn=<AddmmBackward>)


## ModuleList类
ModuleList接收一个子模块的列表作为初始化参数，
最主要的特点是可以类似List那样进行**append**和**extend**操作:

In [18]:
net = nn.ModuleList([nn.Linear(784, 256), nn.ReLU()])
net.append(nn.Linear(256, 10)) # # 类似List的append操作
print(net[-1])  # 类似List的索引访问
print(net)


# ModuleList实例没有实现forward，会报NotImplementedError
net(torch.zeros(1, 784)) 


Linear(in_features=256, out_features=10, bias=True)
ModuleList(
  (0): Linear(in_features=784, out_features=256, bias=True)
  (1): ReLU()
  (2): Linear(in_features=256, out_features=10, bias=True)
)


**ModuleList的实际作用**
ModuleList实例仅仅是一个存储各种模块的列表，没有实现模块的**forward**功能需要自己实现。

ModuleList的出现只是让网络定义前向传播更加方便。（减少代码量）

In [30]:
# 官网的例子
class MyModule(nn.Module):
    def __init__(self):
        super(MyModule, self).__init__()
        self.linears = nn.ModuleList([nn.Linear(10, 10) for i in range(10)])

    def forward(self, x):
        # ModuleList can act as an iterable, or be indexed using ints
        for i, l in enumerate(self.linears):
            x = self.linears[i // 2](x) + l(x) # //表示整数除法
        return x


In [31]:
net = MyModule()
net(torch.zeros(1, 10))

tensor([[-1.2283,  0.5613, -0.5006, -0.9177, -0.1075,  0.0239,  0.1398,  0.5800,
         -0.1388,  0.2570]], grad_fn=<AddBackward0>)

**ModuleList的特点**
加入到ModuleList的所有模块的参数会自动添加到整个网络中

In [27]:
class Module_ModuleList(nn.Module):
    def __init__(self):
        super(Module_ModuleList, self).__init__()
        self.linears = nn.ModuleList([
            nn.Linear(10, 10),
        ])

class Module_List(nn.Module):
    def __init__(self):
        super(Module_List, self).__init__()
        self.linears = [nn.Linear(10, 10)]

net1 = Module_ModuleList()
net2 = Module_List()

print("net1:")
for p in net1.parameters():
    print(p.size())
    
print('\n')

print("net2:")
for p in net2.parameters():
    print(p)


net1:
torch.Size([10, 10])
torch.Size([10])


net2:


## ModuleDict
接受一个子模块的字典作为初始化参数。可以像字典那样访问子模块。

同样，ModuleDict类的实例也需要手动实现forward。

In [34]:
net = nn.ModuleDict({
    'linear': nn.Linear(784, 256),
    'act': nn.ReLU(),
})
net['output'] = nn.Linear(256, 10) # 添加
print(net['linear']) # 访问
print(net.output)
print(net)

# net是ModuleDict实例，因为没有实现forward因此进行前向传播会报错
net(torch.zeros(1, 784)) # 会报NotImplementedError


Linear(in_features=784, out_features=256, bias=True)
Linear(in_features=256, out_features=10, bias=True)
ModuleDict(
  (linear): Linear(in_features=784, out_features=256, bias=True)
  (act): ReLU()
  (output): Linear(in_features=256, out_features=10, bias=True)
)


In [44]:
# 实现net是ModuleDict实例的forward函数
class MyModuleDict(nn.Module):
    def __init__(self):
        super(MyModuleDict, self).__init__()
        self.nets = nn.ModuleDict({
                            'linear': nn.Linear(10, 10),
                            'act': nn.ReLU(),
                        })

    def forward(self, x):
        x = self.nets['linear'](x)
        o = self.nets['act'](x)
        return o

MyModuleDictNet = MyModuleDict()
print(MyModuleDictNet(torch.zeros(1, 10)))

tensor([[0.1168, 0.2491, 0.2643, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.1954,
         0.0000]], grad_fn=<ReluBackward0>)


# 构造复杂的模型

In [54]:
class FancyMLP(nn.Module):
    def __init__(self,**kwargs):
        super(FancyMLP,self).__init__(**kwargs)
        
        # 不可训练参数
        self.rand_weight = torch.rand((20,20), requires_grad=False)
        
        self.linear = nn.Linear(20,20)
        
    def forward(self,x):
        x = self.linear(x)
        
        # 使用创建的常数参数，以及nn.functional中的relu函数和mm函数
        x = nn.functional.relu(torch.mm(x,self.rand_weight.data) + 1)
        
        # 复用全连接层，等价于两个全连接层共享参数
        x = self.linear(x)
        
        # 控制流，这里我们需要调用item函数来返回标量进行比较
        while x.norm().item() > 1:
            x /=  2
        if x.norm().item() < 0.8:
            x *= 10
        return x.sum()
        
        

In [59]:
X = torch.ones(2,20)
net = FancyMLP()
print(net)
print(net(X))

FancyMLP(
  (linear): Linear(in_features=20, out_features=20, bias=True)
)
tensor(-0.4770, grad_fn=<SumBackward0>)


# 总结
1、与Sequential不同，ModuleList和ModuleDict并没有定义一个完整的网络，它们只是将不同的模块存放在一起，需要自己定义forward函数。

2、可以直接使用Sequential来构造模型，也可以选择继承Module来构造模型。后者可以构造出很复杂的模型。