In [1]:
import torch
import torch.nn as nn

# 延后初始化
延后初始化表示一开始不需要确定网络架构中的具体参数(比如输入维度、输出维度等特征), 这里可以使用框架的延后初始化, 也就是直到数据第一次通过模型传递的时候, 框架才会动态推断出每层大小

比如对于卷积神经网络, 由于输入维度将影响每一个后续层的维度, 这样可以在编写代码的时候不需要直到维度就可以设置参数了, 可以简化定理定义和修改模型的任务

## 实例化网络
在 `PyTorch` 中可以使用 `nn.LazyLinear` 来表示懒加载的线性层

In [2]:
net = nn.Sequential(nn.LazyLinear(256), nn.ReLU(), nn.LazyLinear(10))
net

Sequential(
  (0): LazyLinear(in_features=0, out_features=256, bias=True)
  (1): ReLU()
  (2): LazyLinear(in_features=0, out_features=10, bias=True)
)

In [3]:
X = torch.rand(2, 20)
net(X)

tensor([[ 0.1981, -0.1407, -0.0044,  0.1263,  0.1106, -0.0069, -0.2742, -0.0275,
          0.0444,  0.1432],
        [ 0.0979, -0.2063,  0.0053,  0.1125,  0.2722, -0.0110, -0.3106, -0.0310,
          0.0548,  0.0484]], grad_fn=<AddmmBackward0>)

In [4]:
net

Sequential(
  (0): Linear(in_features=20, out_features=256, bias=True)
  (1): ReLU()
  (2): Linear(in_features=256, out_features=10, bias=True)
)