In [1]:
import torch
from torch import nn

# 自定块
class MLP(nn.Module):  # 定义一个多层感知机（Multilayer Perceptron）类
    def __init__(self):
        super().__init__()  # 调用父类构造函数，初始化
        self.hidden = nn.Linear(20, 256)  # 定义第一层：线性层，输入维度20，输出256
        self.out = nn.Linear(256, 10)     # 定义第二层：输出层，输入256，输出10个类别

    def forward(self, X):
        return self.out(torch.relu(self.hidden(X)))  # 前向传播：先经过ReLU，再输出

In [2]:
net = MLP()
X = torch.randn(2, 20)  # 创建一个（2行20列）的输入张量，模拟两个样本
print(net(X))           # 执行前向传播，输出结果

tensor([[ 0.2443,  0.3379, -0.3798,  0.3152,  0.1565, -0.3367, -0.1173, -0.3151,
          0.0146, -0.2164],
        [ 0.2952,  0.0626, -0.0838, -0.1381,  0.1574,  0.1561,  0.0779, -0.0725,
         -0.2642, -0.0465]], grad_fn=<AddmmBackward0>)


In [3]:
# 顺序块
net = nn.Sequential(
    nn.Linear(20, 256),  # 第一层：输入维度20，输出256
    nn.ReLU(),           # 激活函数
    nn.Linear(256, 10)   # 第二层：输入256，输出10
)

In [4]:
X = torch.randn(2, 20)  # 两个样本，每个样本20个特征
print(net(X))           # 执行前向传播

tensor([[ 0.1706,  0.2145, -0.2283,  0.3769,  0.3822,  0.0998,  0.0268,  0.0599,
         -0.2796, -0.0905],
        [ 0.1335, -0.0429,  0.1089,  0.3262, -0.1259, -0.1037,  0.3077,  0.3698,
         -0.3458,  0.3862]], grad_fn=<AddmmBackward0>)


In [5]:
# 在向前传播函数中执行代码
class FancyMLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.rand_weight = torch.rand((20, 20), requires_grad=False)  # 随机权重（不可训练）
        self.linear = nn.Linear(20, 20)

    def forward(self, X):
        X = self.linear(X)
        X = torch.relu(X @ self.rand_weight + 1)  # 手写矩阵乘法（@），加偏置1
        X = self.linear(X)

        while X.norm() > 1:  # 如果L2范数大于1，就不断除以2
            X /= 2
        if X.norm() < 0.8:   # 如果L2范数小于0.8，就加10
            X *= 10
        return X.sum()       # 输出最终结果

In [6]:
net = FancyMLP()
X = torch.randn(2, 20)
print(net(X))

tensor(0.7568, grad_fn=<SumBackward0>)
