In [1]:
import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

nn.Flatten() 是 PyTorch 中的展平层，它将输入的多维张量（如图像的高、宽、通道等）展平为一维向量。

这个操作是必要的，因为全连接（nn.Linear）期望输入是一维的向量。

函数 init_weights 用于对模型中的权重进行初始化。

它检查每个模块 m 是否是 nn.Linear 层。如果是，它使用 nn.init.normal_ 方法将线性层的权重初始化为一个从均值为 0，标准差为 0.01 的正态分布中随机抽取的值。

In [2]:
# PyTorch不会隐式地调整输入的形状。因此，
# 我们在线性层前定义了展平层（flatten），来调整网络输入的形状
net = nn.Sequential(nn.Flatten(), nn.Linear(784, 10))

def init_weights(m):
    if type(m) == nn.Linear:
        nn.init.normal_(m.weight, std=0.01)

net.apply(init_weights);

In [3]:
loss = nn.CrossEntropyLoss(reduction='none')

In [4]:
trainer = torch.optim.SGD(net.parameters(), lr=0.1)

In [5]:
num_epochs = 10
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, trainer)