In [None]:
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l


# softmax 线性回归的简明实现
class SoftmaxRegression(d2l.Classifier):  #@save
    """The softmax regression model."""

    def __init__(self, num_outputs, lr):
        super().__init__()
        self.save_hyperparameters()
        self.net = nn.Sequential(nn.Flatten(), nn.LazyLinear(num_outputs))
        # nn.Sequential 是 PyTorch 中用于顺序构建神经网络的容器。它允许我们将多个层按照定义的顺序连接起来。
        # nn.Sequential 的工作原理是：将传入的多个层按顺序“串联”在一起，每一层的输出会自动成为下一层的输入。
        # Flatten 默认从第 2 个维度开始展平，而保持第 1 个维度不变。
        # LazyLinear 是一个延迟初始化的全连接层，它会在第一次前向传播时自动确定输入的特征数。

    def forward(self, X):
        return self.net(X) # 这个参数的传递有点离谱


@d2l.add_to_class(d2l.Classifier)  #@save
def loss(self, Y_hat, Y, averaged=True):
    Y_hat = Y_hat.reshape((-1, Y_hat.shape[-1]))
    Y = Y.reshape((-1,))
    return F.cross_entropy(
        Y_hat, Y, reduction='mean' if averaged else 'none')


data = d2l.FashionMNIST(batch_size=256)
model = SoftmaxRegression(num_outputs=10, lr=0.1)
trainer = d2l.Trainer(max_epochs=10)
trainer.fit(model, data)

