In [1]:
import torch
import torch.nn as nn


class FeedForwardNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(FeedForwardNN, self).__init__()
        self.hidden = nn.Linear(input_size, hidden_size)
        self.relu = nn.ReLU()
        self.output = nn.Linear(hidden_size, output_size)

        # 输入张量的形状为（batch_size, input_size），其中batch_size是批次中的图像数量，input_size是输入特征的数量。
        # 在这个例子中，input_size是784，也就是28x28图像中的像素数。
        #
        # 输出张量的形状为（batch_size，output_size），其中batch_size是批次中的图像数量，output_size是输出类的数量。
        # 在这个例子中，output_size是10，也就是分类问题中的类的数量。

    def forward(self, x):
        x = self.hidden(x)
        x = self.relu(x)
        x = self.output(x)
        return x


input_size = 784  # Example input size for an image 28x28 pixels
hidden_size = 128
output_size = 10  # Example output size for 10 classes

model = FeedForwardNN(input_size, hidden_size, output_size)
print(model)

# 这个程序使用PyTorch定义了一个前馈神经网络。该神经网络有一个带有ReLU激活函数的隐藏层和一个输出层。输入大小为784，
# 这是28x28图像的像素数。隐蔽层有128个神经元，输出层有10个神经元，这就是分类问题中的类的数量。

# FeedForwardNN类继承自nn.Module类，它是PyTorch中所有神经网络模块的基类。__init__方法初始化了神经网络的各层。
# forward方法定义了神经网络的前向传递，它接收一个输入张量x并返回一个输出张量y。
#
# 隐蔽层是使用 nn.Linear 模块定义的，它对输入张量进行线性变换。隐层将ReLU激活函数逐元素地应用到隐层的输出上。
# 输出层是用另一个nn.Linear模块定义的，它对relu层的输出进行了线性变换。
#
# 该模型对象是FeedForwardNN类的一个实例，可以用来对输入数据进行预测。
#
# ${insert_selected_code}。
#
# 代码中没有明显的bug。然而，为了改进该模型，你可以考虑增加更多的隐藏层或使用不同的激活函数。


# 在选定的代码中，模型的参数没有被训练。model对象被简单地定义并打印到控制台。
# 为了训练模型的参数，你需要定义一个损失函数和一个优化器，然后使用一个训练循环，根据损失函数相对于参数的梯度来更新参数。
# 下面是一个例子，说明你如何使用交叉熵损失函数和随机梯度下降（SGD）优化器来训练model对象的参数。


import torch
import torch.nn as nn
import torch.optim as optim

# Define the loss function and optimizer
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# Define a batch of input data and target labels
batch_size = 32
input_size = 784
output_size = 10
x = torch.randn(batch_size, input_size)
y_true = torch.randint(low=0, high=output_size, size=(batch_size,))

# Train the model for one epoch
for i in range(100):
    # Zero the gradients
    optimizer.zero_grad()

    # Forward pass
    y_pred = model(x)

    # Compute the loss
    loss = criterion(y_pred, y_true)

    # Backward pass
    loss.backward()

    # Update the parameters
    optimizer.step()

    # Print the loss
    print(f"Epoch {i+1}: Loss = {loss.item():.4f}")


FeedForwardNN(
  (hidden): Linear(in_features=784, out_features=128, bias=True)
  (relu): ReLU()
  (output): Linear(in_features=128, out_features=10, bias=True)
)
Epoch 1: Loss = 2.3668
Epoch 2: Loss = 2.3243
Epoch 3: Loss = 2.2827
Epoch 4: Loss = 2.2420
Epoch 5: Loss = 2.2022
Epoch 6: Loss = 2.1631
Epoch 7: Loss = 2.1248
Epoch 8: Loss = 2.0871
Epoch 9: Loss = 2.0501
Epoch 10: Loss = 2.0141
Epoch 11: Loss = 1.9787
Epoch 12: Loss = 1.9441
Epoch 13: Loss = 1.9101
Epoch 14: Loss = 1.8769
Epoch 15: Loss = 1.8442
Epoch 16: Loss = 1.8120
Epoch 17: Loss = 1.7804
Epoch 18: Loss = 1.7493
Epoch 19: Loss = 1.7189
Epoch 20: Loss = 1.6889
Epoch 21: Loss = 1.6592
Epoch 22: Loss = 1.6299
Epoch 23: Loss = 1.6010
Epoch 24: Loss = 1.5726
Epoch 25: Loss = 1.5445
Epoch 26: Loss = 1.5167
Epoch 27: Loss = 1.4893
Epoch 28: Loss = 1.4622
Epoch 29: Loss = 1.4355
Epoch 30: Loss = 1.4091
Epoch 31: Loss = 1.3830
Epoch 32: Loss = 1.3573
Epoch 33: Loss = 1.3319
Epoch 34: Loss = 1.3069
Epoch 35: Loss = 1.2821
Epoch 