

神经网络模仿人类神经系统，神经元，神经元之间的介质传递。神经网络的关键概念：神经元（包含权重、偏置）、层（一层包含多个神经元， 除输入、输出层外，其他称为隐藏层）、激活函数、前向传播、反向传播、epoch（一个前向、反向传播过程）、损失函数（计算一次正向传播与目标值之间的损失值，损失值越大表示差别越大）、优化器（一种降低损失函数结果的优化方法， 常见的有梯度下降（SGD、Momentum‌、NAG）、自适应学习率优化器（Adagrad‌、RMSprop‌、Adam‌、AdamW‌）、其他优化器（Muon‌）。

神经元包含对刺激（输入）的感知能力，产生应答（输出），其一般表示为f(x) = w(对刺激的感知权重)x+b(偏置)。
激活函数是一个非线性的函数。为什么需要是线性的，因为假设激活函数是线性的，那对于神经元表示做激活函数可以得到f(x)=w2(w1x+b1)+b2 = w2w1x+w2b1+b2，结果表示依然线性，那多个线性层迭代的结果就是线性的（wx+b），整个神经网络就是一个函数，没有学习的能力。
神经网络单次训练经过神经元和激活函数到下一个神经元最后到输出的过程即为前向传播。降低损失函数优化神经元权重和偏置就是一个反向传播过程（如果没有反向传播，神经网络就没有学习能力）

FNN，前馈神经网络。是一种基础的神经网络。下面做一个简易实现：

In [3]:
import torch
import torch.nn as nn
import torch.optim as optim

class SimpleNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleNN, self).__init__()
        # 输入层到隐藏层
        self.layer1 = nn.Linear(input_size, hidden_size)
        # 隐藏层到输出层
        self.layer2 = nn.Linear(hidden_size, output_size)
        # 激活函数 ReLU
        self.activation = nn.ReLU()
    # 前向传播
    def forward(self, x):
        # 输入层到隐藏层
        x = self.activation(self.layer1(x))
        # 隐藏层到输出层
        x = self.layer2(x)
        return x

# 创建模型实例
model = SimpleNN(input_size=10, hidden_size=20, output_size=2)

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)
# 输入数据
inputs = torch.randn(10)
# 目标数据
targets = torch.randn(2)

# 训练循环（这里省略了数据加载部分）
for epoch in range(100):
    # 前向传播
    outputs = model(inputs)
    # 计算损失
    loss = criterion(outputs, targets)
    # 梯度清零
    optimizer.zero_grad()
    # 反向传播
    loss.backward()
    # 更新参数
    optimizer.step()

    if (epoch + 1) % 10 == 0:
        print(f'Epoch [{epoch+1}/100], Loss: {loss.item():.4f}')

Epoch [10/100], Loss: 0.0862
Epoch [20/100], Loss: 0.0153
Epoch [30/100], Loss: 0.0010
Epoch [40/100], Loss: 0.0015
Epoch [50/100], Loss: 0.0012
Epoch [60/100], Loss: 0.0004
Epoch [70/100], Loss: 0.0001
Epoch [80/100], Loss: 0.0000
Epoch [90/100], Loss: 0.0000
Epoch [100/100], Loss: 0.0000
