In [1]:
import torch
import torch.nn as nn
import torch.optim as optim

# 1. 构造训练数据
x = torch.tensor([[1.0],[2.0],[3.0],[4.0]])
y = torch.tensor([[2.0],[4.0],[6.0],[8.0]])

# 2. 定义模型：线性层 y = w*x + b
model = nn.Linear(1, 1)

# 3. 定义损失函数：均方误差
loss_fn = nn.MSELoss()

# 4. 定义优化器：SGD 梯度下降
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 5. 训练循环
for epoch in range(2000):

    # 前向计算（预测）
    y_pred = model(x)

    # 计算损失
    loss = loss_fn(y_pred, y)

    # 每次训练前清空梯度
    optimizer.zero_grad()

    # 反向传播（求梯度）
    loss.backward()

    # 参数更新
    optimizer.step()

    if epoch % 200 == 0:
        print(f"epoch {epoch}, loss={loss.item():.4f}")

# 6. 训练结果检查
print("\nLearned weight and bias:")
for name, param in model.named_parameters():
    print(name, param.data)

# 7. 用模型做预测
test = torch.tensor([[10.0]])
pred = model(test)
print("\nPredict x=10 => y=", pred.item())


epoch 0, loss=34.2442
epoch 200, loss=0.0016
epoch 400, loss=0.0005
epoch 600, loss=0.0001
epoch 800, loss=0.0000
epoch 1000, loss=0.0000
epoch 1200, loss=0.0000
epoch 1400, loss=0.0000
epoch 1600, loss=0.0000
epoch 1800, loss=0.0000

Learned weight and bias:
weight tensor([[2.0002]])
bias tensor([-0.0004])

Predict x=10 => y= 20.001062393188477


## 1）训练数据

```
x = torch.tensor([[1.0],[2.0],[3.0],[4.0]])
y = torch.tensor([[2.0],[4.0],[6.0],[8.0]])
```

> 输入 → 输出
> 模型通过它学习关系

------

## 2）模型

```
model = nn.Linear(1, 1)
```

内部是：

y=wx+by = w x + by=wx+b

一开始：

w,b随机初始化

------

## 3）损失函数

```
loss_fn = nn.MSELoss()
```

MSE：

Loss=(ypred−ytrue)2Loss = { (y_{pred} - y_{true})^2 }Loss=(ypred−ytrue)2

衡量模型预测和真实答案的误差

> 目标：让 Loss 尽可能小

------

## 4）优化器（梯度下降）

```
optimizer = optim.SGD(model.parameters(), lr=0.01)
```

负责：

> 用梯度更新模型参数 w、b

你看到的：

- 学习率 lr
- 使用 SGD（最基本的优化器）

------

## 5）前向传播（模型预测）

```
y_pred = model(x)
```

模型输出预测值
 一开始很烂

------

## 6）反向传播（求梯度）

```
loss.backward()
```

PyTorch 会自动求导：

dLossdw,dLossdb\frac{d Loss}{d w},\quad \frac{d Loss}{d b}dwdLoss,dbdLoss

------

## 7）参数更新

```
optimizer.step()
```

执行梯度下降：

w=w−lr∗dLossdww = w - lr * \frac{d Loss}{d w}w=w−lr∗dwdLoss

这个步骤会逐渐让损失变小

模型越来越准



经过训练：

- 权重 w 接近 2
- 偏置 b 接近 0

预测：

```
x=10 => y≈20
```

模型学会了函数：

y=2xy = 2xy=2x

人类想要的：

- 线性关系
- 预测准确

模型成功完成！