## 用PyTorch实现线性回归

targets的真实计算规则是: 
$$
y = 1.1x_1 + 2.2x_2 + 3.3x_3 + 4.4 + noise
$$


In [None]:
"""生成训练数据"""
import torch
# 确保cuda可用
# device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device = torch.device("cpu") # 如果没有GPU，改成"cpu"
# 生成训练数据
inputs = torch.rand(100,3) #随机生成shape为（100，3）的tensor，元素值在[0,1)均匀分布
weights = torch.tensor([[1.1],[2.2],[3.3]]) #预设的权重
bias = torch.tensor(4.4)      #预设的偏置
targets = inputs @ weights + bias + 0.1*torch.randn(100,1)  #x @ w + b + 噪声，增加噪声误差，模拟真实情况
"""随机生成100条数据,每条数据3个feature,生成最终targets作为label值"""

"""用随机值初始化线性回归模型的参数"""
# 初始化参数时直接放在CUDA上，启用梯度计算
w = torch.rand((3,1), requires_grad=True, device=device) #权重
b = torch.rand((1,), requires_grad=True, device=device)    #偏置

"""训练线性回归模型"""
# 将数据移至相同设备
inputs = inputs.to(device)
targets = targets.to(device)

"""
参数(Parameter)：模型内部通过训练学到的数值。
超参数(Hyperparameter):在训练前就人为设定的数值：

常见的超参数有：
学习率 (learning rate)：梯度下降时每一步更新参数的大小。
批大小 (batch size)：每次训练用多少样本。
迭代次数/轮数 (epochs)：整个训练集被训练多少遍。
隐藏层大小 (hidden units)：神经网络里每一层的神经元数。
正则化系数 (L2, dropout 比例等)：防止过拟合的强度。
这些值一旦设置好，训练过程中不会自动改变（除非你写代码动态调整）。
"""
# 设置超参数
epoch = 100000 # 迭代次数
lr = 0.005    # 学习率

for i in range(epoch):
    outputs = inputs @ w + b  # 前向传播，计算预测值
    loss = torch.mean(torch.square(outputs - targets)) # 计算均方误差MSE损失函数
    print("loss:",loss.item())  # .item()把只含一个数的张量，转换成普通的Python数字标量
    
    loss.backward()  # 反向传播，计算梯度，存储到 w.grad, b.grad
    
    """w.grad 获取loss对w的梯度, b.grad获取loss对b的梯度"""
    with torch.no_grad():  # 下面的计算不需要用梯度，关闭节省内存
        w -= lr * w.grad  # 更新权重
        b -= lr * b.grad  # 更新偏置
        
    # 清零梯度，避免梯度值一直累积
    w.grad.zero_()
    b.grad.zero_()
        
print("训练后的权重w:", w)
print("训练后的偏置b:", b)

loss: 41.5095329284668
loss: 40.10163116455078
loss: 38.7415657043457
loss: 37.427711486816406
loss: 36.15849685668945
loss: 34.93240737915039
loss: 33.74797058105469
loss: 32.60377883911133
loss: 31.498464584350586
loss: 30.43069839477539
loss: 29.399215698242188
loss: 28.40277671813965
loss: 27.440187454223633
loss: 26.51030731201172
loss: 25.612018585205078
loss: 24.744247436523438
loss: 23.905967712402344
loss: 23.09615707397461
loss: 22.313865661621094
loss: 21.558149337768555
loss: 20.828109741210938
loss: 20.12287139892578
loss: 19.44159507751465
loss: 18.783458709716797
loss: 18.147687911987305
loss: 17.53351402282715
loss: 16.940204620361328
loss: 16.367053985595703
loss: 15.813372611999512
loss: 15.278499603271484
loss: 14.761798858642578
loss: 14.262651443481445
loss: 13.780461311340332
loss: 13.314652442932129
loss: 12.864666938781738
loss: 12.42996597290039
loss: 12.010034561157227
loss: 11.604366302490234
loss: 11.212481498718262
loss: 10.833906173706055
loss: 10.46819305

**形状和维度的关系**

(1,) → 一维向量（只有 1 个元素）

(2,) → 一维向量（有 2 个元素，例如 [a, b]）

(1,2) → 二维矩阵，1 行 2 列

(2,3) → 二维矩阵，2 行 3 列

(2,3,4) → 三维张量（可以想象成 2 个 3×4 的矩阵叠在一起）



In [None]:
import torch

print("PyTorch version:", torch.__version__)
print("CUDA version:", torch.version.cuda)
print("CUDA available:", torch.cuda.is_available())

if torch.cuda.is_available():
    print("GPU name:", torch.cuda.get_device_name(0))


PyTorch version: 2.5.1+cu121
CUDA version: 12.1
CUDA available: True
GPU name: NVIDIA GeForce RTX 5060 Laptop GPU
