"""
案例:
    演示自动微分模块, 循环实现 计算梯度, 更新参数.

需求:
    求 y = x**2 + 20 的极小值点 并打印y是最小值时 w的值(梯度)

解题步骤:
    1. 定义点 w=10 requires_grad=True  dtlosspe=torch.float32
    2. 定义函数 loss = w**2 + 20
    3. 利用梯度下降法 循环迭代1000 求最优解
    3.1 正向计算(前向传播)
    3.2 梯度清零 w.grad.zero_()
    3.3 反向传播
    3.4 梯度更新 w.data = w.data - 0.01 * w.grad

回顾:
    W新 = W旧 - 学习率 * 梯度
"""

In [1]:
# 导包
import torch
import os

In [2]:
# 设置多线程配置
# 设置最大线程数，-1 表示使用所有可用线程
torch.set_num_threads(os.cpu_count() or -1)
torch.set_num_interop_threads(os.cpu_count() or -1)

# 检查是否支持并行
if torch.cuda.is_available():
    device = torch.device("cuda")
    print(f"使用 GPU: {torch.cuda.get_device_name(0)}")
    print(f"GPU 内存: {torch.cuda.get_memory_allocated(0)/1024**2:.2f} MB")
else:
    device = torch.device("cpu")
    print(f"使用 CPU，线程数: {torch.get_num_threads()}")


使用 CPU，线程数: 2


In [3]:
# 1. 定义点 w=10 requires_grad=True  dtype=torch.float32
w = torch.tensor(10.0, requires_grad=True, dtype=torch.float32, device=device)


In [4]:
# 2. 定义函数 loss = w**2 + 20
loss = w ** 2 + 20  # 求导: loss' = 2w


In [5]:
# 3. 利用梯度下降法 循环迭代101 求最优解
print(f'开始 权重初始值: {w.item():.4f}, 梯度: 无,  loss: {loss.item():.4f}')

开始 权重初始值: 10.0000, 梯度: 无,  loss: 120.0000


In [10]:
# 迭代1000次，求最优解
for i in range(1, 101):
    # 3.1 正向计算(前向传播)
    loss = w ** 2 + 20
    
    # 3.2 梯度清零
    if w.grad is not None:
        w.grad.zero_()
    
    # 3.3 反向传播
    loss.backward()
    
    # 3.4 梯度更新
    with torch.no_grad():  # 不记录梯度更新操作
        w.data = w.data - 0.01 * w.grad
    
    # 每100次打印一次
    # if i % 1 == 0 or i == 1:
    #     print(f'第 {i:4d} 次, 权重: {w.item():.6f}, 梯度: {w.grad.item():.6f}, loss: {loss.item():.6f}')


In [11]:
# 4. 打印最终结果.
print(f'最终结果 权重: {w}, 梯度: {w.grad:.5f}, loss: {loss:.5f}')

最终结果 权重: 0.023325050249695778, 梯度: 0.04760, loss: 20.00057


In [12]:
# 4. 打印最终结果
print('\n' + '='*50)
print(f'最终结果:')
print(f'权重 w: {w.item():.10f}')
print(f'梯度值: {w.grad.item():.10f} (接近0表示收敛)')
print(f'损失值: {loss.item():.10f}')
print(f'理论最小值点: 0.000000')
print(f'理论最小损失: 20.000000')


最终结果:
权重 w: 0.0233250502
梯度值: 0.0476021431 (接近0表示收敛)
损失值: 20.0005664825
理论最小值点: 0.000000
理论最小损失: 20.000000
