In [1]:
import numpy as np
a= np.array([1,2,3])
a

array([1, 2, 3])

In [2]:
import torch as pt
# 初始化张量并启用梯度计算
tensor_x = pt.arange(4.0, requires_grad=True)  # 合并创建和梯度追踪，更改变量名
print("tensor_x的梯度（初始状态）:", tensor_x.grad)

tensor_x的梯度（初始状态）: None


In [3]:
# 计算标量值y
scalar_y = 2 * pt.matmul(tensor_x, tensor_x)  # 用matmul替代dot，功能等价
print("计算得到的scalar_y值:", scalar_y)

计算得到的scalar_y值: tensor(28., grad_fn=<MulBackward0>)


In [4]:
# 重新初始化张量
tensor_x = pt.arange(4.0)
tensor_x.requires_grad_(True)  # 单独启用梯度追踪
# 重新计算y值
scalar_y = 2 * pt.matmul(tensor_x, tensor_x)
# 执行反向传播计算梯度
scalar_y.backward()
# 打印计算后的梯度
print("tensor_x的梯度值:", tensor_x.grad)
# 验证梯度计算结果是否正确
print("梯度验证（4*x）:", tensor_x.grad == 4 * tensor_x)

tensor_x的梯度值: tensor([ 0.,  4.,  8., 12.])
梯度验证（4*x）: tensor([True, True, True, True])


In [5]:
# 第一次反向传播：y1 = 2 * x^2
y1 = 2 * pt.matmul(tensor_x, tensor_x)
y1.backward()
print("首次反向传播后的梯度:", tensor_x.grad)

首次反向传播后的梯度: tensor([ 0.,  8., 16., 24.])


In [6]:
# 第二次反向传播：y2 = x元素求和
y2 = tensor_x.sum()
y2.backward()
print("二次反向传播后的梯度:", tensor_x.grad)

二次反向传播后的梯度: tensor([ 1.,  9., 17., 25.])


In [7]:
# 逐元素运算的梯度计算
# 清空梯度
tensor_x.grad.zero_()  # 修正这里
# 逐元素相乘计算y
y = tensor_x * tensor_x
# 求和后反向传播（非标量必须求和或指定gradient）
y.sum().backward()
print("逐元素运算后的梯度:", tensor_x.grad)

逐元素运算后的梯度: tensor([0., 2., 4., 6.])


In [8]:
# 张量分离（detach）演示
# 清空梯度
tensor_x.grad.zero_()  # 修正这里
# 重新计算逐元素乘积
y = tensor_x * tensor_x
# 分离y得到u，u不参与梯度计算
u = y.detach()
# 计算z = u * x
z = u * tensor_x
# 反向传播
z.sum().backward()
# 验证梯度结果
print("梯度验证（等于u）:", tensor_x.grad == u)

梯度验证（等于u）: tensor([True, True, True, True])


In [None]:
# 验证原始y的梯度
# 清空梯度
tensor_x.grad.zero_()  
# 对原始y求和后反向传播
y.sum().backward()
# 验证梯度是否为2*x
print("梯度验证（等于2*x）:", tensor_x.grad == 2 * tensor_x)

梯度验证（等于2*x）: tensor([True, True, True, True])
