关于torch.Tensor
torch.Tensor是整个package中的核心类, 如果将属性.requires_grad设置为True, 它将追踪在这个类上定义的所有操作. 当代码要进行反向传播的时候, 直接调用.backward()就可以自动计算所有的梯度. 在这个Tensor上的所有梯度将被累加进属性.grad中.
如果想终止一个Tensor在计算图中的追踪回溯, 只需要执行.detach()就可以将该Tensor从计算图中撤下, 在未来的回溯计算中也不会再计算该Tensor.
除了.detach(), 如果想终止对计算图的回溯, 也就是不再进行方向传播求导数的过程, 也可以采用代码块的方式with torch.no_grad():, 这种方式非常适用于对模型进行预测的时候, 因为预测阶段不再需要对梯度进行计算.

关于torch.Function:
Function类是和Tensor类同等重要的一个核心类, 它和Tensor共同构建了一个完整的类, 每一个Tensor拥有一个.grad_fn属性, 代表引用了哪个具体的Function创建了该Tensor.
如果某个张量Tensor是用户自定义的, 则其对应的grad_fn is None. 就比如 a = 【2，2】这种

In [18]:
import torch

In [19]:
x1 = torch.ones(2, 2)  # 这个是没有开自动求导

x2 = torch.ones(2, 2, requires_grad=True)  # 开启自动求导

y = x1 * x2  # 这里进行计算

print(x1)
print(x2)
print(y)  # 发现这里的grad_fn是MulBackward0，也就是乘法的函数反向传播得到

tensor([[1., 1.],
        [1., 1.]])
tensor([[1., 1.],
        [1., 1.]], requires_grad=True)
tensor([[1., 1.],
        [1., 1.]], grad_fn=<MulBackward0>)


In [20]:
x3 = x2 + 1  # 在x2的基础上面进行一个加法操作
print(x3)  # 就会发现这里的grad_fn是Add

tensor([[2., 2.],
        [2., 2.]], grad_fn=<AddBackward0>)


In [21]:
# grad_fn 是用来记录这个东西是不是由哪个计算的到来的，如果是用户自己定义的就是None
print(x1.grad_fn)
print(x2.grad_fn)
print(y.grad_fn)  # y 是x1 和 x2 相乘得到

None
None
<MulBackward0 object at 0x00000219EBA723D0>


关于方法.requires_grad_(): 该方法可以原地改变Tensor的属性.requires_grad的值. 如果没有主动设定默认为False.

In [22]:
a = torch.randn(2, 2)
a = ((a * 3) / (a - 1))
print(a.requires_grad)  # 这里是false，因为上面的tensor没有开启自动求导
a.requires_grad_(True)  # 这里通过魔法方法 开启了自动求导设置
print(a.requires_grad)
b = (a * a).sum()
print(b.grad_fn)  # 经过运算之后，就可以看到自动求导已经生效了

False
True
<SumBackward0 object at 0x00000219EBABCB20>


关于梯度Gradients
在Pytorch中, 反向传播是依靠.backward()实现的.
关于自动求导的属性设置: 可以通过设置.requires_grad=True来执行自动求导, 也可以通过代码块的限制来停止自动求导.

In [27]:
print(x2.requires_grad)  # 开启状态
print((x2 ** 2).requires_grad)  # 进行计算之后也是开启状态

with torch.no_grad():  # 使用关闭自动求带的块代码，一般用于预测的时候，预测就不需要起到了
    print((x2 ** 2).requires_grad)
print(x2.requires_grad)  # 然后上面的块运行完成之后，自动求导还是开启的，不影响住代码

True
True
False
True
