## 2.3 自动求梯度
PyTorch提供的autograd包能够根据输入和前向传播过程自动构建计算图，并执行反向传播。

### 1.Tensor

In [18]:
import torch
x = torch.ones(2,2,requires_grad=True)
#requires_grad=True，可以利用链式法则进行梯度传播，完成计算后，可以调用.backward()来完成所有梯度
print(x)
print(x.grad_fn)#None，因为x是直接赋值，grad_fn为None

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)
None


In [19]:
y = x + 2
print(y)
print(y.grad_fn)#y是通过加法计算得来的，所以grad_fn值不为空
print(x.is_leaf,y.is_leaf)#x为叶子结点

tensor([[3., 3.],
        [3., 3.]], grad_fn=<AddBackward0>)
<AddBackward0 object at 0x0000023F4166F048>
True False


In [20]:
z=y*y*3
out=z.mean()
print(z,out)

tensor([[27., 27.],
        [27., 27.]], grad_fn=<MulBackward0>) tensor(27., grad_fn=<MeanBackward0>)


In [21]:
#通过.requires_grad_() in-place的方式改变requires_grad属性
a=torch.randn(2,2) #默认requires_grad=False
a=((a*3)/(a-1))
print(a.requires_grad)
a.requires_grad_(True)
print(a.requires_grad)
b=(a*a).sum()
print(b.grad_fn)

False
True
<SumBackward0 object at 0x0000023F4166F7F0>


### 2.梯度

In [22]:
retain_graph=True
out.backward()
#out是标量，所以不用指定求导变量 等同于out.backward(torch.tensor(1.))
print(x.grad)

tensor([[4.5000, 4.5000],
        [4.5000, 4.5000]])


In [23]:
#grad在反向传播过程中是累加的(accumulated)，这意味着每一次
#运行反向传播，梯度都会累加之前的梯度，所以一般在反向传播之前需把梯度清零。
out2=x.sum()
out2.backward()#梯度会累加
print(x.grad)

out3=x.sum()
x.grad.data.zero_()#梯度清零
out3.backward()
print(x.grad)

tensor([[5.5000, 5.5000],
        [5.5000, 5.5000]])
tensor([[1., 1.],
        [1., 1.]])


为了避免多维张量对多维张量求导对我们不允许张量对张量求导，只允许标量对张量求导，求导结果是和自变量同形的张量。所以必要时要把张量通过将所有张量的元素加权求和的方式转换为标量

In [24]:
x=torch.tensor([1.0,2.0,3.0,4.0],requires_grad=True)
y=2*x
z=y.view(2,2)
print(z)

tensor([[2., 4.],
        [6., 8.]], grad_fn=<ViewBackward>)


In [25]:
v=torch.tensor([[1.0,0.1],[0.01,0.001]],dtype=torch.float)#v是与z同形的权值向量
z.backward(v)
# z 不是一个标量，所以在调用backward时需要传入一个和z同形的权重向量进行加权求和得到一个标量。
print(x.grad)#x.grad与x同形

tensor([2.0000, 0.2000, 0.0200, 0.0020])


中断梯度追踪

In [27]:
x=torch.tensor(1.0,requires_grad=True)
y1=x ** 2
with torch.no_grad():#y2梯度不计入计算图中
    y2=x**3
y3=y1+y2

print(x.requires_grad)
print(y1,y1.requires_grad)#True
print(y2,y2.requires_grad)#False
print(y3,y3.requires_grad)#True

True
tensor(1., grad_fn=<PowBackward0>) True
tensor(1.) False
tensor(2., grad_fn=<AddBackward0>) True


In [28]:
y3.backward()
print(x.grad)#y2梯度不回传，只有y1梯度回传

tensor(2.)


如果我们想要修改tensor的数值，但是又不希望被autograd记录（即不会影响反向传播），那么我么可以对tensor.data进行操作

In [33]:
x=torch.ones(1,requires_grad=True)

print(x.data) #仍然是一个tensor
print(x.data.requires_grad)#但是独立于计算图之外

y=x*2
x.data *=100 #只改变了值，不会记录在计算图，所以不会影响梯度传播

y.backward()
print(x)#更改data的值也会影响tensor的值
print(x.grad)

tensor([1.])
False
tensor([100.], requires_grad=True)
tensor([2.])
