In [73]:
import torch

修改 Tensor 的 `requires_grad` 参数将其变成可求导的神经元。该参数可在创建 Tensor 时修改，也可使用`.requires_grad_()`修改。
* 注意：只有`float`类型的 Tensor 可以求导。

In [74]:
x = torch.ones(2,2,requires_grad=True)
print(x)

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)


In [75]:
y = x+2

用`requires_grad=True`的 Tensor 来赋值的 Tensor 都可以求导

In [76]:
y.requires_grad

True

查看`grad_fn`属性，以检查该神经元是以什么函数的导数公式进行求导。在这里 y 是使用加法的规则求导。

In [77]:
y.grad_fn

<AddBackward0 at 0x7f4a3612eef0>

In [78]:
z = y * y * 3
out = z.mean()    #取一个 Tensor 中所有元素的平均值
print(z,'\n',out)

tensor([[27., 27.],
        [27., 27.]], grad_fn=<MulBackward0>) 
 tensor(27., grad_fn=<MeanBackward0>)


从计算结束的地方开始反向传播`.backward()`

In [79]:
out.backward()

使用`.grad`查看反向传播后某处的梯度。

In [80]:
print(x.grad)

tensor([[4.5000, 4.5000],
        [4.5000, 4.5000]])


使用`.norm()`查看矩阵的 L2 范数。

In [81]:
h = torch.tensor([
    [1,2],
    [3,4]],
    dtype=torch.float,
)
h.norm()

tensor(5.4772)

**深入理解`.backward()`方法**

`.backward()`的第一个参数为`gradient`,也就是说，神经元会把下游传回来的梯度存起来，并作为`.backward()`方法的`gradient`参数，其实也就是前面提到的`.grad`属性。这个值默认是 1，pyton的广播机制将它变成一个合适维度的矩阵。如果我们希望给它赋予一个`grad`作为下游传回来地梯度时，可以在`.backward()`方法中添加一个`gradient`矩阵作为参数。
* 注意:该`gradient`矩阵的维度需要和 Tensor 完全相同。
* 链式法则使用的是矩阵乘法。

In [110]:
grad = 4*torch.ones(4,4,dtype=torch.float)
b = torch.ones(4,4, requires_grad=True)
c = (b*b).mean()
print(b,c)

tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]], requires_grad=True) tensor(1., grad_fn=<MeanBackward0>)


In [111]:
c.backward(grad)

In [112]:
print(b.grad)

tensor([[8., 8., 8., 8.],
        [8., 8., 8., 8.],
        [8., 8., 8., 8.],
        [8., 8., 8., 8.]])


使用`torch.no_grad()`方法创建一个过程，在这个过程里面所有的 Tensor 在进行**数学计算**之前`requires_grad`都会被置为`False`,因而计算的结果也是不可求导的。

In [118]:
print(x.requires_grad)
print((x ** 2).requires_grad)

with torch.no_grad():
    q=x**2
    print(q.requires_grad)
    print(x.requires_grad)

print(q.requires_grad)


True
True
False
True
False


这里简单谈谈`with`语句地意思，`with`后面跟着对象，该对象至少拥有两个方法，一个是开启某状态的方法，另一个是关闭该状态的方法。在`with`块里面的命令都在这种状态开启的情况下运行，运行完这个代码块后该状态会自动关闭。