### 自动求导机制记录了Tensor的操作，以便自动求导与反向传播。

### requires_grad参数表示是否需要对该Tensor进行求导，默认为False；设置为True则需要求导，并且依赖于该Tensor的之后的所有节点都需要求导。

### Tensor有两个重要的属性，分别记录了该Tensor的梯度与经历的操作。

①grad：该Tensor对应的梯度，类型为Tensor，并与Tensor同维度。

②grad_fn：指向function对象，即该Tensor经过了什么样的操作，用作反向传播的梯度计算，如果该Tensor由用户自己创建，则该grad_fn为None。

In [1]:
import torch

In [2]:
a = torch.randn(2, 2, requires_grad=True)
b = torch.randn(2, 2)
a, b

(tensor([[-0.0993, -1.3194],
         [-1.6210,  0.4325]], requires_grad=True),
 tensor([[-0.2791, -1.5609],
         [-0.8003,  1.4914]]))

In [3]:
#默认的Tensor不需要求导，设置requires_grad为True后则需要求导
a.requires_grad, b.requires_grad

(True, False)

In [4]:
#也可以通过内置函数requires_grad_()将Tensor变为需要求导
b.requires_grad_()

tensor([[-0.2791, -1.5609],
        [-0.8003,  1.4914]], requires_grad=True)

In [5]:
b.requires_grad

True

In [6]:
#通过计算生成的Tensor，由于依赖的Tensor需要求导，所以计算结果也需要求导
c = a + b
c, c.requires_grad

(tensor([[-0.3784, -2.8803],
         [-2.4213,  1.9239]], grad_fn=<AddBackward0>),
 True)

In [7]:
#a与b是自己创建的，grad_fn为None，而c的grad_fn是一个Add函数操作
a.grad_fn, b.grad_fn, c.grad_fn

(None, None, <AddBackward0 at 0x269fad10850>)

## Tensor.detach()函数
返回一个新的tensor，新的tensor和原来的tensor共享数据内存，但不涉及梯度计算，即**requires_grad=False**。修改其中一个tensor的值，另一个也会改变，因为是共享同一块内存，但**如果对其中一个tensor执行某些内置操作，则会报错**，例如resize_、resize_as_、set_、transpose_。

In [8]:
d = c.detach()
d, d.requires_grad

(tensor([[-0.3784, -2.8803],
         [-2.4213,  1.9239]]),
 False)

In [9]:
#没有任何输出
d.grad_fn

In [10]:
#使用detach()函数后，执行某些内置操作会报错
d.resize_(4, 1)

RuntimeError: set_sizes_contiguous is not allowed on a Tensor created from .data or .detach().
If your intent is to change the metadata of a Tensor (such as sizes / strides / storage / storage_offset)
without autograd tracking the change, remove the .data / .detach() call and wrap the change in a `with torch.no_grad():` block.
For example, change:
    x.data.set_(y)
to:
    with torch.no_grad():
        x.set_(y)