# PyTorch的自动差分引擎：TORCH.AUTOGRAD

## 背景

神经网络（NN）是在某些输入数据上执行的嵌套函数的集合。这些函数由参数 （由权重和偏差组成）定义，这些参数在PyTorch中存储在张量中。

训练NN分为两个步骤：

前向传播：在前向传播中，NN对正确的输出做出最佳猜测。它通过其每个功能运行输入数据以进行猜测。

向后传播：在向后传播中，NN根据其猜测中的错误调整其参数。它通过从输出向后遍历，收集有关函数参数（梯度）的误差导数并使用梯度下降优化参数来实现

## 在PyTorch中的用法

让我们看一个培训步骤。在此示例中，我们从加载了预训练的resnet18模型torchvision。我们创建一个随机数据张量以表示具有3个通道，高度和宽度为64的单个图像，并将其相应的label初始化为一些随机值。

In [3]:
import torch, torchvision
model = torchvision.models.resnet18(pretrained=True) # 加载预训练的resnet18模型torchvision
data = torch.rand(1, 3, 64, 64) # 创建一个随机数据张量，3*64*64
labels = torch.rand(1, 1000) # 初始化标签

* 前向传播

In [9]:
prediction = model(data) # forward pass

* 模型的预测和相应的标签来计算误差（loss）

In [10]:
loss = (prediction - labels).sum()
loss.backward() # backward pass

* 加载一个优化器，注册模型的所有参数

In [11]:
optim = torch.optim.SGD(model.parameters(), lr=1e-2, momentum=0.9)

* 运行step()启动梯度下降

In [12]:
optim.step() #gradient descent

## Autograd的差异化

* autograd如何收集渐变(requires_grad=True。这表明autograd应该跟踪对它们的所有操作)

In [13]:
import torch

a = torch.tensor([2., 3.], requires_grad=True)
b = torch.tensor([6., 4.], requires_grad=True)