## Pytorch实现反向传播

In [2]:
import torch
import numpy as np

In [9]:
x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]

In [8]:
w = torch.Tensor([1.0]) # 权重初始值
w.requires_grad = True # 是否需要计算梯度，Tensor创建之后默认不计算梯度

In [15]:
# y_predict = x * w
def forward(x):
    return x * w
def loss(x, y): # 损失函数
    y_pred = forward(x)
    return (y_pred - y) ** 2

# 训练过程
# 第一步：先算损失 Loss
# 第二步：backward，反向传播
# 第三步：梯度下降
for epoch in range(100):
    for x, y in zip(x_data, y_data):
        l = loss(x, y) # 前向传播，求 Loss，构建计算图
        l.backward() # 反向传播，求出计算图中所有梯度存入w中
        print("\tgrad: ",x, y, w.grad.item())
        w.data = w.data - 0.01 * w.grad.data # w..grad.data：获取梯度，用data计算，不会建立计算图
        
        w.grad.data.zero_() # 注意：将w中所有梯度清零
    print("pregress:", epoch, l.item())

	grad:  1.0 2.0 -7.152557373046875e-07
	grad:  2.0 4.0 -2.86102294921875e-06
	grad:  3.0 6.0 -5.7220458984375e-06
pregress: 0 9.094947017729282e-13
	grad:  1.0 2.0 -7.152557373046875e-07
	grad:  2.0 4.0 -2.86102294921875e-06
	grad:  3.0 6.0 -5.7220458984375e-06
pregress: 1 9.094947017729282e-13
	grad:  1.0 2.0 -7.152557373046875e-07
	grad:  2.0 4.0 -2.86102294921875e-06
	grad:  3.0 6.0 -5.7220458984375e-06
pregress: 2 9.094947017729282e-13
	grad:  1.0 2.0 -7.152557373046875e-07
	grad:  2.0 4.0 -2.86102294921875e-06
	grad:  3.0 6.0 -5.7220458984375e-06
pregress: 3 9.094947017729282e-13
	grad:  1.0 2.0 -7.152557373046875e-07
	grad:  2.0 4.0 -2.86102294921875e-06
	grad:  3.0 6.0 -5.7220458984375e-06
pregress: 4 9.094947017729282e-13
	grad:  1.0 2.0 -7.152557373046875e-07
	grad:  2.0 4.0 -2.86102294921875e-06
	grad:  3.0 6.0 -5.7220458984375e-06
pregress: 5 9.094947017729282e-13
	grad:  1.0 2.0 -7.152557373046875e-07
	grad:  2.0 4.0 -2.86102294921875e-06
	grad:  3.0 6.0 -5.7220458984375e-0

在上面的训练过程中，只要一进行 backward，计算图就没有了。在下一次训练的时候，会重新创建一个计算图。因为有可能在构建神经网络的过程中，每次运行的时候，计算图可能是不一样的。所以每进行一次反向传播，就要把该计算图释放，准备下一次的计算图，这是一个非常灵活的过程。

In [None]:
w = torch.Tensor