In [26]:
# -*- coding: utf-8 -*-
import torch
from torch.autograd import Variable

In [27]:
# N is batch size; D_in is input dimension;
# H is hidden dimension; D_out is output dimension.
N, D_in, H, D_out = 64, 1000, 100, 10

In [28]:
# Create random Tensors to hold inputs and outputs, and wrap them in Variables.
x = Variable(torch.randn(N, D_in))
y = Variable(torch.randn(N, D_out), requires_grad=False)

In [29]:
# 使用nn包将我们的模型定义为一系列的层。
# nn.Sequential是一个包含其他模块的模块, 并按顺序应用它们以产生输出。
# 每个Linear模块使用线性函数计算输入的输出, 
# 并保存内部Variables的权重和偏置
model = torch.nn.Sequential(
    torch.nn.Linear(D_in, H),
    torch.nn.ReLU(),
    torch.nn.Linear(H, D_out),
)

In [30]:
# nn包还包含流行的损失函数定义; 
# 在这个例子内我们使用均方差（MSE）作为我们的损失函数
loss_fn = torch.nn.MSELoss(size_average=False)
learning_rate = 1e-4

In [31]:
for t in range(5):
    # 前向传播:我们将x传递给模型来预测y. 模块对象覆盖 __call__ 操作符，因此你可以像调用函数一样去调用它们。 
    # 当这样做时，您将一个输入数据的Variable传递给模型，并产生一个输出数据的Variable。
    y_pred = model(x)

    # 计算并打印损失。 我们传递包含y的预测值和真实值的Variables,
    # 并且损失函数返回一个包含损失的Variable
    loss = loss_fn(y_pred, y)
    print(t, loss.data[0])

    # 在运行前向传播时将梯度归零。
    model.zero_grad()

    # 反向传播: 计算所有关于这个模型的所有可学习参数的损失值的梯度。
    # 内部来说,每个模块的参数存储在requires_grad =True的Variable中，
    # 因此，该调用将会计算这个模块内的所有可学习参数的梯度。
    loss.backward()

    # 使用梯度下降法更新权重. 每个参数都是一个Variable, 
    # 所以我们可以像之前那样对数据和参数进行存取
    for param in model.parameters():
        param.data -= learning_rate * param.grad.data
        print(param.data)

0 662.6749267578125

1.00000e-02 *
-1.3514 -2.5000 -2.3248  ...  -1.9220 -1.0469 -2.4766
 1.4188 -2.0802  2.5012  ...  -0.9698  0.1809 -1.0039
 0.0052 -1.4926 -2.9337  ...  -1.0929  0.2020 -1.5921
          ...             ⋱             ...          
-2.7847  0.6641 -2.2961  ...   3.0654  1.4883 -1.7346
-2.7891 -0.9240  2.3188  ...   0.9289 -0.5820  1.1907
-3.0489 -1.0184  1.0956  ...   3.1639 -1.4523 -0.9620
[torch.FloatTensor of size 100x1000]


1.00000e-02 *
  0.9253
  3.1483
 -0.0165
  2.7678
 -2.2394
 -0.4045
  0.5389
  0.8268
  2.4745
 -0.5838
 -1.5258
 -2.8533
 -0.4189
  1.3752
 -1.1876
  0.9848
 -1.3085
 -2.2678
 -3.0128
 -2.6755
 -1.3127
  1.8090
 -1.2882
 -0.5405
 -1.3359
 -1.6845
 -1.4455
  0.1143
 -3.1437
  2.7385
 -2.1571
 -0.5749
  1.7564
 -0.4217
  1.7307
 -1.6496
 -2.8650
 -2.7804
  2.3589
 -3.1605
 -2.9235
 -1.5036
  0.8440
 -1.0465
 -2.2740
  0.3989
 -0.2575
  0.9077
 -2.3483
  0.7691
 -2.4438
 -2.9391
 -2.9557
  0.8795
  0.9823
  2.3087
 -1.3477
 -0.8697
  0.5189
 -0