# PyTorch：张量(Tensors)

NumPy是一个很棒的框架，但是它不支持GPU以加速运算。现代深度神经网络，GPU常常提供[50倍以上的加速]((https://github.com/jcjohnson/cnn-benchmarks))，所以NumPy不能满足当代深度学习的需求。 

我们先介绍PyTorch最基础的概念：**张量（Tensor）**。逻辑上，PyTorch的tensor和NumPy array是一样的：tensor是一个n维数组，PyTorch提供了很多函数操作这些tensor。任何希望使用NumPy执行的计算也可以使用PyTorch的tensor来完成；可以认为它们是科学计算的通用工具。

和NumPy不同的是，PyTorch可以利用GPU加速。要在GPU上运行PyTorch张量，在构造张量使用`device`参数把tensor建立在GPU上。

这里我们利用PyTorch的tensor在随机数据上训练一个两层的网络。和前面NumPy的例子类似，我们使用PyTorch的tensor，手动在网络中实现前向传播和反向传播： 

In [2]:
# 可运行代码见本文件夹中的 two_layer_net_tensor.py
import torch

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') 

# N是批大小； D_in 是输入维度；
# H 是隐藏层维度； D_out 是输出维度
N, D_in, H, D_out = 64, 1000, 100, 10

# 产生随机输入和输出数据
x = torch.randn(N, D_in, device=device)
y = torch.randn(N, D_out, device=device)

# 随机初始化权重
w1 = torch.randn(D_in, H, device=device)
w2 = torch.randn(H, D_out, device=device)

learning_rate = 1e-6
for t in range(500):
    # 前向传播：计算预测值y
    h = x.mm(w1)
    h_relu = h.clamp(min=0)
    y_pred = h_relu.mm(w2)

    # 计算并输出loss；loss是存储在PyTorch的tensor中的标量，维度是()（零维标量）；
    # 我们使用loss.item()得到tensor中的纯python数值。
    loss = (y_pred - y).pow(2).sum()
    print(t, loss.item())

    # 反向传播，计算w1、w2对loss的梯度
    grad_y_pred = 2.0 * (y_pred - y)
    grad_w2 = h_relu.t().mm(grad_y_pred)
    grad_h_relu = grad_y_pred.mm(w2.t())
    grad_h = grad_h_relu.clone()
    grad_h[h < 0] = 0
    grad_w1 = x.t().mm(grad_h)

    # 使用梯度下降更新权重
    w1 -= learning_rate * grad_w1
    w2 -= learning_rate * grad_w2

0 32397586.0
1 29653808.0
2 31517672.0
3 32702292.0
4 29156884.0
5 21014596.0
6 12371127.0
7 6481777.0
8 3437418.25
9 2026104.125
10 1369511.5
11 1031340.0
12 830772.5
13 694495.5
14 592425.5625
15 511290.5
16 444623.875
17 388864.78125
18 341748.375
19 301557.875
20 267141.28125
21 237480.625
22 211721.28125
23 189273.0
24 169670.421875
25 152539.5
26 137481.21875
27 124183.4765625
28 112407.890625
29 101948.546875
30 92621.1015625
31 84301.3671875
32 76848.7421875
33 70166.609375
34 64159.265625
35 58752.2890625
36 53871.515625
37 49460.359375
38 45468.28515625
39 41847.3671875
40 38560.2265625
41 35574.5
42 32857.10546875
43 30378.65234375
44 28117.48046875
45 26050.265625
46 24159.33203125
47 22426.75390625
48 20836.775390625
49 19376.80859375
50 18036.22265625
51 16802.80078125
52 15666.5712890625
53 14618.611328125
54 13651.189453125
55 12757.51953125
56 11931.091796875
57 11166.2353515625
58 10457.806640625
59 9800.892578125
60 9191.345703125
61 8625.2431640625
62 8099.2421875
6

417 0.011122584342956543
418 0.010785242542624474
419 0.010456754826009274
420 0.010140564292669296
421 0.0098289605230093
422 0.009533515200018883
423 0.009244212880730629
424 0.008960932493209839
425 0.008697972632944584
426 0.008437827229499817
427 0.008179335854947567
428 0.00793493539094925
429 0.0076987105421721935
430 0.007467738352715969
431 0.007244306616485119
432 0.0070322174578905106
433 0.006825670599937439
434 0.006624545902013779
435 0.006430486217141151
436 0.0062418594025075436
437 0.00605994276702404
438 0.0058792466297745705
439 0.005711874924600124
440 0.005545766558498144
441 0.0053859129548072815
442 0.0052306982688605785
443 0.00507597578689456
444 0.00493097398430109
445 0.004789197817444801
446 0.004654687829315662
447 0.0045255254954099655
448 0.004393784794956446
449 0.004269877448678017
450 0.004152118694037199
451 0.004035870544612408
452 0.003924779128283262
453 0.0038115603383630514
454 0.003706799354404211
455 0.0036034109070897102
456 0.0035058858338743