# 60分钟入门深度学习工具-PyTorch(一、PyTorch 是什么)

**作者**：Soumith Chintala


原文翻译自：https://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html
    
中文翻译、注释制作：黄海广

github：https://github.com/fengdu78

代码全部测试通过。

配置环境：PyTorch 1.0，python 3.6，

主机：显卡：一块1080ti；内存：32g（注：绝大部分代码不需要GPU）
![公众号](images/gongzhong.jpg)
### 目录
* 1.[Pytorch是什么？](60分钟入门PyTorch-1.PyTorch是什么？.ipynb)
* 2.[AUTOGRAD](60分钟入门PyTorch-2.AUTOGRAD.ipynb)
* 3.[神经网络](60分钟入门PyTorch-3.神经网络.ipynb)
* 4.[训练一个分类器](60分钟入门PyTorch-4.训练一个分类器.ipynb)
* 5.[数据并行](60分钟入门PyTorch-5.数据并行.ipynb)

# 一、PyTorch 是什么

他是一个基于Python的科学计算包，目标用户有两类

* 为了使用GPU来替代numpy
* 一个深度学习研究平台：提供最大的灵活性和速度

## 开始

### 张量（Tensors)
张量类似于numpy的ndarrays，不同之处在于张量可以使用GPU来加快计算。

In [1]:
from __future__ import print_function
import torch

构建一个未初始化的5*3的矩阵：

In [2]:
x = torch.Tensor(5, 3)
print(x)
print(x.size())
print(x.shape)

tensor([[6.3081e-01, 4.5687e-41, 6.3081e-01],
        [4.5687e-41, 6.4600e+19, 7.2443e+22],
        [8.3959e-33, 2.8624e+20, 6.9785e+22],
        [6.6554e-33, 1.3563e-19, 1.6114e-19],
        [6.0247e+22, 2.0596e-19, 2.1123e-19]])
torch.Size([5, 3])
torch.Size([5, 3])


构建一个零矩阵，使用long的类型


In [3]:
x = torch.zeros(5, 3)
print(x)
print(x.dtype)

x = torch.zeros(2, 2, dtype=torch.long)
print(x)
print(x.dtype)

tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])
torch.float32
tensor([[0, 0],
        [0, 0]])
torch.int64


从数据中直接构建一个张量(tensor)：

In [4]:
x = torch.tensor([5.5, 3])
print(x)

x = torch.tensor([[2.1, 1.1],
                 [2.2, 3.5]])
print(x)

tensor([5.5000, 3.0000])
tensor([[2.1000, 1.1000],
        [2.2000, 3.5000]])


或者在已有的张量(tensor)中构建一个张量(tensor). 这些方法将重用输入张量(tensor)的属性，例如， dtype，除非用户提供新值

In [5]:
x = x.new_ones(5, 3, dtype=torch.double)      # new_* 形式的方法继承未被覆盖的属性如device、dtype等
# x = x.new_ones(5, 3, dtype=torch.double)      # new_* methods take in sizes
print(x)

x = torch.randn_like(x, dtype=torch.float)    # 覆盖类型!
print(x)                                      # result 的size相同

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)
tensor([[ 0.6985,  0.7701,  0.8369],
        [ 1.0290, -0.6990,  0.6339],
        [-0.7089, -0.0383, -0.7319],
        [ 0.5219,  0.3005,  0.3276],
        [-0.2500,  2.2986, -0.3435]])


获取张量(tensor)的大小

In [6]:
print(x.size())

torch.Size([5, 3])


** 注意 **

`torch.Size`实际上是一个元组，所以它支持元组的所有操作。

## 操作
张量上的操作有多重语法形式，下面我们以加法为例进行讲解。

### 语法1

In [7]:
y = torch.rand(5, 3)
print(x + y)

tensor([[ 1.4698,  1.3195,  1.1513],
        [ 1.9934, -0.1485,  0.8298],
        [-0.2956,  0.2627, -0.5478],
        [ 1.2408,  0.4802,  0.7702],
        [ 0.0435,  2.3807,  0.6052]])


### 语法二

In [8]:
print(torch.add(x, y))

tensor([[ 1.4698,  1.3195,  1.1513],
        [ 1.9934, -0.1485,  0.8298],
        [-0.2956,  0.2627, -0.5478],
        [ 1.2408,  0.4802,  0.7702],
        [ 0.0435,  2.3807,  0.6052]])


### 语法三：
给出一个输出张量作为参数

In [9]:
result = torch.empty(5, 3)
torch.add(x, y, out=result)
print(result)

tensor([[ 1.4698,  1.3195,  1.1513],
        [ 1.9934, -0.1485,  0.8298],
        [-0.2956,  0.2627, -0.5478],
        [ 1.2408,  0.4802,  0.7702],
        [ 0.0435,  2.3807,  0.6052]])


### 语法四：
原地操作（in-place）

In [10]:
# 把x加到y上
y.add_(x)
print(y)

tensor([[ 1.4698,  1.3195,  1.1513],
        [ 1.9934, -0.1485,  0.8298],
        [-0.2956,  0.2627, -0.5478],
        [ 1.2408,  0.4802,  0.7702],
        [ 0.0435,  2.3807,  0.6052]])


** 注意**

任何在原地(in-place)改变张量的操作都有一个`_`后缀。例如`x.copy_(y)`, `x.t_()`操作将改变x.

你可以使用所有的`numpy`索引操作。

你可以使用各种类似标准NumPy的花哨的索引功能

In [11]:
print(x[:, 1])

tensor([ 0.7701, -0.6990, -0.0383,  0.3005,  2.2986])


调整大小：如果要调整张量/重塑张量，可以使用`torch.view`：

In [13]:
x = torch.randn(4, 4)
y = x.view(16)
z = x.view(-1, 8)  # -1的意思是没有指定维度
zz = x.view(-1, 2, 2)
print(x.size(), y.size(), z.size(), zz.size())

torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8]) torch.Size([4, 2, 2])


如果你有一个单元素张量，使用`.item()`将值作为Python数字

In [15]:
x = torch.randn(1)
print(x)
print(x.item())

tensor([0.0744])
0.07438059896230698


### 稍后阅读

[这里](https://pytorch.org/docs/stable/torch.html)描述了一百多种张量操作，包括转置，索引，数学运算，线性代数，随机数等。

## numpy桥
把一个torch张量转换为numpy数组或者反过来都是很简单的。

Torch张量和numpy数组将共享潜在的内存，改变其中一个也将改变另一个。

## 把Torch张量转换为numpy数组

In [17]:
a = torch.ones(5)
print(a)

tensor([1., 1., 1., 1., 1.])


In [18]:
b = a.numpy()
print(b)
print(type(b))

[1. 1. 1. 1. 1.]
<class 'numpy.ndarray'>


通过如下操作，我们看一下numpy数组的值如何在改变。

In [19]:
a.add_(10)
print(a)
print(b)

b += 10
print(a)
print(b)

tensor([11., 11., 11., 11., 11.])
[11. 11. 11. 11. 11.]
tensor([21., 21., 21., 21., 21.])
[21. 21. 21. 21. 21.]


## 把numpy数组转换为torch张量

看看改变numpy数组如何自动改变torch张量。

In [20]:
import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
print(a)
print(b)
torch.add(b, 1, out=b)
print(a)
print(b)

[2. 2. 2. 2. 2.]
tensor([2., 2., 2., 2., 2.], dtype=torch.float64)
[3. 3. 3. 3. 3.]
tensor([3., 3., 3., 3., 3.], dtype=torch.float64)


所有在CPU上的张量，除了字符张量，都支持在numpy之间转换。

## CUDA张量

可以使用.to方法将张量移动到任何设备上。

In [21]:
# let us run this cell only if CUDA is available
# We will use ``torch.device`` objects to move tensors in and out of GPU
if torch.cuda.is_available():
    device = torch.device("cuda")          # a CUDA device object
    y = torch.ones_like(x, device=device)  # directly create a tensor on GPU
    x = x.to(device)                       # or just use strings ``.to("cuda")``
    z = x + y
    print(z)
    print(z.to("cpu", torch.double))       # ``.to`` can also change dtype together!

tensor([1.0744], device='cuda:0')
tensor([1.0744], dtype=torch.float64)


本章的官方代码：
* Python：[tensor_tutorial.py](download/tensor_tutorial.py)
* Jupyter notebook:[tensor_tutorial.ipynb](download/tensor_tutorial.ipynb)

In [23]:
if torch.cuda.is_available():
    device = torch.device("cuda")
    a = torch.ones(5, 5, device=device)
    b = torch.randn_like(a)
    b = b.to(device)
    c = a + b
    print(c)
    print(c.to("cpu", torch.double))

tensor([[ 0.1623, -0.3352,  0.1628,  0.3878,  1.0801],
        [ 0.6424,  1.9079,  0.0410,  1.9995,  0.0193],
        [ 0.9107,  1.1514,  0.4706,  1.8672,  1.9020],
        [ 0.2338,  0.6557,  1.2293,  0.6811,  0.9455],
        [ 0.8093,  1.2110,  1.6322,  0.5737,  2.0453]], device='cuda:0')
tensor([[ 0.1623, -0.3352,  0.1628,  0.3878,  1.0801],
        [ 0.6424,  1.9079,  0.0410,  1.9995,  0.0193],
        [ 0.9107,  1.1514,  0.4706,  1.8672,  1.9020],
        [ 0.2338,  0.6557,  1.2293,  0.6811,  0.9455],
        [ 0.8093,  1.2110,  1.6322,  0.5737,  2.0453]], dtype=torch.float64)
