# Deep-Learning with pytorch(60分中简要教程)
## 什么是pytorch
+ 可以用来替代Numpty，但比Numpty增加了GPU的支持
+ 深度学习框架，提供了最大化的灵活性和性能

### Tensor(张量)
    Tensor类似于Numpty中的ndarray，但是增加了对GPU的支持。 使用tensor，首先导入torch模块

In [2]:
from __future__ import print_function
import torch
print(torch.__version__) #打印torch版本信息

1.4.0


#### 生成一个5x3的矩阵，为初始化:

In [6]:
x = torch.empty(5,3)
print(x)

tensor([[0.0000e+00, -0.0000e+00, 2.5777e+33],
        [8.5920e+09, 1.1210e-44, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00]])


#### 生成一个5x3的矩阵，随机初始化:

In [7]:
x = torch.rand(5, 3)
x

tensor([[0.3434, 0.4575, 0.5652],
        [0.3717, 0.7905, 0.1333],
        [0.8853, 0.1139, 0.3791],
        [0.3014, 0.8595, 0.8263],
        [0.2763, 0.8001, 0.9045]])

#### 生成一个5x3的矩阵，所有元素初始化为零，数据类型为long:

In [8]:
x = torch.zeros(5, 3, dtype=torch.long)
x

tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])

#### 直接从数据生成tensor:

In [9]:
x = torch.tensor([2.3, 3.4])
x

tensor([2.3000, 3.4000])

#### 基于已经生成的Tensor生成新的Tensor：

In [10]:
x = x.new_ones(5, 3, dtype=torch.double)  #新生成的x，继承了原先x的所有属性，包括dtype和device
print(x)

x = torch.rand_like(x,dtype=torch.float)  #基于x生成新的tensor y
print(x)

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)
tensor([[0.1396, 0.4407, 0.0209],
        [0.4998, 0.3605, 0.5077],
        [0.1640, 0.1786, 0.8589],
        [0.5465, 0.2757, 0.2669],
        [0.9443, 0.6355, 0.7412]])


#### 获取tensor的大小

In [11]:
print(y.size())

torch.Size([5, 3])


### 计算操作
#### 加法1(+)

In [12]:
y = torch.rand(5, 3)
print(x + y)

tensor([[1.1089, 1.2746, 1.5135],
        [1.3234, 1.2899, 1.4865],
        [1.5315, 1.1465, 1.1088],
        [1.3619, 1.0314, 1.0876],
        [1.2284, 1.4970, 1.9814]], dtype=torch.float64)


#### 加法2(add)

In [13]:
print(torch.add(x,y))

tensor([[1.1089, 1.2746, 1.5135],
        [1.3234, 1.2899, 1.4865],
        [1.5315, 1.1465, 1.1088],
        [1.3619, 1.0314, 1.0876],
        [1.2284, 1.4970, 1.9814]], dtype=torch.float64)


add 方法提供了一个out参数

In [14]:
result = torch.empty(5, 3)
torch.add(x, y, out=result)
print(result)

tensor([[1.1089, 1.2746, 1.5135],
        [1.3234, 1.2899, 1.4865],
        [1.5315, 1.1465, 1.1088],
        [1.3619, 1.0314, 1.0876],
        [1.2284, 1.4970, 1.9814]])


add: in-place方法 (在原内存替换)

In [15]:
y.add_(x)   #in-place，修改y的值
print(y)

tensor([[1.1089, 1.2746, 1.5135],
        [1.3234, 1.2899, 1.4865],
        [1.5315, 1.1465, 1.1088],
        [1.3619, 1.0314, 1.0876],
        [1.2284, 1.4970, 1.9814]])


Tensor的数据截取，类似于Numpy

In [17]:
print(y[1:,:])

tensor([[1.3234, 1.2899, 1.4865],
        [1.5315, 1.1465, 1.1088],
        [1.3619, 1.0314, 1.0876],
        [1.2284, 1.4970, 1.9814]])


修改tensor的size,Numpy用reshape函数，pytorch用view函数

In [18]:
x = torch.rand(4,4)
y = x.view(16)
z = x.view((-1, 8))
print(x.size(), y.size(), z.size())

torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8])


如果是单个元素的tensor，可以通过item函数,获取到python标量(scalar)

In [20]:
x = torch.rand(1)
print(x)
print(x.item())

tensor([0.8588])
0.8587820529937744


### 与Numpy之间的转换
    torch的tensor和Numpy的ndarray共享的是同一块内存(在cpu模式下)，所以两者是相互影响的。
#### torch的tensor转换到Numpy的Array

In [21]:
a = torch.ones(5)
print(a)

b = a.numpy()
print(b)

a.add_(1)  #tensor a 和 numpy b 共享同一块内存，所以a修改后，b的值也相应修改
print(a)
print(b)

tensor([1., 1., 1., 1., 1.])
[1. 1. 1. 1. 1.]
tensor([2., 2., 2., 2., 2.])
[2. 2. 2. 2. 2.]


Numpy的Array转换到Torch的tensor

In [22]:
import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
print(a)
print(b)

[2. 2. 2. 2. 2.]
tensor([2., 2., 2., 2., 2.], dtype=torch.float64)


#### CUDA
前文说过，Torch的Tensor与Numpy Array的一个区别是可以在GPU上存储，有两种方式：
* tensor创建的时候，就直接申请在cuda device
* tensor通过to函数，放到cuda上

In [23]:
#判断是否支持cuda
if torch.cuda.is_available():
    device = torch.device('cuda')
    y = torch.ones(4,4,device=device)
    x = x.to(device)
    z = x + y
    print(z)
    print(z.to('cpu', dtype=torch.float32))
else:
    print('cuda is invalidate!')

cuda is invalidate!


### autograd(自动求导)
pytorch的核心包是autograd,autograd包提供了tensor自动求导功能。
#### Tensor
    torch.tensor是autograd的核心类，如果将tensor的requires_grad参数设置为True，tensor将会记录所有操作。当计算完成后，tensor调用backward()函数后，会自动计算出tensor的gradient(梯度),并保存到tensor的grad参数下。
    如果需要停止梯度计算的话，调用tensor的detach()函数，从计算图中剥离。另外也可以通过将代码块放在 with torch.no_grad()下，这样代码块中的tensor都不会计算梯度。
    tensor还有一个重要的参数grad_fn。grad_fn是Function函数的实现，每个tensor都有grad_fn，用户创建的tensor的grad_fn为None。
    如果想要计算导数，可以调用tensor的backward()函数，如果tensor是一个标量（scalar)，backward()函数不需要传入任何值；如果tensor包含多个元素，backward()需要设置gradients，参数的size与tensor相同。