## **为什么我们会使用PyTorch来构建深度学习模型？我可以列出三个可能有助于回答这个问题的事情：**
* 易于使用API——它就像python一样简单。
* 支持Python——就像上面所介绍的，Pytorch与python数据科学堆栈平滑集成。它跟numpy非常相似，你可能都没有注意到它们的区别。
* 动态计算图形——Pytorch不是使用特定功能的预定义图形，而是为我们提供了构建计算图形的框架，甚至可以在运行的时候更改它们。这对于我们不知道创建神经网络需要多少内存的情况非常有用。

## **开始使用Pytorch时我们应该知道的主要元素是：**
* Pytorch 张量
* 数学运算
* Autograd 模块
* Optim 模块
* nn 模块

### **Pytorch 张量**  
张量是多维数组。Pytorch中的张量类似于numpy的ndarray，另外张量也可以在GPU上使用。Pytorch支持各种类型的张量。  
在numpy中，array是一个函数，用来创建一个矩阵对象，其用法如下：

In [4]:
import numpy
a = numpy.array(1)
a,type(a)

(array(1), numpy.ndarray)

由此可见，array是一个方法，用于创建一个对象，而ndarray是该对象的类型。

In [9]:
#你可以定义一个简单的一维向量，如下所示：
import torch

# define a tensor
torch.FloatTensor([2]).shape,type(torch.FloatTensor([2]))

(torch.Size([1]), torch.Tensor)

### **张量、标量、向量、标量的区别**

![image.png](attachment:cec21eee-b0f6-4465-9f9f-fc4940ee925f.png)
![image.png](attachment:a3c685fa-e810-4791-bb47-a28be39534f9.png)

那么张量是什么？
标量、向量、矩阵也是张量  
标量是零维的张量  
向量是一维的张量  
矩阵是二位的张量  

![image.png](attachment:46cf0f3d-b9c4-4263-88fe-1dc7cfb8548a.png)

![image.png](attachment:874ba0c7-a906-4b06-b578-032468ece2ab.png)

除此之外，张量还可以是四维的、五维的。

### **数学运算**

与numpy一样，科学计算库能够有效得实现数学函数是非常有效的。Pytorch为你提供了类似的交互界面，你可以在这里使用200多个数学运算。

In [10]:
import torch
matrix = torch.randn(3, 3) #返回一个张量，包含了从标准正态分布（均值为0，方差为1，即高斯白噪声）中抽取的一组随机数。
matrix

tensor([[ 0.2913, -0.9266, -0.7406],
        [ 1.3416, -0.0373, -0.2468],
        [-1.2341,  0.1260,  0.1352]])

### **Autograd 模块**

Pytorch使用了一种自动微分的技术。也就是说，我们有一个记录器记录我们执行过的操作，然后它会将操作往后执行以计算梯度。  
这种技术在构建神经网络时非常有用，因为我们通过计算前向传播本身的参数差异来节省一个周期的时间。

![image.png](attachment:c006b2df-3e32-4847-968a-8fc3790c84a9.png)

In [None]:
from torch.autograd import Variable

x = Variable(train_x)
y = Variable(train_y, requires_grad=False)

### **Optim 模块**

torch.optim是一个实现用于构建神经网络的各种优化算法的模块。已经支持了大多数的常用算法，所以我们可以免去从头开始构建它们的麻烦。  
下面是使用Adam optimizer 的代码：   
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)  

### **nn模块**


Pytorch中的autograd可以很容易定义图形并计算梯度，但原始的autograd对于定义复杂的神经网络来说可能有点过于低级了。这就是nn模块可以提供帮助的地方。  

nn扩展包定义了一组模块，我们可以把它看做成一个能从输入产生输出并且包含一些可训练的权重的神经网络层

### **训练神经网络中经常提到的epoch是什么意思**  

有具体的意思的。epoch可以翻译成“期”。  

比如一共1000个样本，每个样本依次用来训练这个神经网络，当这1000个样本都被用过一遍之后，我们就说完成了一期训练。如果设置epoch=5，意思就是说把这个神经网络进行了五期训练。  

一个epoch就是把整个训练集过一遍。

如果是用sgd的话（每次随机选取样本），每训练1000个随机样本就是一个epoch。