# 基础知识

## 1. PyTorch基础

### 1.1 Tensor(张量)
多维矩阵，可以看作可以在GPU上运行的numpy数组

In [1]:
import torch
import numpy as np
torch.__version__

'0.4.0'

|表达形式|数据类型|
|-|-|
|torch.Tensor|32位浮点型|
|torch.FloatTensor|32位浮点型|
|torch.DoubleTensor|64位浮点型|
|torch.shortTensor|16位整型|
|torch.IntTensor|32位整型|
|torch.LongTensor|64位整型|

In [2]:
# 创建torch向量
a = torch.Tensor([[2, 3], [4, 8], [7, 9]])   # 默认的是torch.FloatTensor
print('1.Tensor a is:\n', a)
print('2.a shape is:', a.size(), a.shape)    # 可以使用两个方法输出size
print('3.a type is:', type(a))

1.Tensor a is:
 tensor([[ 2.,  3.],
        [ 4.,  8.],
        [ 7.,  9.]])
2.a shape is: torch.Size([3, 2]) torch.Size([3, 2])
3.a type is: <class 'torch.Tensor'>


In [3]:
b = torch.LongTensor([[2, 3], [4, 8], [7, 9]])
print('1.Tensor b is:\n', b)
print('3.a type is:', type(b))

1.Tensor b is:
 tensor([[ 2,  3],
        [ 4,  8],
        [ 7,  9]])
3.a type is: <class 'torch.Tensor'>


In [4]:
# 创建零向量
c = torch.zeros([3,2])   # 3*2的零向量
print('1.Tensor c is:\n', c)

1.Tensor c is:
 tensor([[ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]])


In [5]:
# 创建符合高斯分布的随机数据
d = torch.randn([3,2])
print('1.Tensor d is:\n', d)

1.Tensor d is:
 tensor([[-0.6465, -2.5047],
        [ 0.9487, -0.7823],
        [-1.8339,  0.5540]])


In [6]:
a = torch.Tensor([[2, 3], [4, 8], [7, 9]]) 
print('1.Tensor a is:\n', a)
a[0, 1] = 77      # a[0][1] = 77，两种方式都可以进行数组元素的改写
print('2.Tensor new a is:\n', a)

1.Tensor a is:
 tensor([[ 2.,  3.],
        [ 4.,  8.],
        [ 7.,  9.]])
2.Tensor new a is:
 tensor([[  2.,  77.],
        [  4.,   8.],
        [  7.,   9.]])


In [7]:
# torch.Tensor和numpy.array之间互相转换
a = torch.Tensor([[2, 3], [4, 8], [7, 9]]) 
# print('0.{} a is:\n{}'.format(type(a), a))
numpy_a = a.numpy()            # 转换为numpy的数组
print('1.convert Tensor to {} is:\n{}'.format(type(numpy_a), numpy_a))
numpy_e = np.array([[1,2,3],[4,5,6]])
# print('2.{} e is:\n{}'.format(type(numpy_e), numpy_e))
e = torch.from_numpy(numpy_e)   # 转换为pytorch的Tensor
print('2.from numpy to {} is:\n{}'.format(type(e), e))
f_torch_e = e.float()           # pytorch的Tensor类型转换为float
print('3.{} is:\n{}'.format(type(f_torch_e), f_torch_e))

1.convert Tensor to <class 'numpy.ndarray'> is:
[[2. 3.]
 [4. 8.]
 [7. 9.]]
2.from numpy to <class 'torch.Tensor'> is:
tensor([[ 1,  2,  3],
        [ 4,  5,  6]], dtype=torch.int32)
3.<class 'torch.Tensor'> is:
tensor([[ 1.,  2.,  3.],
        [ 4.,  5.,  6.]])


In [8]:
# pytorch支持GPU
a = torch.Tensor([[2, 3], [4, 8], [7, 9]])
if torch.cuda.is_available():
    a_cuda = a.cuda()
    print(a_cuda)

小结:
- `torch变量.numpy()` pytorch的tensor转换为numpy的array
- `torch.from_numpy(numpy变量)` numpy的array转换为pytorch的tensor
- `torch变量.X类型()` pytorch的tensor转换为相应的X类型

### 1.2 Variable(变量)
Variable与Tensor类似，但Variable会放到计算图中，然后进行前向传播、后向传播和自动求导

|属性|作用|
|-|-|
|data|Variable里的tensor数值|
|grad|Variable的反向传播梯度|
|grad_fn|得到Variable的操作|

In [9]:
# 1. 对标量求导
from torch.autograd import Variable
# 创建变量，求导需要传入requires_grad参数，默认为False
x = Variable(torch.Tensor([2]), requires_grad=True)   # Tensor变为Variable
w = Variable(torch.Tensor([3]), requires_grad=True)
b = Variable(torch.Tensor([4]), requires_grad=True)

# 构建计算图
y = w * x + b

# 计算梯度
y.backward()   # 对所有需要梯度的变量求导，标量求导不需要参数

# 输出梯度
print('1.输出梯度')
print('x的梯度:', x.grad)
print('w的梯度:', w.grad)
print('b的梯度:', b.grad)

1.输出梯度
x的梯度: tensor([ 3.])
w的梯度: tensor([ 2.])
b的梯度: tensor([ 1.])


In [10]:
# 2. 对矩阵求导
x = torch.randn([3])
x = Variable(x, requires_grad=True)
y = x * 2
print('1.向量y:', y)
y.backward(torch.FloatTensor([1, 0.1, 0.01]))  # 1*梯度 0.1*梯度 0.01*梯度
print('2.x的梯度:', x.grad)     # x.grad的维度由[1, 0.1, 0.01]的维度决定
# x = torch.randn([3])
x = Variable(x, requires_grad=True)
y = x * 2
y.backward(torch.Tensor([[1, 0.1], [0.01, 0.001]]))
print('3.x的梯度:', x.grad)

1.向量y: tensor([ 2.1190, -1.3343, -1.5958])
2.x的梯度: tensor([ 2.0000,  0.2000,  0.0200])
3.x的梯度: tensor([[ 2.0000,  0.2000],
        [ 0.0200,  0.0020]])


小结:
- `y = x * 2`中x梯度的维度由`y.backward(Tensor))`中Tensor的维度决定

### 1.3 Dataset(数据集)
进行数据的读取和预处理

In [11]:
#继承和重写该类后可以定义自己的数据读取类
from torch.utils.data import Dataset
import pandas as pd
class myDataset(Dataset):     # 继承于Dataset类
    def __init__(self, csv_file, txt_file, root_dir, other_file):
        self.csv_data = pd.read_csv(csv_file)           # 读取csv文件
        with open(txt_file, 'r') as f:
            self.txt_data = f.readlines()                # 读取txt文件
        self.root_dir = root_dir
    # 自定义的类需要定义__len__和__getitem__
    def __len__(self):          
        return len(self.csv_data)
    def __getitem__(self, idx):
        data = (self.csv_data[idx], self.txt_data[idx])  # 数据和标签
        return data

数据读取常用**迭代器**来实现batch数据读取、shuffle和多线程操作

In [12]:
from torch.utils.data import DataLoader
# collate_fn表示如何读取样本
dataiter = DataLoader(myDataset, batch_size=32, shuffle=True, collate_fn=None)

torchvision中的ImageFolder类常用来处理图像，数据存放形式如下:

root/dog/xxx.png

root/cat/xxx.png

In [None]:
from torchvision.datasets import ImageFolder
# transfor是图像增强，loader是图像读取的方法
dset = ImageFolder(root='root_path', transform=None, loader=None)

### 1.4 nn.Module(模组)
torch.nn包含所有的层结构和损失函数，网络结构定义完成后相当于建立了计算图，每次使用该结构，都是在进行相同的前向传播，PyTorch可以自动求导

In [None]:
# 网络结构模板
import torch.nn as nn
# 定义网络结构
class net_name(nn.Module):
    def __init__(self, other_arguments):
        super().__init__()      # super(net_name, self).__init__()也可以
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size)
        # other network layer
    def forward(self, x):
        x = self.conv1(x)
        return x
# 损失函数
criterion = nn.CrossEntropyLoss()     # 返回的是一个函数
loss = criterion(output, target)      # 传入参数并调用该函数

### 1.5 torch.optim(优化)
通过迭代使损失函数逐渐变小，传入的参数必须是Variable

In [None]:
# 定义优化器
optimizer = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
# 优化方法
optimizer.zeros()    # 将梯度归零
loss.backward()      # 误差方向传播
optimizer.step()     # 通过梯度进一步更新参数

### 1.6 模型的保存和加载
1. 保存模型的结构和参数信息
2. 保存模型的参数

In [None]:
torch.save(model, './model.pth')                     # 保存模型结构和参数
torch.save(model.state_dict(), './model_state.pth')  # 仅保存模型参数

In [None]:
load_model = torch.load('model.pth')   # 加载模型的结构和参数
# 如果仅导入模型参数，需要结构已知
load_model = mymodel.load_state_dict(torch.load('./model_state.pth')) 