# 01 Pytorch的基本使用
___


In [23]:
import torch 
import torchvision 
import torch.nn as nn
import numpy as np
import torchvision.transforms as transforms

# 1. autograd例子
# create tensors 创建张量

# requires_grad:设置为True是允许精细的排除子图 提高计算效率
x = torch.tensor(1.,requires_grad=True)
w = torch.tensor(2.,requires_grad=True)
b = torch.tensor(3.,requires_grad=True)

# 建立一个计算图
y = w*x + b 

# 计算梯度 
# 疑问：梯度是如何计算的？？？？
y.backward()
print(x.grad)
print(w.grad)
print(b.grad)


tensor(2.)
tensor(1.)
tensor(1.)


In [24]:
# 2. autograd例子

# 创建二维的tensor
# randn 表示从标准正态分布中抽取随机数
x = torch.randn(10,3)
y = torch.randn(10,2)

# 建立一个全连接层
linear = nn.Linear(3,2)
print('w: ',linear.weight)
print('b: ',linear.bias)


w:  Parameter containing:
tensor([[-0.2777, -0.0171, -0.5040],
        [-0.5327,  0.1511, -0.2322]], requires_grad=True)
b:  Parameter containing:
tensor([ 0.2828, -0.4903], requires_grad=True)


### 以上为autograd的两个例子
### 这里nn.linear的具体用法如下：
作用：是对输入的数据进行线性变换 y=wx+b
class torch.nn.Linear(in_features, out_features, bias=True)
参数说明：
    1. in_features : 每个输入样本的大小
    2. out_features: 每个输出样本的大小
    3. bias : 偏置项 默认为True 如果为False，则表示该层不学习偏置项

weight -形状为(out_features  in_features)的模块中可学习的权值
bias -形状为(out_features)的模块中可学习的偏置

In [25]:
# 建立一个损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(linear.parameters(),lr=0.01)
# 前向传播，实际上就是将输入数据喂给神经网络
pred = linear(x)
# 计算损失
loss = criterion(pred,y)
print('loss:',loss.item())
# 反向传播
loss.backward()
print('dw',linear.weight.grad)
print('db',linear.weight.grad)
# 1-step gradient descent
optimizer.step()
pred = linear(x)
loss = criterion(pred,y)
print('梯度下降优化后的损失:',loss.item())


loss: 0.5604697465896606
dw tensor([[ 0.0722, -0.1222, -0.3818],
        [-0.0892,  0.1687, -0.0304]])
db tensor([[ 0.0722, -0.1222, -0.3818],
        [-0.0892,  0.1687, -0.0304]])
梯度下降优化后的损失: 0.557906985282898


以上代码，体现了经过反向传播后的损失得到减小，也就是梯度下降的作用。

### 下面讲解上述代码中出现的具体函数：
1. class torch.nn.MSELoss(size_average=True)
创建一个用来衡量输入数据X与目标Y之间的均方差标准：
$loss(x,y)=\frac{1}{n}\Sigma(x_i-y_i)^2$
    * x,y均为任意形状，每个包含n个元素
    * 如果设置参数size_average = False,则求出的x，y的差的平方和将不会除以n
2. class torch.optim.SGD(params, lr=, momentum=0, dampening=0, weight_decay=0, nesterov=False)
用来实现随机梯度下降算法
    * params 待优化的参数的iterable（类似于这种单词不要试着翻译，直接记住英文，便于理解），或者是预先定义好参数组的dict
    * lr表示学习率
    * 其原参数可选
    

## 例子三 使用numpy加载数据
这里主要讲解numpy和tensor之间的相互转换


In [26]:
import numpy as np
x = np.array([[1,2],[3,4]])
# 将numpy转换成torch tensor
y = torch.from_numpy(x)
print('由numpy转成tensor',y)
z = y.numpy()
print('由tensor转成numpy',z)

由numpy转成tensor tensor([[1, 2],
        [3, 4]])
由tensor转成numpy [[1 2]
 [3 4]]


## 例子四 Input Pipieline

In [27]:
# 下载CIFAR10数据集
train_dataset = torchvision.datasets.CIFAR10(root='/home/wangye/data',
                                            train=True,
                                            transform=transforms.ToTensor(),
                                            download=True)

Files already downloaded and verified


In [28]:
# 获取数据
image , label = train_dataset[0]
print(image.size())
print(label)

torch.Size([3, 32, 32])
6


In [29]:
# 加载数据
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                          batch_size=64,
                                          shuffle=True)
# 迭代之后，队列和线程便开始从文件加载数据
data_iter = iter(train_loader)
# 返回最小批量的数据
images,labels = data_iter.next()
# 正常情况下如何加载数据进行训练呢？
for images , labels in train_loader:
#     此处是详细的训练代码
#     print("训练数据")
    pass


##  函数的讲解：

1. dset.CIFAR10(root, train=True, transform=None,target_transform=None, download=False)
    * root是指定文件的下载路径，在上述代码中我们存储在了“/home/wangye/data”文件夹下。
    * transform代表数据集要转换成什么形式，上述代码中我们转换成了tensor
    * download表示是否下载，如果已经下载，则什么都不干
    * train 表示是不是训练集 True : 训练集 False : 测试集
2. class torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, num_workers=0, collate_fn=<function default_collate>, pin_memory=False, drop_last=False)
    数据加载器，能够在数据集上面提供单进程或多进程的迭代器<br>
    参数：
    * dataset:加载的数据集
    * batch_size:每个batch加载多少个样本
    * shuffle:中文翻译为洗牌，也就是在每个Epoch时期，数据重新打乱
    * num_workers:用多少个子进程加载数据，0表示仅仅使用主进程加载
    * drop_last:如果数据集不能够整除batch_size，设置为True后，则可以删除最后一个不完整的batch，如果设置为False，最后一个不完整的数据集将被丢弃
    
    






## 例子五 加载自定义的数据

In [33]:
class CustomDataset(torch.utils.data.Dataset):
    def __init__(self):
        
#         此处初始化函数,当本类的实例被创建的时候，该方法便会自动执行
#         故此，可以在这里面写自己的初始化操作，然后传递参数
        pass
    def getitem(self,index):
#         这里可以写读数据、预处理、返回数据的操作
        pass

# 下面就和例子四完全一样了
# custom_dataset = CustomDataset()
# train_loader = torch.utils.data.DataLoader(dataset=custom_dataset,
#                                            batch_size=64, 
#                                            shuffle=True)
    
    
        
        

## 例子六 与训练模型


In [39]:
# 下载和加载预训练的网络模型ResNet-18
resnet = torchvision.models.resnet18(pretrained=True)
# 微调网络模型的最顶层
for param in resnet.parameters():
#     print(param)
    param.requires_grad = False

# 替换掉顶端以便微调
resnet.fc = nn.Linear(resnet.fc.in_features,100)

# 向前传递
images = torch.randn(64,3,224,224)
outputs = resnet(images)
print(outputs.size())
    

torch.Size([64, 100])


## 代码讲解：
1. torchvision.models
    * 在这个model中，包含很多模型结构，分别是AlexNet、VGG、ResNet、SqueezeNet、DenseNet
    * pretrained参数设置为True，则为加载在ImageNet上训练好的模型
    
