In [1]:
from torch import  nn
import torch
from torch import optim
from mlp import MLP

### nn.Model 类

In [2]:
from perception_sequential import Perception


In [3]:
model = Perception(100,10000,10).cuda()
model


Perception(
  (layer): Sequential(
    (0): Linear(in_features=100, out_features=10000, bias=True)
    (1): Sigmoid()
    (2): Linear(in_features=10000, out_features=10, bias=True)
    (3): Sigmoid()
  )
)

In [4]:
input = torch.randn(100).cuda()
output = model(input)
output.shape

torch.Size([10])

## 模型处理
- 2.4.1 网络模型库： torchvision.models (包含以下经典的网络结构和预训练模型）
    - VGG
    - ResNet
    - Inception 等

In [6]:
from torch import nn
from torchvision import models

# 通过torchvision.model 直接调用VGG16的网络结构
vgg = models.vgg16()
# VGG16 的特征层包含13个卷积、13个激活函数ReLu，5个池化，一共31层.注意：这个是特征层
len(vgg.features)

31

In [9]:
# VGG16d 包含3个全连接、2个ReLU、2个Dropout，一共7层
len(vgg.classifier)

7

In [10]:
# 可以通过出现的顺序直接索引每一层
vgg.classifier[-1]

Linear(in_features=4096, out_features=1000, bias=True)

In [13]:
# 也可以选取某一部分，如下代表了特征网络的最后一个卷积模组
vgg.features[24:]

Sequential(
  (24): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (25): ReLU(inplace=True)
  (26): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (27): ReLU(inplace=True)
  (28): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
  (29): ReLU(inplace=True)
  (30): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
)

### 2.4.2 加载预训练模型
- 预训练模型的来因：
    - 对于计算机视觉的任务，包括物体检测，我们通常很难拿到很大的数据集，在这种情况下重新训练一个新的模型是比较复杂的，并且不容易调整
    - 因此，Fine-tune（微调）是一个常用的选择。所谓Fine-tune是指利用别人在一些数据集上训练好的预训练模型，在自己的数据集上训练自己的模型。

In [None]:
# 具体代码
# 第一种： 直接调用别人的预训练模型
vgg = models.vgg16(pretrained=True) # 通过torchvision.vgg16 直接叼用VGG16的网络结构

# 第二种： 叼用自己的本地预训练模型，或是之前训练过的模型
vgg = models.vgg16()
state_dict = torch.load("Your model path")
# 利用load_state_dict,遍历训练模型的关键字，如果出现在了VGG中，则加载预训练参数
# vgg.load_state_dict({k:v for k, v in state_dict_items() if k in vgg.state_dict()})

# 
# 通常来讲，对于不同的检测任务，卷积网络的前两三层的作用是非常类似的，都是提取图像的边缘信息等，因此为了保证模型训练中能够更加稳定，一般会固定预训练网络的前两三个卷积层而不进行参数的学习。例如VGG模型，可以设置前三个卷积模组不进行参数学习，设置方式如下：
# 这里对应的10就包含了前面3个卷积层
# for layer in range(10):
#     for p in vgg[layer].parameters():
#         p.requires_grad = False

### 2.4.3 模型保存
- 代码仅作为说明，不能用于运行


In [1]:
# torch.save({
#     'model' : model.state_dict(),
#     'optimizer:' : optimizer.state_dict(),
#     'model_path' : "Your model path"
# })

## 2.5 数据处理