# 1. 网络模型保存(方式一)

第一种方法是保存vgg16整个模型，这会同时保存“模型结果+模型参数”

In [3]:
import torchvision
import torch

vgg16 = torchvision.models.vgg16(pretrained=False)
torch.save(vgg16, "./model/vgg16_method1.pth")  # 保存方式一：模型结构 + 模型参数  

print(vgg16)

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

# 2. 网络模型导入(方式一)

因为我们同时将模型结构和模型参数都保存在了pth文件中了，所以直接torch.load()即可获得model

In [4]:
import torch

model = torch.load("./model/vgg16_method1.pth")  # 保存方式一对应的加载模型

print(model)

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

# 3. 网络模型保存(方式二)

第二种方法则是vgg16.state_dict()，这样的话仅会保存vgg16模型的参数，而不保存模型的网络结构。

In [6]:
import torchvision
import torch

vgg16 = torchvision.models.vgg16(pretrained=False)
torch.save(vgg16.state_dict(), "./model/vgg16_method2.pth")  # 保存方式二：仅保存模型参数（官方推荐），不再保存网络模型结构  

print(vgg16)

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

# 4. 网络模型导入(方式二)

这里，我们仅在pth文件中保存了模型参数，所以直接torch.load()的话，只会得到一个OrderedDict的权重值。

In [7]:
import torch
import torchvision

model = torch.load("./model/vgg16_method2.pth")  # 导入模型参数

print(model)

OrderedDict([('features.0.weight', tensor([[[[-0.0614,  0.0060,  0.0894],
          [-0.0568, -0.0307, -0.0981],
          [ 0.0724,  0.0579,  0.0302]],

         [[-0.0610, -0.0309, -0.0323],
          [ 0.0390,  0.0306,  0.0067],
          [-0.1225,  0.0532,  0.0606]],

         [[-0.1396, -0.0278,  0.0215],
          [ 0.0327,  0.0603, -0.0905],
          [-0.1055,  0.0174, -0.1139]]],


        [[[-0.0140,  0.0979, -0.0988],
          [ 0.0031,  0.0544, -0.0463],
          [ 0.0785, -0.0141, -0.0283]],

         [[ 0.0606,  0.0677, -0.0176],
          [ 0.0286, -0.0782, -0.0021],
          [-0.0144,  0.0246, -0.0092]],

         [[-0.0033, -0.0167,  0.0914],
          [ 0.0647, -0.0615, -0.0128],
          [ 0.0430, -0.1075,  0.0017]]],


        [[[-0.0006,  0.0023, -0.0590],
          [-0.0143, -0.0473,  0.0593],
          [-0.0142, -0.0404,  0.0908]],

         [[ 0.0876, -0.0393, -0.1139],
          [ 0.0368,  0.0460,  0.0621],
          [-0.1057, -0.0183,  0.0261]],

         

而为了得到模型的话，我们则需要先得到一个模型，然后再使用load_state_dict()方法，将权重值赋予给这个模型。

In [8]:
import torch
import torchvision

vgg16 = torchvision.models.vgg16(pretrained=False)
print(vgg16)

vgg16.load_state_dict(torch.load("./model/vgg16_method2.pth"))  # 将模型参数导入到模型结构中   
print(vgg16)

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

# 5. 网络陷阱-创建模型

In [9]:
import torch
from torch import nn

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        self.conv1 = nn.Conv2d(3, 64, kernel_size=3)
        
    def forward(self,x):
        x = self.conv1(x)
        return x

tudui = Tudui()
torch.save(tudui, "./model/tudui_method1.pth")

# 6. 网络陷阱-失败加载模型

① 点击 Kernel，再点击 Restart。

![image.png](attachment:image.png)

② 再运行下面的代码，即下面为第1个代码块运行，无法直接导入网络模型。（即使pth中保存了模型结构&模型参数，在没看到模型结构的定义的情况下，仍然无法读到具体的结构？）

In [1]:
import torch

model = torch.load("./model/tudui_method1.pth")  # 无法直接加载方式一保存的网络结构

print(model)

AttributeError: Can't get attribute 'Tudui' on <module '__main__'>

# 7. 网络陷阱-成功加载模型(方式一)

In [3]:
import torch
from torch import nn

# 确保网络模型是我们想要的网络模型,要在加载前还写明网络模型
class Tudui(nn.Module):
    def __init__(self):
        super(Tudui,self).__init__()
        self.conv1 = nn.Conv2d(3,64,kernel_size=3)
        
    def forward(self,x):
        x = self.conv1(x)
        return x

# tudui = Tudui()  # 不需要写这一步，不需要创建网络模型    
model = torch.load("./model/tudui_method1.pth")  # 无法直接加载方式一保存的网络结构    
print(model)

Tudui(
  (conv1): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1))
)


# 8. 网络陷阱-成功加载模型(方式二)

In [None]:
import torch
from model_save import *  # 它就相当于把 model_save.py 里的 Tudui 的网络模型定义写到这里了

#tudui = Tudui() # 不需要写这一步，不需要创建网络模型    
model = torch.load("tudui_method1.pth")
print(model)