In [1]:
import torch
import torchvision.models as models

In [None]:
'''Saving and Loading Model weights'''
model = models.vgg16(weights = 'IMAGENET1K_V1')
torch.save(model.state_dict(), 'model_weights.pth')

# Note:
# Pytorch的模型回想学习到的参数存储在一个内部的状态字典中，这个字典叫做state_dict,可以通过
# torch.load()函数来保存

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to C:\Users\Yuanwei Li/.cache\torch\hub\checkpoints\vgg16-397923af.pth
100.0%


In [None]:
model = models.vgg16() #创建未训练的模型，主要是创建模型结构
model.load_state_dict(torch.load('model_weights.pth', weights_only= True))
model.eval()

# Note：
# (1)为了加载模型的权重，首先要创建一个与保存模型时，相同模型的实例，
# 接着再调用model.load_state_dict()函数加载模型的参数
# (2)在调用load_state_dict()加载模型的参数时，将weight_only设置为True的目的是将反序列化过程中执行
# 的函数限制为仅仅加载权重所需的那些函数。weights_only被视为最佳的加载模型的设置。

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

In [None]:
#除了刚才这种仅仅保存模型的参数权重，然后创建一个空的模型实例来加载权重的方式
#还有一种更为简单的方式，那就是再保存模型的时候，除了保存模型的参数以外，还将模型的结构一并
# 保存，这样在加载的时候就可以直接加载，而无需先实例化一个空的模型结构了。
# Note：但是这种方式不推荐，因为需要的空间太大
torch.save(model, "model.pth") #在保存的时候，Python使用pickle来序列化模型，因此在加载模型的时候需要实际的类的定义。

model = torch.load('model.pth', weights_only = False) #设置为False是因为还要加载模型的结构


# 本节的内容在第一节的最后也有记录，可以对比学习