# 模型的保存与加载
主要用到的时`torch.save()`方法

In [1]:
import torch
import torchvision.models as models

# 保存与加载模型参数
可以将模型参数保存到一个状态字典中，叫做`state_dict`,可以使用`torch.save()`方法。


In [2]:
model = models.vgg16(pretrained=True)
torch.save(model.state_dict(), 'model_weights.pth')

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to /root/.cache/torch/hub/checkpoints/vgg16-397923af.pth


  0%|          | 0.00/528M [00:00<?, ?B/s]

加载模型需要创建一个一模一样的模型来承载这些参数。然后使用`load_state_dict()`方法。

In [3]:
model = models.vgg16() # we do not specify pretrained=True, i.e. do not load default weights
model.load_state_dict(torch.load('model_weights.pth'))
model.eval()

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

> 一定要在推断之前调用model.eval()方法，将dropout和批处理规范化层设置为评估模式。如果不这样做，将产生不一致的推断结果。
说白了，就是加载完模型之后，要执行`eval`方法

# 存储整个模型类
上面只是存储了模型的参数，要使用的话还必须创建一个相同的类来承载这些参数。实际过程中，可能想要存储整个模型网络，既包括参数，也包括整个模型的结构。要存储整个模型的话，就将整个模型作为参数传递给`save()`函数即可。

In [4]:
# 存储
torch.save(model, 'model.pth')
# 加载
model = torch.load('model.pth')

> 这是依赖于python的`pickle`模块做的序列化，所以实际的网络结构，就是以存储的网络结构为准。