# 模型保存与加载
- 译文项目：https://pytorch.apachecn.org/2.0/tutorials/beginner/basics/saveloadrun_tutorial
- 原文：https://pytorch.org/tutorials/beginner/basics/saveloadrun_tutorial.html

## 概览

- PyTorch 把模型参数保存在 `state_dict` 中（字典映射层名到张量）。
- 常见流程：保存权重（`model.state_dict()`）→ 建立相同结构的模型 → 加载权重（`load_state_dict`）→ 切换到评估模式（`model.eval()`）。
- 也可以保存完整模型对象（包含结构与参数），但推荐保存 `state_dict` 以便更灵活地重建模型结构。

In [None]:
import torch
import torchvision.models as models

In [None]:
# 示例：加载预训练的 VGG16 模型（会从网络/缓存下载权重）
model = models.vgg16(weights='IMAGENET1K_V1')
print('Loaded model with pretrained weights')

In [None]:
# 保存模型权重到文件
torch.save(model.state_dict(), 'model_weights.pth')
print('Saved model.state_dict() to model_weights.pth')

In [None]:
# 加载权重：先实例化相同结构的模型，再加载 state_dict
untrained_model = models.vgg16()  # 不指定 weights, 创建未训练模型
untrained_model.load_state_dict(torch.load('model_weights.pth'))
untrained_model.eval()
print('Loaded weights into new model and set to eval()')

In [None]:
# 保存完整模型（包含结构与参数）
torch.save(model, 'model_full.pth')
print('Saved full model to model_full.pth')

# 加载
model = models.vgg16()   # 保持结构一致
model.load_state_dict(torch.load('model_weights.pth'))
model.eval()

## 注意事项

- 在推理前调用 `model.eval()`：这会将模型中的 dropout 和 batchnorm 层切换到评估模式，确保一致的输出。
- 加载权重时，请确保模型结构与保存时一致，否则 `load_state_dict` 会报错或部分匹配（可使用 `strict=False`）。
- 当在不同设备间保存/加载（CPU ↔ GPU）时，可使用 `map_location` 参数： `torch.load(PATH, map_location='cpu')`。
- 推荐保存 `state_dict`（更灵活），仅在简短实验或原型时才保存完整模型对象。

## 小结与参考

- 保存/加载模型权重的典型流程是：`torch.save(model.state_dict(), PATH)` → `model = MyModel()` → `model.load_state_dict(torch.load(PATH))` → `model.eval()`。 