在 PyTorch 中，通常只保存模型的参数（权重和偏置等）到.pt或.pth文件，而不保存完整的计算图结构。这是因为 PyTorch 采用动态计算图机制，计算图是在运行时动态构建的，而模型的结构定义通常包含在代码中。

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim

# 定义模型结构（这部分保存在代码中，不会被序列化到.pt文件）
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc1 = nn.Linear(10, 20)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(20, 2)
        
    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

# 创建模型实例
model = SimpleModel()

# 模拟训练过程
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 假设我们进行了一些训练步骤...
# ...

# 只保存模型参数（这是PyTorch的常规做法）
torch.save(model.state_dict(), 'model_parameters.pt')

当我们需要加载模型时，必须先在代码中定义相同的模型结构，然后再加载参数：

In [2]:
# 必须先定义相同的模型结构
# class SimpleModel(nn.Module):
#     def __init__(self):
#         super(SimpleModel, self).__init__()
#         self.fc1 = nn.Linear(10, 20)
#         self.relu = nn.ReLU()
#         self.fc2 = nn.Linear(20, 2)
        
#     def forward(self, x):
#         x = self.fc1(x)
#         x = self.relu(x)
#         x = self.fc2(x)
#         return x

# 创建模型实例
model = SimpleModel()

# 加载保存的参数
model.load_state_dict(torch.load('model_parameters.pt'))
model.eval()  # 设置为评估模式

  model.load_state_dict(torch.load('model_parameters.pt'))


SimpleModel(
  (fc1): Linear(in_features=10, out_features=20, bias=True)
  (relu): ReLU()
  (fc2): Linear(in_features=20, out_features=2, bias=True)
)

In [3]:
import torch

# 假设我们有之前保存的model_parameters.pt文件
# 加载参数文件
params = torch.load('model_parameters.pt')

# 查看数据类型（通常是字典）
print(type(params))  # 输出: <class 'dict'>

# 查看字典中的键（模型层名称）
print("参数键列表:", list(params.keys()))
# 输出可能类似: ['fc1.weight', 'fc1.bias', 'fc2.weight', 'fc2.bias']

# 查看某个参数的值（张量）
print("\nfc1层的权重形状:", params['fc1.weight'].shape)  # 输出: torch.Size([20, 10])
print("fc1层的偏置形状:", params['fc1.bias'].shape)      # 输出: torch.Size([20])

<class 'collections.OrderedDict'>
参数键列表: ['fc1.weight', 'fc1.bias', 'fc2.weight', 'fc2.bias']

fc1层的权重形状: torch.Size([20, 10])
fc1层的偏置形状: torch.Size([20])


  params = torch.load('model_parameters.pt')
