In [9]:
import torch
from torch import nn
from torch.nn import functional as F

# 一、加载和保存张量
x = torch.arange(4)
"""
单个张量可以直接调用load和save函数读写,
两个函数都要提供一个名称，
save要将保存的变量作为输入
"""
torch.save(x,'tensor-x-file')
print(f"x:{x}")
x2 = torch.load('tensor-x-file')
print(f"x2:{x2}")
torch.save([x,x2],'x-list') # 储存一个张量列表,之后将他们读取回内存
x3,x4 = torch.load('x-list')
print(f"x3,x4:{x3} {x4}")
mydict = {'x':x, 'x2' : x2}
torch.save(mydict, 'tensor-dict') # 写入-读取从字符串映射到张量的字典(当要读取或写入模型中的所有权重时很方便)
mydict2 = torch.load('tensor-dict')
print(f"mydict2:{mydict2}")

# 二、加载和保存模型参数
"""
深度学习框架提供了内置函数来保存和加载整个网络
需要注意的一个重要细节是，这将保存模型的参数而不是保存整个模型。
例如,如果有一个3层多层感知机,需要单独指定架构。
因为模型本身可以包含任意代码，所以模型本身难以序列化。
因此，为了恢复模型，需要用代码生成架构，然后从磁盘加载参数
"""
class MLP(nn.Module):
    def __init__(self):
        super().__init__()
        self.hidden = nn.Linear(20,256)
        self.output = nn.Linear(256,10)

    def forward(self, X):
        return self.output(F.relu(self.hidden(X)))
    
net = MLP()
X = torch.randn(size = (2,20))
Y = net(X)
torch.save(net.state_dict(), 'mlp-params') # 将模型的参数字典储存
clone = MLP() # 实例化原始模型的备份
clone.load_state_dict(torch.load('mlp-params')) # 读取文件中储存的参数
Y_clone = clone(X)
print(Y_clone == Y) # 结果验证 两个示例有相同的参数 输入相同的X时 结果相同

x:tensor([0, 1, 2, 3])
x2:tensor([0, 1, 2, 3])
x3,x4:tensor([0, 1, 2, 3]) tensor([0, 1, 2, 3])
mydict2:{'x': tensor([0, 1, 2, 3]), 'x2': tensor([0, 1, 2, 3])}
tensor([[True, True, True, True, True, True, True, True, True, True],
        [True, True, True, True, True, True, True, True, True, True]])
