## 读取和存储

### 读写
我们可以直接使用$save$函数和$load$函数分别存储和读取$Tensor$。$save$使用$Python$的$pickle$实用程序将对象进行序列化，然后将序列化的对象保存到$disk$，使用$save$可以保存各种对象,包括模型、张量和字典等。而$laod$使用$pickle$ $unpickle$工具将$pickle$的对象文件反序列化为内存。

In [1]:
import torch
from torch import nn

x = torch.ones(3)
torch.save(x, 'D:\\x.pt')

In [2]:
x1 = torch.load('D:\\x.pt')
x1

tensor([1., 1., 1.])

In [3]:
y = torch.zeros(4)
torch.save([x, y], 'D:\\xy.pt')
xy_lst = torch.load('D:\\xy.pt')
xy_lst

[tensor([1., 1., 1.]), tensor([0., 0., 0., 0.])]

In [4]:
torch.save({'x':x, 'y':y}, 'D:\\xy_dict.pt')
xy = torch.load('D:\\xy_dict.pt')
xy

{'x': tensor([1., 1., 1.]), 'y': tensor([0., 0., 0., 0.])}

### 读写模型
$state\_dict$是一个从参数名称隐射到参数$Tesnor$的字典对象。

In [5]:
class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        self.hidden = nn.Linear(3, 2)
        self.act = nn.ReLU()
        self.output = nn.Linear(2, 1)
        
    def forward(self, x):
        a = self.act(self.hidden(x))
        return self.output(a)

net = MLP()
net.state_dict()

OrderedDict([('hidden.weight', tensor([[ 0.3414, -0.1283, -0.1883],
                      [ 0.2042, -0.3281, -0.4847]])),
             ('hidden.bias', tensor([ 0.1204, -0.5167])),
             ('output.weight', tensor([[0.0209, 0.0625]])),
             ('output.bias', tensor([0.0171]))])

注意，只有具有可学习参数的层(卷积层、线性层等)才有$state\_dict$中的条目。优化器$(optim)$也有一个$state\_dict$，其中包含关于优化器状态以及所使用的超参数的信息。

In [6]:
optimizer = torch.optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
optimizer.state_dict()

{'state': {},
 'param_groups': [{'lr': 0.001,
   'momentum': 0.9,
   'dampening': 0,
   'weight_decay': 0,
   'nesterov': False,
   'params': [1612452479984, 1612452480128, 1612452480200, 1612452480272]}]}

**保存和加载模型**
PyTorch中保存和加载训练模型有两种常见的方法:
+ 仅保存和加载模型参数(state_dict)
+ 保存和加载整个模型

**保存和加载state_dict(推荐方式)**

保存：

torch.save(modle.state_dict(), PATH)

加载：

modle = torch.load(PATH)

In [7]:
X = torch.randn(2,3)
Y = net(X)

PATH = "D:\\net.pt"
torch.save(net.state_dict(), PATH)

net1 = MLP()
net1.load_state_dict(torch.load(PATH))
Y1 = net1(X)
# net1和net参数一样所以输出结果一样
Y1 == Y

tensor([[1],
        [1]], dtype=torch.uint8)

+ 通过save函数和load函数可以很方便地读写Tensor。
+ 通过save函数和load_state_dict函数可以很方便地读写模型的参数。