In [1]:
# 自动计算cell的计算时间
%load_ext autotime

%matplotlib inline
%config InlineBackend.figure_format='svg' #矢量图设置，让绘图更清晰

time: 304 ms (started: 2021-09-05 14:08:13 +08:00)


In [None]:
%%bash

# 增加更新
git add *.ipynb */*.ipynb

git remote -v

git commit -m '更新 #3 Sept 05, 2021'

#git push origin master
git push

在某些情况下，您可能希望跨不同设备保存和加载神经网络。

# 介绍

使用 PyTorch 跨设备保存和加载模型相对简单。 在这个秘籍中，我们将尝试跨 CPU 和 GPU 保存和加载模型。

# 步骤
* 导入所有必要的库以加载我们的数据
* 定义并初始化神经网络
* 保存在 GPU 上，加载到 CPU 上
* 在 GPU 上保存，在 GPU 上加载
* 在 CPU 上保存，在 GPU 上加载
* 保存和加载 DataParallel 模型

1. 导入必要的库来加载我们的数据

对于这个秘籍，我们将使用 torch 及其子模块 torch.nn 和 torch.optim。

In [2]:
import torch
import torch.nn as nn
import torch.optim as optim

time: 685 ms (started: 2021-09-05 14:09:57 +08:00)


2. 定义并初始化神经网络

例如，我们将创建一个用于训练图像的神经网络。 要了解更多信息，请参阅定义神经网络食谱。

In [3]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

net = Net()
print(net)

Net(
  (conv1): Conv2d(3, 6, kernel_size=(5, 5), stride=(1, 1))
  (pool): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)
time: 30.1 ms (started: 2021-09-05 14:10:48 +08:00)


3. 在GPU上保存，加载 CPU

在使用 GPU 训练的 CPU 上加载模型时，将 torch.device('cpu') 传递给 torch.load() 函数中的 map_location 参数。

In [4]:
# 指定保存路径
PATH = "model.pt"

# Save
torch.save(net.state_dict(), PATH)

# Load
device = torch.device('cpu')
model = Net()
model.load_state_dict(torch.load(PATH, map_location=device))

<All keys matched successfully>

time: 15.4 ms (started: 2021-09-05 14:11:39 +08:00)


在这种情况下，张量底层的存储使用 map_location 参数动态重新映射到 CPU 设备。

4. 在 GPU 上保存，在 GPU 上加载

在 GPU 上加载经过训练并保存在 GPU 上的模型时，只需使用 model.to(torch.device('cuda')) 将初始化模型转换为 CUDA 优化模型。

请务必在所有模型输入上使用 .to(torch.device('cuda')) 函数来为模型准备数据。

In [None]:
# Save
torch.save(net.state_dict(), PATH)

# Load
device = torch.device("cuda")
model = Net()
model.load_state_dict(torch.load(PATH))
model.to(device)

5. CPU那个保存，加载 GPU

在 GPU 上加载经过训练并保存在 CPU 上的模型时，将 torch.load() 函数中的 map_location 参数设置为 cuda:device_id。 这会将模型加载到给定的 GPU 设备。

请务必调用 model.to(torch.device('cuda')) 将模型的参数张量转换为 CUDA 张量。

最后，还要确保在所有模型输入上使用 .to(torch.device('cuda')) 函数来为 CUDA 优化模型准备数据。

In [None]:
# Save
torch.save(net.state_dict(), PATH)

# Load
device = torch.device("cuda")
model = Net()
# Choose whatever GPU device number you want
model.load_state_dict(torch.load(PATH, map_location="cuda:0"))
# Make sure to call input = input.to(device) on any input tensors that you feed to the model
model.to(device)

6. 保存 torch.nn.DataParallel 模型

torch.nn.DataParallel 是一个支持并行 GPU 使用的模型包装器。

要一般地保存 DataParallel 模型，请保存 model.module.state_dict()。 这样，您就可以灵活地以任何方式将模型加载到您想要的任何设备上。

In [None]:
# Save
torch.save(net.module.state_dict(), PATH)

# Load to whatever device you want