数据并行处理
--------------

利用DataParallel来使用多GPU


In [None]:
# 将模型放在GPU上

device = torch.device("cuda:0")
model.to(device)

# 复制所有的张量到GPU
# 单纯调用my_tensor.to(device) 只会返回一个复制，而不是重写my_tensor。需要给其分配一个新的张量，并在GPU上使用。
mytensor = my_tensor.to(device)

In [None]:
# 在多GPU上运行

model = nn.DataParalle(model)

引入模块
-----------------


In [2]:
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader

参数
--------------

In [4]:
input_size = 5
output_size = 2

batch_size = 30
data_size = 100

# 设备
device = torch.device("cuda:0" 
                     if torch.cuda.is_available() else "cpu")

# 生成玩具数据
class RandomDataset(Dataset):
    def __init__(self, size, length):
        self.len = length
        self.data = torch.randn(length, size)
        
    def __getitem__(self, index):
        return self.data[index]
    
    def __len__(self):
        return self.len
    
rand_loader = DataLoader(dataset=RandomDataset(input_size, data_size), batch_size=batch_size, shuffle=True)

简单模型
------------------

只是做一个小demo

模型的内容:
- 获得一个输入
- 执行一个线性操作
- 给出一个输出

In [5]:
class Model(nn.Module):
    # our model
    
    def __init__(self, input_size, output_size):
        super(Model, self).__init__()
        self.fc = nn.Linear(input_size, output_size)
        
    def forward(self, input):
        output = self.fc(input)
        print("\tIn Model: input size", input.size(),
             "output size", output.size())
        return output

创建数据 + 数据并行处理
-----------------------
- 首先确定我们有多个GPU
- 用nn.DataParallel包裹我们的模型
- model.to(device)将模型放到多个GPU中


In [None]:
model = Model(input_size, output_size)
if torch.cuda.device_count() > 1:
    print("Let us use", torch.cuda.device_count(), " GPUs!")
    model = nn.DataParallel(model)
    
model.to(device)

In [None]:
总结
-------------

数据并行 会自动拆分你的数据 并将单个数据发送到多个GPU上。

每一个模型都完成自己的任务之后，DataParallel会自动搜集这些数据并将结果返回。