In [3]:
import torch
from torch import nn
"""
在PyTorch中,CPU和GPU可以用torch.device('cpu') 和torch.device('cuda')表示。
应该注意的是,cpu设备意味着所有物理CPU和内存,这意味着PyTorch的计算将尝试使用所有CPU核心。
然而,gpu设备只代表一个卡和相应的显存。
如果有多个GPU,使用torch.device(f'cuda:{i}') 来表示第i块GPU(i从0开始)。(cuda:0和cuda是等价的。)
"""
print(f"avaliable GPU:{torch.cuda.device_count()}") # 查询可用的GPU数量
def try_gpu(i=0):
    # 如果存在,返回gpu(i), 否则返回cpu()
    if torch.cuda.device_count() >= i+1:
        return torch.device(f'cuda:{i}')
    return torch.device('cpu')

def try_all_gpus():
    # 返回所有可用的GPU,如果没有GPU则返回 [cpu()]
    devices = [torch.device(f'cuda:{i}') for i in range(torch.cuda.device_count())]
    return devices if devices else [torch.device('cpu')]
# print(try_gpu())
# print(try_gpu(10))
# print(try_all_gpus())


# 张量与GPU
"""
可用张量的.device方法查询张量所在设备(默认在CPU上创建)
需要注意的是,无论何时要对多个项进行操作,它们都必须在同一个设备上。
例如,如果对两个张量求和,需要确保两个张量都位于同一个设备上

注意:
不经意地移动数据可能会显著降低性能。一个典型的错误如下:计算GPU上每个小批量的损失,
并在命令行中将其报告给用户(或将其记录在NumPy ndarray中)时,将触发全局解释器锁,从而使所有GPU阻塞。
最好是为GPU内部的日志分配内存,并且只移动较大的日志。
"""
x = torch.tensor([1,2,3])
print(f"x.device:{x.device}")

# 在GPU上创建张量
x = torch.ones(size=(2,3), device=try_gpu())
print(f"x.device:{x.device}")

# 将模型置于GPU上
net = nn.Sequential(nn.Linear(3,1))
net = net.to(device=try_gpu()) # 当输入为GPU上的张量时,模型将在同一GPU上计算结果。
print(net[0].weight.data.device)

avaliable GPU:1
x.device:cpu
x.device:cuda:0
cuda:0
