# 5.6. GPU
## 5.6.1. 计算设备
指定用于存储和计算的设备，如CPU和GPU。默认情况下，张量是在内存中创建的，然后使用CPU计算它。

In [2]:
import torch
torch.device("cpu"), torch.device('cuda'), torch.device('cuda:1')

(device(type='cpu'), device(type='cuda'), device(type='cuda', index=1))

CUDA 11.1.114<br>
[torch-GPU版本安装](https://blog.csdn.net/qq_44707910/article/details/118096577)

In [3]:
# 查询可用gpu的数量
torch.cuda.device_count()
# 有无可用gpu
torch.cuda.is_available()


True

这里定义了两个方便的函数， 这两个函数允许我们在不存在所需所有GPU的情况下运行代码

In [4]:
def try_gpu(i = 0):
    '''如果存在，则返回gpu(i)，否则返回cpu()'''
    if torch.cuda.device_count() >= i + 1:
        return torch.device(f"cuda:{i}")
    return torch.device('cpu')
def try_all_gpu():
    '''返回所有可用的GPU，如果没有GPU，则返回[cpu(),]'''
    devices = [ torch.device(f"cuda:{i}") for i in range(torch.cuda.device_count())]
    return devices if devices else [torch.device('cpu')]
try_gpu(), try_gpu(10), try_all_gpu()

(device(type='cuda', index=0),
 device(type='cpu'),
 [device(type='cuda', index=0)])

## 5.6.2. 张量与GPU
查询张量所在的设备。 默认情况下，张量是在CPU上创建的。
无论何时我们要对多个项进行操作， 它们都必须在同一个设备上。

In [6]:
x = torch.Tensor([1, 2, 3])
x.device

device(type='cpu')

### 5.6.2.1. 存储在GPU上
通过执行device属性在GPU上创建张量。

In [7]:
x = torch.ones(2, 3, device=try_gpu())
x

tensor([[1., 1., 1.],
        [1., 1., 1.]], device='cuda:0')

### 5.6.2.2. 复制
将张量从一个位置移动到另一位置。不经意地移动数据可能会显著降低性能。

In [9]:
z = x.cuda(1) # 本机只有一个GPU，移动会报错
z

RuntimeError: Invalid device, must be cuda device

## 5.6.3. 神经网络与GPU
神经网络模型可以指定设备。 下面的代码将模型参数放在GPU上。
只要所有的数据和参数都在同一个设备上， 我们就可以有效地学习模型

In [10]:
net = torch.nn.Sequential(torch.nn.Linear(3, 1))
net = net.to(device = try_gpu())
net(x)

tensor([[1.2034],
        [1.2034]], device='cuda:0', grad_fn=<AddmmBackward>)