# How to use GPU

같은 device의 Tensor끼리만 연산이 가능하다!

In [1]:
import torch
import torch.nn as nn

## Convert to CUDA tensor: cuda()

- GPU에서 Tensor를 연산하는 방법
- 고전적인 방식(현재는 to() 사용)

In [2]:
x = torch.cuda.FloatTensor(2, 2)

x

tensor([[0., 0.],
        [0., 0.]], device='cuda:0')

In [3]:
x = torch.FloatTensor(2, 2)

x

tensor([[-4.4256e-10,  4.5685e-41],
        [-4.4256e-10,  4.5685e-41]])

In [4]:
# CPU to GPU(0번)
x.cuda()

tensor([[-4.4256e-10,  4.5685e-41],
        [-4.4256e-10,  4.5685e-41]], device='cuda:0')

In [5]:
# device 지정(cpu도 지정 가능)
d = torch.device('cuda:0')

In [6]:
# 지정된 device로 tensor값 보내기
x.cuda(device=d)

tensor([[-4.4256e-10,  4.5685e-41],
        [-4.4256e-10,  4.5685e-41]], device='cuda:0')

In [7]:
# cuda()의 경우, move가 아니라 copy 방식
# x는 그대로 있고, 새로운 메모리에 allocation되는 것
# 그렇기에 x는 원래 있던 cpu에 존재하는 것을 확인할 수 있음
x.device

device(type='cpu')

## Convert to CUDA tensor: to()

- GPU에서 Tensor를 연산하는 방법
- 그나마 최근 방식

In [8]:
x.to(device=d)

tensor([[-4.4256e-10,  4.5685e-41],
        [-4.4256e-10,  4.5685e-41]], device='cuda:0')

## Convert to CPU tensor from CUDA tensor

In [9]:
x = torch.cuda.FloatTensor(2, 2)

In [10]:
x = x.cpu() # 고전 방식 -> x.to(device=torch.device("cpu"))

In [11]:
d = torch.device('cpu')
x = x.to(d)

## Move model from CPU to GPU.

In [12]:
def print_params(model):
    for p in model.parameters():
        print(p)

In [13]:
linear = nn.Linear(2, 2)

print_params(linear)

Parameter containing:
tensor([[ 0.5782,  0.4288],
        [-0.0220, -0.1614]], requires_grad=True)
Parameter containing:
tensor([0.6881, 0.0907], requires_grad=True)


In [14]:
linear = linear.cuda() # 'linear = ' 이렇게 받아주지 않아도 gpu로 넘어가게 됨

print_params(linear)

Parameter containing:
tensor([[ 0.5782,  0.4288],
        [-0.0220, -0.1614]], device='cuda:0', requires_grad=True)
Parameter containing:
tensor([0.6881, 0.0907], device='cuda:0', requires_grad=True)


In [15]:
linear = linear.cpu()

print_params(linear)

Parameter containing:
tensor([[ 0.5782,  0.4288],
        [-0.0220, -0.1614]], requires_grad=True)
Parameter containing:
tensor([0.6881, 0.0907], requires_grad=True)


In [16]:
d = torch.device('cuda:0')
linear = linear.to(d)

print_params(linear)

Parameter containing:
tensor([[ 0.5782,  0.4288],
        [-0.0220, -0.1614]], device='cuda:0', requires_grad=True)
Parameter containing:
tensor([0.6881, 0.0907], device='cuda:0', requires_grad=True)


Note that nn.Module class does not have 'device' property.

In [17]:
# nn.Module을 상속받은 모델 객체들은 device를 알 수 없다.(properties 제공 X)
linear.device

AttributeError: 'Linear' object has no attribute 'device'

- 그렇다면 알 수 있는 방법은 없을까?

p = next(model.parameters(1)) Weight 가중치<br>
p.device

## Tricks

z = x + y
- 만약 y는 cpu에 존재하는데, x를 모를 경우는?
    - case1<br>
    if x.device =="cpu":<br>
        ~<br>
    else<br>
    - case2<br>
    아래 참고

In [18]:
x = torch.cuda.FloatTensor(2, 2)

In [19]:
x.new(2, 2) # x와 같은 float타입이면서, 같은 device에 있는 특정 사이즈의 Tensor

tensor([[2.3694e-38, 1.2422e-01],
        [1.4013e-45, 0.0000e+00]], device='cuda:0')

In [20]:
torch.zeros_like(x) # x와 같은 device이면서, 같은 size인 0 Vector

tensor([[0., 0.],
        [0., 0.]], device='cuda:0')

In [21]:
torch.ones_like(x) # x와 같은 device이면서, 같은 size인 1 Vector

tensor([[1., 1.],
        [1., 1.]], device='cuda:0')

In [22]:
list(linear.parameters())[0].new(2, 2)

tensor([[1., 1.],
        [1., 1.]], device='cuda:0')