# *CUDA Tensor*

##### *GPU를 사용하려면 텐서를 GPU 메모리에 할당해야 함*
##### *NVIDIA에서 만든 NVIDIA GPU를 활용한 CUDA API를 사용해 GPU를 활용할 수 있음*
##### *PyTorch는 타입을 유지하면서 텐서를 CPU에서 GPU로 전송하여 CUDA 텐서를 쉽게 만들 수 있음*

In [7]:
import torch

In [8]:
torch.cuda.is_available()

True

In [9]:
# 권장 코드
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"device : {device}")

device : cuda


In [10]:
def describe(x):
    print("타입 : {}".format(x.type()))
    print("크기: {}".format(x.shape))
    print("값: \n{}".format(x))

In [11]:
x = torch.rand(3, 3).to("cuda")
describe(x)

타입 : torch.cuda.FloatTensor
크기: torch.Size([3, 3])
값: 
tensor([[0.2288, 0.1592, 0.4996],
        [0.4689, 0.6059, 0.4918],
        [0.7515, 0.4747, 0.5686]], device='cuda:0')


In [13]:
# gpu에 할당된 tensor와 cpu에 할당된 tensor는 연산 처리를 할 수 없음
y = torch.rand(3, 3)
x + y

RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

In [14]:
cpu_device = torch.device("cpu")
y = y.to(cpu_device)
x = x.to(cpu_device)
describe(x + y)

타입 : torch.FloatTensor
크기: torch.Size([3, 3])
값: 
tensor([[0.6441, 1.0405, 1.4588],
        [0.4856, 1.2149, 0.5057],
        [1.5877, 1.3205, 0.9237]])


# 

### *GPU가 여러 대 일 때, 할당 방법*

In [None]:
CUDA_VISIBLE_DEVICES=0,1 python3 main.py

# 