# CUDA 기본 - 간단한 예제

GAN 첫걸음, 2020

In [0]:
import torch
import numpy

## Numpy와 파이썬 비교

In [0]:
# 정사각형 행렬의 크기
size = 600

a = numpy.random.rand(size, size)
b = numpy.random.rand(size, size)

In [0]:
%%timeit

x = numpy.dot(a,b)

100 loops, best of 3: 13.2 ms per loop


In [0]:
%%timeit

c = numpy.zeros((size,size))

for i in range(size):
  for j in range(size):
    for k in range(size):
      c[i,j] += a[i,k] * b[k,j]
    pass
  pass

1 loop, best of 3: 3min 20s per loop


## GPU에서 텐서 이용

In [0]:
# GPU에서 텐서 생성

x = torch.cuda.FloatTensor([3.5])
x.type()

'torch.cuda.FloatTensor'

In [0]:
# 텐서가 GPU에 설정되어 있는지 확인
x.device

device(type='cuda', index=0)

In [0]:
# GPU를 통해 텐서 계산

y = x * x
y

tensor([12.2500], device='cuda:0')

## CUDA 성능

In [0]:
# numpy 행렬로부터 cuda 텐서 생성

aa = torch.cuda.FloatTensor(a)
bb = torch.cuda.FloatTensor(b)

In [0]:
%%timeit

cc = torch.matmul(aa, bb)

The slowest run took 29.97 times longer than the fastest. This could mean that an intermediate result is being cached.
10000 loops, best of 3: 74.6 µs per loop


## 일반적인 CUDA 설정과 확인 코드

In [0]:
# CUDA가 이용가능한지 확인
# 가능하다면, 기본 텐서 타입을 cuda에 설정

if torch.cuda.is_available():
  torch.set_default_tensor_type(torch.cuda.FloatTensor)
  print("using cuda:", torch.cuda.get_device_name(0))
  pass

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

device

using cuda: Tesla P100-PCIE-16GB


device(type='cuda')