# CUDA 基础 - 简单例子

PyTorch 生成对抗式网络编程, 2020

In [1]:
import torch
import numpy

## Numpy 与 Python 的计算比较

numpy 的矩阵计算比 Python 快了 1500 倍

In [2]:
# 方阵大小
size = 600

a = numpy.random.rand(size, size)
b = numpy.random.rand(size, size)

In [3]:
%%timeit

x = numpy.dot(a,b)

2.77 ms ± 23.1 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [11]:
# 方阵大小
c = numpy.zeros((size,size))

In [12]:
%%timeit

for i in range(size):
  for j in range(size):
    for k in range(size):
      c[i,j] += a[i,k] * b[k,j]
    pass
  pass

1min 41s ± 1.43 s per loop (mean ± std. dev. of 7 runs, 1 loop each)


## GPU 上的张量

In [5]:
# 创建 GPU 上的张量

x = torch.cuda.FloatTensor([3.5])
x.type()

'torch.cuda.FloatTensor'

In [6]:
# 检查 GPU 上的张量
x.device

device(type='cuda', index=0)

In [7]:
# 计算 GPU 上的张量

y = x * x
print("y=", y)

y= tensor([12.2500], device='cuda:0')


## CUDA 的性能

In [8]:
# 基于 Numpy 创建 GPU 上的张量

aa = torch.cuda.FloatTensor(a)
bb = torch.cuda.FloatTensor(b)

In [9]:
%%timeit

cc = torch.matmul(aa, bb)

43.9 µs ± 12 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)


## 标准的 CUDA 检查与设置

In [10]:
# 检查 CUDA 是否可用
# 如果“可用”，设置默认地创建张量在 CUDA 上

if torch.cuda.is_available():
  torch.set_default_tensor_type(torch.cuda.FloatTensor)
  print("using cuda:", torch.cuda.get_device_name(0))
  pass

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

print("device=" + str(device))

using cuda: GeForce GTX 1650
device=cuda
