# Pytorch가 무엇인가요?

Python 기반의 과학 연산 패키지로 다음과 같은 두 집단을 대상으로 합니다.

- NumPy를 대체하면서 GPU를 이용한 연산이 필요한 경우
- 최대한의 유연성과 속도를 제공하는 딥러닝 연구 플랫폼이 필요한 경우

## 시작하기

### Tensors

Tensor는 NumPy의 ndarray와 유사할 뿐만 아니라, GPU를 사용한 연산 가속도 지원합니다.

In [2]:
from __future__ import print_function

In [3]:
import torch

초기화되지 않은 5x3 행렬을 생성합니다.

In [4]:
x = torch.empty(5, 3)
print(x)

tensor([[0.0000e+00, 2.5244e-29, 0.0000e+00],
        [2.5244e-29, 3.0297e+32, 2.7224e+20],
        [7.7782e+31, 4.7429e+30, 1.3818e+31],
        [1.7225e+22, 1.4602e-19, 1.8617e+25],
        [1.1835e+22, 4.3066e+21, 6.3828e+28]])


무작위로 초기화된 행렬을 생성합니다.

In [5]:
x = torch.rand(5,3)
print(x)

tensor([[0.7105, 0.5969, 0.6207],
        [0.4683, 0.8589, 0.0301],
        [0.9791, 0.6474, 0.2552],
        [0.3531, 0.2616, 0.5579],
        [0.2712, 0.2643, 0.0545]])


dtype이 long이고 0으로 채워진 행렬을 생성합니다.

In [6]:
x = torch.zeros(5,3, dtype = torch.long)
print(x)

tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])


데이터로부터 바로 tensor를 생성합니다.

In [7]:
x = torch.tensor([5.5,3])
print(x)

tensor([5.5000, 3.0000])


또는, 존재하는 tensor를 바탕으로 tensor를 만듭니다. <br/>
이 메소드(method)들은 dtype과 같이 사용자로부터 제공된 새로운 값이 없는 한 입력 tensor의 속성을 재사용합니다. <br/>
여기서 존재하는 tensor란 x를 뜻합니다.

In [8]:
x = x.new_ones(5, 3, dtype=torch.double)   
print(x)

x = torch.randn_like(x, dtype=torch.float)
print(x)  

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)
tensor([[-2.3764, -0.4111, -0.7546],
        [ 0.0776, -0.5445, -0.0701],
        [-0.0879, -0.6916,  0.9081],
        [-1.5886, -0.1284,  0.1053],
        [-0.0255, -1.3231, -0.0927]])


행렬의 크기를 구합니다.

In [9]:
print(x.size())

torch.Size([5, 3])


torch.Size 는 튜플(tuple)과 같으며, 모든 튜플 연산에 사용할 수 있습니다.

## Operations

덧셈: 문법1

In [10]:
y = torch.rand(5, 3)
print(x)
print(y)
print(x + y)

tensor([[-2.3764, -0.4111, -0.7546],
        [ 0.0776, -0.5445, -0.0701],
        [-0.0879, -0.6916,  0.9081],
        [-1.5886, -0.1284,  0.1053],
        [-0.0255, -1.3231, -0.0927]])
tensor([[0.3123, 0.0662, 0.9234],
        [0.4455, 0.1787, 0.8989],
        [0.9434, 0.6533, 0.9075],
        [0.4844, 0.2479, 0.0406],
        [0.1043, 0.7565, 0.0442]])
tensor([[-2.0641, -0.3449,  0.1688],
        [ 0.5231, -0.3658,  0.8289],
        [ 0.8554, -0.0383,  1.8157],
        [-1.1042,  0.1195,  0.1459],
        [ 0.0788, -0.5665, -0.0485]])


덧셈: 문법2

In [11]:
print(torch.add(x, y))

tensor([[-2.0641, -0.3449,  0.1688],
        [ 0.5231, -0.3658,  0.8289],
        [ 0.8554, -0.0383,  1.8157],
        [-1.1042,  0.1195,  0.1459],
        [ 0.0788, -0.5665, -0.0485]])


덧셈: 결과 tensor를 인자로 제공

In [12]:
result = torch.empty(5, 3)
print(result)
# reult는 결과 tensor로 x와 y를 더한 결과를 인자에 대입
torch.add(x, y, out=result)
print(result)

tensor([[ 0.0000e+00,  2.5244e-29, -3.3851e-11],
        [-2.0005e+00,  3.6523e-01,  8.2886e-01],
        [ 8.5544e-01,  3.8300e-02,  1.8157e+00],
        [ 1.1042e+00,  1.1948e-01,  1.4587e-01],
        [ 7.8813e-02,  5.6654e-01,  4.8467e-02]])
tensor([[-2.0641, -0.3449,  0.1688],
        [ 0.5231, -0.3658,  0.8289],
        [ 0.8554, -0.0383,  1.8157],
        [-1.1042,  0.1195,  0.1459],
        [ 0.0788, -0.5665, -0.0485]])


덧셈: 바꿔치기(In-place) 방식

In [13]:
# y에 x 더하기
y.add_(x)
print(y)

tensor([[-2.0641, -0.3449,  0.1688],
        [ 0.5231, -0.3658,  0.8289],
        [ 0.8554, -0.0383,  1.8157],
        [-1.1042,  0.1195,  0.1459],
        [ 0.0788, -0.5665, -0.0485]])


NumPy의 인덱싱 표기 방법을 사용할 수도 있습니다.

In [14]:
print(x)
print(x[:,1])
print(x[0:2,1])

tensor([[-2.3764, -0.4111, -0.7546],
        [ 0.0776, -0.5445, -0.0701],
        [-0.0879, -0.6916,  0.9081],
        [-1.5886, -0.1284,  0.1053],
        [-0.0255, -1.3231, -0.0927]])
tensor([-0.4111, -0.5445, -0.6916, -0.1284, -1.3231])
tensor([-0.4111, -0.5445])


크기 변경: tensor의 크기(size)나 모양(shape)을 변경하고 싶을 때, torch.view 를 사용합니다.

In [15]:
x = torch.randn(4, 4)
y = x.view(16)
z = x.view(-1, 8)  # 사이즈가 -1인 경우 다른 차원들을 사용하여 유추합니다.
print(x.size(), y.size(), z.size())

torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8])


만약 tensor에 하나의 값만 존재한다면, .item() 을 사용하면 숫자 값을 얻을 수 있습니다.

In [16]:
x = torch.randn(1)
print(x)
print(x.item())

tensor([0.1216])
0.12158923596143723


## Numpy 변환 (Bridge)

Torch Tensor를 NumPy 배열(array)로 변환하거나, 그 반대로 하는 것은 매우 쉽습니다.

Torch Tensor와 NumPy 배열은 저장 공간을 공유하기 때문에, 하나를 변경하면 다른 하나도 변경됩니다.

### Torch Tensor를 NumPy 배열로 변환하기

In [17]:
a = torch.ones(5)
print(a)

tensor([1., 1., 1., 1., 1.])


In [18]:
b = a.numpy() # Tensor를 numpy로 변환
print(b)

[1. 1. 1. 1. 1.]


In [19]:
a.add_(1)
print(a)
print(b)

tensor([2., 2., 2., 2., 2.])
[2. 2. 2. 2. 2.]


### NumPy 배열을 Torch Tensor로 변환하기

NumPy(np) 배열을 변경하면 Torch Tensor의 값도 자동 변경

In [20]:
import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
np.add(a, 1, out=a)
print(a)
print(b)

[2. 2. 2. 2. 2.]
tensor([2., 2., 2., 2., 2.], dtype=torch.float64)


CharTensor를 제외한 CPU 상의 모든 Tensor는 NumPy로의 변환을 지원하며, (NumPy에서 Tensor로의) 반대 변환도 지원합니다.

## CUDA Tensors

.to 메소드를 사용하여 Tensor를 어떠한 장치로도 옮길 수 있습니다.

In [42]:
# 이 코드는 CUDA가 사용 가능한 환경에서만 실행합니다.
# ``torch.device`` 를 사용하여 tensor를 GPU 안팎으로 이동해보겠습니다.
if torch.cuda.is_available():
    device = torch.device("cuda")          # CUDA 장치 객체(Device Object)로
    y = torch.ones_like(x, device=device)  # GPU 상에 바로(directly) tensor를 생성하거나
    x = x.to(device)                       # 단지 ``.to("cuda")`` 라고만 작성하면 됩니다.
    z = x + y
    print(z)
    print(z.to("cpu", torch.double))       # ``.to`` 는 dtype도 함께 변경합니다!