# 텐서
텐서는 배열이나 행렬과 매우 유사한 특수한 자료구조입니다. PyTorch에서는 텐서를 사용하여 모델의 입력과 출력, 그리고 모델의 매개변수들을 부호화(decode)합니다.

텐서는 GPU나 다른 하드웨어 가속기에서 실행할 수 있다는 점만 제외하면 Numpy의 ndarray와 유사합니다. 실제로 텐서와 ndarray는 종종 동일한 내부(underly) 메모리를 공유할 수 있어 데이터를 여럿 만들 필요가 없습니다. 텐서는 또한 자동 미분(automatic differentiation)에 최적화되어있습니다. ndarray에 익숙하다면 Tensor API를 바로 사용할 수 있을 것입니다.

In [1]:
import torch
import numpy as np

## 텐서 초기화
텐서는 여러가지 방법으로 초기화할 수 있습니다.

### 직접 생성하기
데이터의 자료형은 자동으로 유추합니다.

In [2]:
data = [[1, 2], [3, 4]]
x_data = torch.tensor(data)

### Numpy 배열로부터 생성하기

In [3]:
np_array = np.array(data)
x_np = torch.from_numpy(np_array)

### 다른 텐서로부터 생성하기
명시적으로 재정의(override)하지 않는다면, 인자로 주어진 텐서의 속성(모양, 자료형)을 유지합니다.

In [4]:
x_ones = torch.ones_like(x_data) # x_data의 속성을 유지합니다.
print(f'Ones Tensor: \n {x_ones} \n')

x_rand = torch.rand_like(x_data, dtype=torch.float)  # x_data의 속성을 덮어씁니다
print(f'Random Tensor: \n {x_rand} \n')

Ones Tensor: 
 tensor([[1, 1],
        [1, 1]]) 

Random Tensor: 
 tensor([[0.5769, 0.4251],
        [0.2936, 0.1371]]) 



### 무작위 또는 상수값을 사용하기 ( random or constant )
shape은 텐서의 차원을 나타내는 튜플로, 아래 함수들에서는 출력 텐서의 차원을 결정합니다.

In [7]:
shape = (2, 3,)
rand_tensor = torch.rand(shape)
ones_tensor = torch.ones(shape)
zeros_tensor = torch.zeros(shape)

print(f'Random Tensor : \n{rand_tensor} \n')
print(f'Ones Tensor : \n{ones_tensor} \n')
print(f'Zeros Tensor : \n{zeros_tensor} \n')

Random Tensor : 
tensor([[0.0460, 0.2060, 0.3166],
        [0.9046, 0.0855, 0.9277]]) 

Ones Tensor : 
tensor([[1., 1., 1.],
        [1., 1., 1.]]) 

Zeros Tensor : 
tensor([[0., 0., 0.],
        [0., 0., 0.]]) 



## 텐서의 속성 ( Attribute )
텐서의 속성은 텐서의 모양(shape), 자료형(datatype) 및 어느 장치에 저장되는지를 나타냅니다.

In [9]:
tensor = torch.rand(3, 4)

print(f'shape of tensor : {tensor.shape}')
print(f'datatype of tensor : {tensor.dtype}')
print(f'Device tensor is stored on : {tensor.device}')

shape of tensor : torch.Size([3, 4])
datatype of tensor : torch.float32
Device tensor is stored on : cpu


## 텐서 연산 ( Operation )
전치(transposing), 인덱싱(indexing), 슬라이싱(slicing), 수학 계산, 선형 대수, 임의 샘플링 등 100가지 텐서 연산들은 https://pytorch.org/docs/stable/torch.html 에서 확인할 수 있습니다

각 연산들은(일반적으로) GPU에서 실행할 수 있습니다. Colab에서는 Notebook Settings에서 GPU를 할당할 수 있습니다.

기본적으로 텐서는 CPU에 생성되니다. .to 메서드를 사용하면 (GPU의 가용성을 확인한 뒤) GPU로 텐서를 명시적으로 이동할 수 있습니다. 장치들 간에 큰 텐서들을 복사하는 것은 시간과 메모리 측면에서 비용이 많이 든다는 것을 기억해야합니다. 

In [10]:
# GPU가 존재하면 텐서를 이동합니다.
if torch.cuda.is_available():
    tensor = tensor.to('cuda')

Numpy와 유사한 방식으로 몇몇 텐서 연산을 시도해보겠습니다.

In [14]:
tensor = torch.ones(4, 4)
print(tensor, '\n')
tensor[:, 1] = 0
print(tensor, '\n')
tensor[1, :] = 0
print(tensor)

tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]]) 

tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]]) 

tensor([[1., 0., 1., 1.],
        [0., 0., 0., 0.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])


<font color=green>__텐서 합치기__</font> torch.cat을 사용하여 주어진 차원에 따라 일련의 텐서를 연결할 수 있습니다. torch.cat과 미묘하게 다른 결합 연산인 torch.stack도 실습해봅니다.

In [24]:
# 0 = x = row // row단위로 해당 텐서들을 합침 ( 차원은 그대로 )
t0 = torch.cat([tensor, tensor, tensor], dim=0)
print(t0)
print(t0.shape)

tensor([[1., 0., 1., 1.],
        [0., 0., 0., 0.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [0., 0., 0., 0.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [0., 0., 0., 0.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])
torch.Size([12, 4])


In [25]:
# 1 = y = col // col단위로 해당 텐서들을 합침 ( 차원은 그대로 )
t1 = torch.cat([tensor, tensor, tensor], dim=1)
print(t1)
print(t1.shape)

tensor([[1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.]])
torch.Size([4, 12])


In [27]:
# 해당 텐서들을 개수만큼 새로운 차원의 요소로 합침
## (4, 4) 크기 tensor 3개를 묶으면 (3, 4, 4)
t2 = torch.stack([tensor, tensor, tensor])
print(t2)
print(t2.shape)

tensor([[[1., 0., 1., 1.],
         [0., 0., 0., 0.],
         [1., 0., 1., 1.],
         [1., 0., 1., 1.]],

        [[1., 0., 1., 1.],
         [0., 0., 0., 0.],
         [1., 0., 1., 1.],
         [1., 0., 1., 1.]],

        [[1., 0., 1., 1.],
         [0., 0., 0., 0.],
         [1., 0., 1., 1.],
         [1., 0., 1., 1.]]])
torch.Size([3, 4, 4])


In [22]:
t3 = torch.stack([t2, t2])
print(t3)
print(t3.shape)

tensor([[[[1., 0., 1., 1.],
          [0., 0., 0., 0.],
          [1., 0., 1., 1.],
          [1., 0., 1., 1.]],

         [[1., 0., 1., 1.],
          [0., 0., 0., 0.],
          [1., 0., 1., 1.],
          [1., 0., 1., 1.]],

         [[1., 0., 1., 1.],
          [0., 0., 0., 0.],
          [1., 0., 1., 1.],
          [1., 0., 1., 1.]]],


        [[[1., 0., 1., 1.],
          [0., 0., 0., 0.],
          [1., 0., 1., 1.],
          [1., 0., 1., 1.]],

         [[1., 0., 1., 1.],
          [0., 0., 0., 0.],
          [1., 0., 1., 1.],
          [1., 0., 1., 1.]],

         [[1., 0., 1., 1.],
          [0., 0., 0., 0.],
          [1., 0., 1., 1.],
          [1., 0., 1., 1.]]]])
torch.Size([2, 3, 4, 4])


## 산술 연산

In [35]:
# 두 텐서 간의 행렬 곱(matrix multiplication)을 계산합니다. y1, y2, y3은 모두 같은 값을 갖습니다.
y1 = tensor @ tensor.T    
# 행렬곱(예시)은 4x3 * 3x2 = 4x2가 나온다. 
# (a의 ncol과 b의 nrow가 같음을 가정하므로 행렬변환 T를 적용함 )
y2 = tensor.matmul(tensor.T)

y3 = torch.rand_like(y1)
torch.matmul(tensor, tensor.T, out=y3)
print(y1)

# 요소별 곱(element-wise product)을 계산합니다. z1, z2, z3는 모두 같은 값을 갖습니다.
z1 = tensor * tensor
z2 = tensor.mul(tensor)

z3 = torch.rand_like(tensor)
torch.mul(tensor, tensor, out=z3)
print(z1)

tensor([[3., 0., 3., 3.],
        [0., 0., 0., 0.],
        [3., 0., 3., 3.],
        [3., 0., 3., 3.]])
tensor([[1., 0., 1., 1.],
        [0., 0., 0., 0.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])


In [34]:
tensor @ y1

tensor([[9., 0., 9., 9.],
        [0., 0., 0., 0.],
        [9., 0., 9., 9.],
        [9., 0., 9., 9.]])

단일-요소(single-element) 텐서
- 텐서의 모든 값을 하나로 집계(aggregate)하여 요소가 하나인 텐서의 경우, item()을 사용하여 Python 숫자 값으로 변환할 수 있습니다. 

In [36]:
agg = tensor.sum()
agg_item = agg.item()
print(agg_item, type(agg_item))

9.0 <class 'float'>


__바꿔치기(in_place) 연산__ 연산 결과를 피연산자(operand)에 저장하는 연산을 바꿔치기 연산이라고 부르며, \_ 접미사를 갖습니다. 예를 들어: x.copy_(y)나 x.t_()는 x를 변경합니다.

In [37]:
print(tensor, '\n')
tensor.add_(5)
print(tensor)

tensor([[1., 0., 1., 1.],
        [0., 0., 0., 0.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]]) 

tensor([[6., 5., 6., 6.],
        [5., 5., 5., 5.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.]])


In [38]:
tensor @ tensor

tensor([[133., 115., 133., 133.],
        [115., 100., 115., 115.],
        [133., 115., 133., 133.],
        [133., 115., 133., 133.]])

## Numpy 변환 ( Bridge )
CPU 상의 텐서와 Numpy 배열은 메모리 공간을 공유하기 때문에, 하나를 변경하면 다른 하나도 변경됩니다.
### 텐서를 Numpy 배열로 변환하기

In [39]:
t = torch.ones(5)
print(f't: {t}')
n = t.numpy()
print(f'n: {n}')

t: tensor([1., 1., 1., 1., 1.])
n: [1. 1. 1. 1. 1.]


텐서에 수정을 가하면, 같은 메모리 공간을 공유하는 ndarray도 값이 수정됨.

In [40]:
t.add_(2)
print(t)
print(n)

tensor([3., 3., 3., 3., 3.])
[3. 3. 3. 3. 3.]


### Numpy 배열을 텐서로 변환하기


In [43]:
n = np.ones(5)
t = torch.from_numpy(n)
print(n, '\n', t)

[1. 1. 1. 1. 1.] 
 tensor([1., 1., 1., 1., 1.], dtype=torch.float64)


텐서를 수정하면 넘파이배열의 값이 바뀐 것과 마찬가지로,

넘파이배열에 수정을 가하면 텐서 또한 수정됩니다.

In [44]:
np.add(n, 2, out=n)
print(n, '\n', t)

[3. 3. 3. 3. 3.] 
 tensor([3., 3., 3., 3., 3.], dtype=torch.float64)
