# Tensor Manipulation 텐서 연산

* 텐서에 관한 기본적인 연산을 합니다.
* 1차원, 2차원, 3차원 이상 벡터를 다룰 수 있습니다.
* 벡터, 행렬, 텐서로 부릅니다.

## Imports 파이썬 패키지 가져오기

In [1]:
import numpy as np
import torch

넘파이와 torch 패키지를 불러옵니다.  
이때 import numpy as np 의미는 'numpy를 불러오는 데 'np'라는 이름으로 부르겠다!'는 의미입니다.

## NumPy Review 넘파이 복습

**Numpy** 는 기본적인 선형 대수 개념에서 많이 사랑받는 패키지입니다.  
대부분 c++로 제작되어 속도도 빠르고 안정적입니다. 

### 1D Array with NumPy 넘파이를 활용한 1차원 배열

In [3]:
t = np.array([0., 1., 2., 3., 4., 5., 6.])
print(t)

[0. 1. 2. 3. 4. 5. 6.]


np.array() 함수 안에 리스트 형태로 값을 입력합니다.  
이렇게 되면 우리는 t 라는 인스턴스를 만들 수 있습니다. 출력은 print() 함수를 사용합니다.

$\begin{pmatrix} 0 & 1 & 2 & 3 & 4 & 5 & 6 \end{pmatrix}$  



In [4]:
print('Rank  of t: ', t.ndim)
print('Shape of t: ', t.shape)

Rank  of t:  1
Shape of t:  (7,)


하나의 리스트를 입력하였으므로 1차원입니다.  
1차원 배열은 보통 수학에서 Vector 벡터로 정의합니다.  
shape 함수를 통해 1차원 배열 안에 7개 원소가 있다고 알 수 있습니다.  

In [4]:
print('t[0] t[1] t[-1] = ', t[0], t[1], t[-1]) # Element
print('t[2:5] t[4:-1]  = ', t[2:5], t[4:-1])   # Slicing
print('t[:2] t[3:]     = ', t[:2], t[3:])      # Slicing

t[0] t[1] t[-1] =  0.0 1.0 6.0
t[2:5] t[4:-1]  =  [2. 3. 4.] [4. 5.]
t[:2] t[3:]     =  [0. 1.] [3. 4. 5. 6.]


#### 원소별 접근 방법
* 원소 하나에 접근할 때는  t[인덱스]를 사용합니다.  
파이썬은 인덱스를 0부터 시작합니다. 
* 연속적인 여러 개 원소를 접근할 때는 slicing 슬라이싱을 활용합니다.
주의할 점은 t[2:5]라면 2번째 인덱스부터 4번째(5 -1) 인덱스까지를 말합니다.   
즉, 마지막 인덱스 -1번째 까지 접근합니다.
* 공백 표기는 처음 혹은 마지막에 한번에 접근할 때 유용합니다.

### 2D Array with NumPy 넘파이를 활용한 2차원 배열

2차원 배열은 수학에서 행렬 matrix으로 자주 사용합니다.

In [5]:
t = np.array([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.], [10., 11., 12.]])
print(t)

[[ 1.  2.  3.]
 [ 4.  5.  6.]
 [ 7.  8.  9.]
 [10. 11. 12.]]


In [6]:
print('Rank  of t: ', t.ndim)
print('Shape of t: ', t.shape)

Rank  of t:  2
Shape of t:  (4, 3)


이번에는 크기가 $4 \times 3$ 행렬이 나옵니다.  
Rank는 2이므로 2차원임을 알 수 있습니다.

$\begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ 7 & 8 & 9 \\ 10 & 11 & 12 \end{pmatrix}$

## PyTorch is like NumPy 넘파이처럼 사용하는 파이토치

### 1D Array with PyTorch 파이토치를 활용한 1차원 배열

In [5]:
t = torch.FloatTensor([0., 1., 2., 3., 4., 5., 6.])
print(t)

tensor([0., 1., 2., 3., 4., 5., 6.])


In [6]:
print(t.dim())  # rank
print(t.shape)  # shape
print(t.size()) # shape
print(t[0], t[1], t[-1])  # Element
print(t[2:5], t[4:-1])    # Slicing
print(t[:2], t[3:])       # Slicing

1
torch.Size([7])
torch.Size([7])
tensor(0.) tensor(1.) tensor(6.)
tensor([2., 3., 4.]) tensor([4., 5.])
tensor([0., 1.]) tensor([3., 4., 5., 6.])


**torch.FloatTensor()** 와 함께라면 어떤 배열이든 두렵지 않군요.  
$\begin{pmatrix} 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7 \end{pmatrix}$  

### 2D Array with PyTorch 파이토치를 활용한 2차원 배열

In [7]:
t = torch.FloatTensor([[1., 2., 3.],
                       [4., 5., 6.],
                       [7., 8., 9.],
                       [10., 11., 12.]
                      ])
print(t)

tensor([[ 1.,  2.,  3.],
        [ 4.,  5.,  6.],
        [ 7.,  8.,  9.],
        [10., 11., 12.]])


In [8]:
print(t.dim())  # rank
print(t.size()) # shape
print(t[:, 1])
print(t[:, 1].size())
print(t[:, :-1])

2
torch.Size([4, 3])
tensor([ 2.,  5.,  8., 11.])
torch.Size([4])
tensor([[ 1.,  2.],
        [ 4.,  5.],
        [ 7.,  8.],
        [10., 11.]])


자, 이쯤되면 기억해야겠죠? 배열을 만드는 방법!
* Numpy  
np.array(리스트)
* Pytorch  
torch.FloatTensor(리스트)

$\begin{pmatrix} 1 & 2 & 3\\ 4 & 5 & 6 \\ 7 & 8 & 9 \\ 10 & 11 & 12 \end{pmatrix}$

### Shape, Rank, Axis 모양, 랭크, 축 만들기

In [9]:
t = torch.FloatTensor([[[[1, 2, 3, 4],
                         [5, 6, 7, 8],
                         [9, 10, 11, 12]],
                       [[13, 14, 15, 16],
                        [17, 18, 19, 20],
                        [21, 22, 23, 24]]
                       ]])

In [10]:
print(t.dim())  # rank  = 4
print(t.size()) # shape = (1, 2, 3, 4)

4
torch.Size([1, 2, 3, 4])


* Rank 수학에서 보통 차원의 수를 의미합니다.(열벡터 혹은  행벡터 수로도 표현합니다.)
    * Numpy : t.ndim
    * PyTorch : t.dim()
* Shape는 파이토치에서 size로 활용합니다.
    * Numpy : t.shape
    * PyTorch : t.size()

## Frequently Used Operations in PyTorch

### Mul vs. Matmul

In [13]:
print()
print('-------------')
print('Mul vs Matmul')
print('-------------')
m1 = torch.FloatTensor([[1, 2], [3, 4]])
m2 = torch.FloatTensor([[1], [2]])
print('Shape of Matrix 1: ', m1.shape) # 2 x 2
print('Shape of Matrix 2: ', m2.shape) # 2 x 1
print(m1.matmul(m2)) # 2 x 1

m1 = torch.FloatTensor([[1, 2], [3, 4]])
m2 = torch.FloatTensor([[1], [2]])
print('Shape of Matrix 1: ', m1.shape) # 2 x 2
print('Shape of Matrix 2: ', m2.shape) # 2 x 1
print(m1 * m2) # 2 x 2
print(m1.mul(m2))


-------------
Mul vs Matmul
-------------
Shape of Matrix 1:  torch.Size([2, 2])
Shape of Matrix 2:  torch.Size([2, 1])
tensor([[ 5.],
        [11.]])
Shape of Matrix 1:  torch.Size([2, 2])
Shape of Matrix 2:  torch.Size([2, 1])
tensor([[1., 2.],
        [6., 8.]])
tensor([[1., 2.],
        [6., 8.]])


* MatMul : Matrix multiplication
    * 일반적인 행렬의 곱셈입니다.
    * R에서는 %*% 생각하면 편하겠습니다.  
    
 ```python
    행렬1.matmul(행렬2)
 ```
 
    $\begin{pmatrix} 1 & 2\\ 3 & 4 \end{pmatrix} \times \begin{pmatrix}  1  \\ 2 \end{pmatrix} = \begin{pmatrix} 5 & 1 \end{pmatrix}$
* Mul : Multiplication
    * 행렬의 크로네커 곱셈을 생각하면 편합니다.
    * 대응되는 원소끼리 곱합니다. 
 
 ```python
    행렬1 * 행렬2
    행렬1.mul(행렬2)  
 ```
 
    $\begin{pmatrix} 1 & 2\\ 3 & 4 \end{pmatrix} \times \begin{pmatrix}  1  \\ 2 \end{pmatrix} = \begin{pmatrix} 1 & 2 \\ 6 & 8 \end{pmatrix}$

### Broadcasting

<div class="alert alert-warning">
    Broadcasting 브로드캐스트는 디버그하기 어렵게 만듭니다. 주의를 요합니다.
</div>

브로드 캐스트를 사용하면 그 크기가 같지 않은 두 배열을 같게 만들어줍니다.  
즉, 행렬과 스칼라 / 벡터의 연산을 가능하게 해줍니다. 바로 같은 값을 복제해서 말이죠!

In [14]:
# Same shape
m1 = torch.FloatTensor([[3, 3]])
m2 = torch.FloatTensor([[2, 2]])
print(m1 + m2)

tensor([[5., 5.]])


같은 크기의 행렬은 덧셈이 쉽죠. 수학에서는 원칙으로 입니다.  
    $\begin{pmatrix} 3 & 3 \end{pmatrix} + \begin{pmatrix}  2 & 2 \end{pmatrix} = \begin{pmatrix} 5 & 5 \end{pmatrix}$

In [15]:
# Vector + scalar
m1 = torch.FloatTensor([[1, 2]])
m2 = torch.FloatTensor([3]) # 3 -> [[3, 3]]
print(m1 + m2)

tensor([[4., 5.]])


벡터와 스칼라 더할 때, 브로드캐스트 기능을 통해 3 스칼라를 (3,3) 벡터로 만들어서 더해줍니다. 복제하는 거죠.  
    $\begin{pmatrix} 1 & 2 \end{pmatrix} + \begin{pmatrix}  3 \end{pmatrix}   
    \Rightarrow  \begin{pmatrix} 1 & 2 \end{pmatrix} + \begin{pmatrix}  3  & 3\end{pmatrix} = \begin{pmatrix} 5 & 5 \end{pmatrix}$

In [55]:
# 2 x 1 Vector + 1 x 2 Vector
m1 = torch.FloatTensor([[1, 2]])
m2 = torch.FloatTensor([[3], [4]])
print(m1 + m2)

tensor([[4., 5.],
        [5., 6.]])


$\begin{pmatrix} 1 & 2 \end{pmatrix} + \begin{pmatrix}  3 \end{pmatrix} + \begin{pmatrix}  4 \end{pmatrix}  
\Rightarrow \begin{pmatrix} 1 & 2 \\ 1 & 2 \end{pmatrix} + \begin{pmatrix}  3  & 3 \\ 4 & 4 \end{pmatrix} = \begin{pmatrix} 4 & 5 \\ 5 & 6 \end{pmatrix}$

### Mean

In [18]:
t = torch.FloatTensor([1, 2])
print(t.mean())

tensor(1.5000)


In [19]:
# Can't use mean() on integers
t = torch.LongTensor([1, 2])
try:
    print(t.mean())
except Exception as exc:
    print(exc)

Can only calculate the mean of floating types. Got Long instead.


You can also use `t.mean` for higher rank tensors to get mean of all elements, or mean by particular dimension.

In [20]:
t = torch.FloatTensor([[1, 2], [3, 4]])
print(t)

tensor([[1., 2.],
        [3., 4.]])


In [21]:
print(t.mean())
print(t.mean(dim=0))
print(t.mean(dim=1))
print(t.mean(dim=-1))

tensor(2.5000)
tensor([2., 3.])
tensor([1.5000, 3.5000])
tensor([1.5000, 3.5000])


```python
t.mean()
t.mean(dim=0)
t.mean(dim=1)
t.mean(dim=-1)
```
* 스칼라
* 0이면 세로 방향으로 더해서 행의 평균
* 1은 가로 방향 더해서 열의 평균
* -1 또한 열의 평균

$\begin{pmatrix} 1 & 2 \\3 & 4 \end{pmatrix}$

### Sum

In [24]:
t = torch.FloatTensor([[1, 2], [3, 4]])
print(t)

tensor([[1., 2.],
        [3., 4.]])


In [25]:
print(t.sum())
print(t.sum(dim=0))
print(t.sum(dim=1))
print(t.sum(dim=-1))

tensor(10.)
tensor([4., 6.])
tensor([3., 7.])
tensor([3., 7.])


* 스칼라(전체 합)
* 0이면 세로 방향으로 더해서 행의 합
* 1은 가로 방향 더해서 열의 합
* -1 또한 열의 합  

$\begin{pmatrix} 1 & 2 \\3 & 4 \end{pmatrix}$

### Max and Argmax

In [28]:
t = torch.FloatTensor([[1, 2], [3, 4]])
print(t)

tensor([[1., 2.],
        [3., 4.]])


`max` 연산자는 하나의 최대값을 반환합니다. 다른 명령이 없다면요.

In [29]:
print(t.max()) # Returns one value: max

tensor(4.)


만약 차원을 추가로 특정하면 두가지 값이 나옵니다. 첫 값은 최대 값이고, 두 번째 값은 argmax 값이 나옵니다. 여기서는 인덱스를 쓰면 그 각각의 값(max, argmax)를 둘 다 개별적으로 접근할 수 있죠.

In [30]:
print(t.max(dim=0)) # Returns two values: max and argmax
print('Max: ', t.max(dim=0)[0])
print('Argmax: ', t.max(dim=0)[1])

(tensor([3., 4.]), tensor([1, 1]))
Max:  tensor([3., 4.])
Argmax:  tensor([1, 1])


In [26]:
print(t.max(dim=1))
print(t.max(dim=-1))

(tensor([2., 4.]), tensor([1, 1]))
(tensor([2., 4.]), tensor([1, 1]))


$\begin{pmatrix} 1 & 2 \\3 & 4 \end{pmatrix}$  
* `argmax`는 최대 값이 나타난 인덱스를 의미합니다.
여기서는 각각 1번째 인덱스가 최대값이므로 [1,1]으로 나타나네요.

### View

In [27]:
t = np.array([[[0, 1, 2],
               [3, 4, 5]],

              [[6, 7, 8],
               [9, 10, 11]]])
ft = torch.FloatTensor(t)
print(ft.shape)

torch.Size([2, 2, 3])


In [28]:
print(ft.view([-1, 3]))
print(ft.view([-1, 3]).shape)

tensor([[ 0.,  1.,  2.],
        [ 3.,  4.,  5.],
        [ 6.,  7.,  8.],
        [ 9., 10., 11.]])
torch.Size([4, 3])


In [29]:
print(ft.view([-1, 1, 3]))
print(ft.view([-1, 1, 3]).shape)

tensor([[[ 0.,  1.,  2.]],

        [[ 3.,  4.,  5.]],

        [[ 6.,  7.,  8.]],

        [[ 9., 10., 11.]]])
torch.Size([4, 1, 3])


`view` 는 일반적으로 자주 사용하는 `reshape` 의 파이토치 버전입니다.  
-1을 넣으면 해당 차원은 하나로 합쳐집니다. 나머지 차원은 뒤에 명시한 대로 자동으로 배열이 되겠습니다.
은근히 유용하니 잘 알아두면 좋습니다.

### Squeeze

In [30]:
ft = torch.FloatTensor([[0], [1], [2]])
print(ft)
print(ft.shape)

tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])


In [31]:
print(ft.squeeze())
print(ft.squeeze().shape)

tensor([0., 1., 2.])
torch.Size([3])


`squeeze()`는 걸레 짜듯이 차원을 줄여주는 함수입니다. 여기서도 차원을 2에서 1차원으로 줄여버렸네요. 무시무시합니다. 보통 1의 크기를 가진 차원을 제거합니다.

### Unsqueeze

In [31]:
ft = torch.Tensor([0, 1, 2])
print(ft.shape)

torch.Size([3])


In [32]:
print(ft.unsqueeze(0))
print(ft.unsqueeze(0).shape)

tensor([[0., 1., 2.]])
torch.Size([1, 3])


In [33]:
print(ft.view(1, -1))
print(ft.view(1, -1).shape)

tensor([[0., 1., 2.]])
torch.Size([1, 3])


In [34]:
print(ft.unsqueeze(1))
print(ft.unsqueeze(1).shape)

tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])


In [35]:
print(ft.unsqueeze(-1))
print(ft.unsqueeze(-1).shape)

tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])


* `unsqueeze()`는 반대로 차원을 늘려주는데, 그 크기는 1로 늘려주는 함수입니다.
    * 인스턴스에 0을 넣으면, 0번째 인덱스 즉, 처음 인덱스에 1 크기로 차원을 추가해 줍니다.
    * 인스턴스에 1을 넣으면, 1번째 인덱스에 1 크기의 차원을 넣어줍니다.
    * 인스턴스에 -1을 넣으면, 마지막 인덱스(여기서는 1번째)에 1 크기의 차원을 넣어줍니다.
* `view(1, -1)` 는 1 크기 차원을 넣어주고, 원래 -1은 합쳐진 차원인데 3 그대로 넣겠다고 보시면 됩니다.

### Scatter (for one-hot encoding)

<div class="alert alert-warning">
    Scatter는 원 핫코딩할 때 씁니다. 다양하지만 여기서는 원 핫코딩 전용 아이템이죠.
</div>

In [38]:
lt = torch.LongTensor([[0], [1], [2], [0]])
print(lt)
ft = torch.FloatTensor([[0], [1], [2],[0]])
print(ft)

tensor([[0],
        [1],
        [2],
        [0]])
tensor([[0.],
        [1.],
        [2.],
        [0.]])


In [40]:
one_hot = torch.zeros(4, 3) # batch_size = 4, classes = 3
one_hot.scatter_(1, lt, 1)
print(one_hot)

tensor([[1., 0., 0.],
        [0., 1., 0.],
        [0., 0., 1.],
        [1., 0., 0.]])


`LongTensor`는 무엇일까요? 자세히 보시면 **.** 이 없는 걸 볼 수 있습니다. 완전히 정수로 들어가겠군요. 그래야 인덱스로 인식하겠죠?원핫으로 만드나 봅니다.

### Casting

In [41]:
lt = torch.LongTensor([1, 2, 3, 4])
print(lt)

tensor([1, 2, 3, 4])


In [42]:
print(lt.float())

tensor([1., 2., 3., 4.])


In [43]:
bt = torch.ByteTensor([True, False, False, True])
print(bt)

tensor([1, 0, 0, 1], dtype=torch.uint8)


In [44]:
print(bt.long())
print(bt.float())

tensor([1, 0, 0, 1])
tensor([1., 0., 0., 1.])


캐스팅은 그냥 형변환해주는 겁니다. Bool 타입을 long / float 등으로 모두 변환해주는 유용한 친구죠.

### Concatenation

In [43]:
x = torch.FloatTensor([[1, 2], [3, 4]])
y = torch.FloatTensor([[5, 6], [7, 8]])

In [44]:
print(torch.cat([x, y], dim=0))
print(torch.cat([x, y], dim=1))

tensor([[1., 2.],
        [3., 4.],
        [5., 6.],
        [7., 8.]])
tensor([[1., 2., 5., 6.],
        [3., 4., 7., 8.]])


`torch.cat()`은 concatenation으로 차원을 쌓아주는 좋은 친구입니다.
* dim = 0 이면 행끼리 쌓아주네요.
* dim = 1 이면 열끼리 쌓아줍니다.

### Stacking

In [45]:
x = torch.FloatTensor([1, 4])
y = torch.FloatTensor([2, 5])
z = torch.FloatTensor([3, 6])

In [46]:
print(torch.stack([x, y, z]))
print(torch.stack([x, y, z], dim=1))

tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])
tensor([[1., 2., 3.],
        [4., 5., 6.]])


`torch.stack()` 은 위의 concatenation이랑 **차원을 유지시키면서 쌓아 주는 점만 제외하면** 같습니다.
default 값으로 dim = 0 이 되어 있으니, 안써도 행끼리 쌓아주네요.

In [54]:
print(torch.cat([x.unsqueeze(0), y.unsqueeze(0), z.unsqueeze(0)], dim=0))
print(torch.cat([x.unsqueeze(0), y.unsqueeze(0), z.unsqueeze(0)]))
print(torch.cat([x,y,z], dim = 0))

tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])
tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])
tensor([1., 4., 2., 5., 3., 6.])


자세히 보시면, 똑같이 해보려고 cat은 unsqueeze를 다 해줘서 차원을 늘려야 cat에서 다시 차원을 줄이면서 stack과 같게 만들 수 있네요.

### Ones and Zeros Like

In [48]:
x = torch.FloatTensor([[0, 1, 2], [2, 1, 0]])
print(x)

tensor([[0., 1., 2.],
        [2., 1., 0.]])


In [49]:
print(torch.ones_like(x))
print(torch.zeros_like(x))

tensor([[1., 1., 1.],
        [1., 1., 1.]])
tensor([[0., 0., 0.],
        [0., 0., 0.]])


`torch.ones_like()`는 같은 크기 만큼 1을 채워줍니다.  
`torch.zeros_like()`는 같은 크기 만큼 0을 채워줍니다.  
원핫인코딩 할때 편리하겠죠?

### In-place Operation

In [50]:
x = torch.FloatTensor([[1, 2], [3, 4]])

In [51]:
print(x.mul(2.))
print(x)
print(x.mul_(2.))
print(x)

tensor([[2., 4.],
        [6., 8.]])
tensor([[1., 2.],
        [3., 4.]])
tensor([[2., 4.],
        [6., 8.]])
tensor([[2., 4.],
        [6., 8.]])


행렬의 곱에서 잠깐 보았던 `mul()` 함수입니다.
다만 차이점이 있다면, 아래에 있는 `mul_()` 입니다.

언더바( _ ) 를 추가해주었네요. 이러면 원래 Receiver object 인 x도 한번에 변화시켜줍니다.

## Miscellaneous 잡다한 것들!

### Zip

In [52]:
for x, y in zip([1, 2, 3], [4, 5, 6]):
    print(x, y)

1 4
2 5
3 6


In [53]:
for x, y, z in zip([1, 2, 3], [4, 5, 6], [7, 8, 9]):
    print(x, y, z)

1 4 7
2 5 8
3 6 9


`zip()`은 깔끔하게 괄호 제거하고 보여주는 압축 함수네요. 루프 함수에서 유용하게 쓰이는 것 같습니다. 한 줄 씩 변수에 값을 넣어주는 고마운 친구입니다.