# Tensor Manipulation



### Imports

In [None]:
import numpy as np # numpy를 np로써 import 해온다
import torch # torch를 import 해온다

### 1 Tensor in pytorch

* Tensor?
  + Vector (Rank = 1)  
$$\begin{bmatrix}1&2&3\end{bmatrix}$$
  + Matrix (Rank = 2)
$$\begin{bmatrix}1&2&3\\4&5&6\end{bmatrix}$$
  + Tensor (Rank > 2)
    - 2D 화면에 표현하기 어렵다
    - 머리속에 상상 가능하지만 개인차가 있음
  + rank, shape, axis에 관한 수학적 정의를 시간날 때 마다 복습해 두는 것을 추천
  + 관련 유튜브 영상도 많다

In [None]:
# Numpy와 비슷한 문법
tensor = torch.FloatTensor([1, 2, 3, 4]) # 1차원 텐서 생성
print(tensor) # tensor 출력
print(tensor.shape) # tesor shape 출력
print(tensor[1:3]) # 텐서의 1~2까지의 index값을 출력

tensor([1., 2., 3., 4.])
torch.Size([4])
tensor([2., 3.])


In [None]:
# 3차원 이상
tensor3d = torch.FloatTensor([ [[1, 2, 3, 4],
                                [5, 6, 7, 8],
                                [9, 10, 11, 12]],

                               [[13, 14, 15, 16],
                                [17, 18, 19, 20],
                                [21, 22, 23, 24]] ]) # -> 3차원 tensor 출력
print(tensor3d) # tensor3d 출력
print(tensor3d.shape) # tensor3d의 Shape 출력

tensor([[[ 1.,  2.,  3.,  4.],
         [ 5.,  6.,  7.,  8.],
         [ 9., 10., 11., 12.]],

        [[13., 14., 15., 16.],
         [17., 18., 19., 20.],
         [21., 22., 23., 24.]]])
torch.Size([2, 3, 4])


### 2 Tensor Combinations
* Concatenation
  + 경계를 무너뜨리며 붙인다
  $$\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} (\cdot) \begin{bmatrix} 5 & 6 \\ 7 & 8 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 2 & 5 & 6 \\ 3 & 4 & 7 & 8 \end{bmatrix}  $$

In [None]:
x = torch.FloatTensor([[1, 2], [3, 4]]) # 텐서 생성해서 x변수에 대입
y = torch.FloatTensor([[5, 6], [7, 8]]) # 텐서 생성해서 y변수에 대입
print(x) # x 출력
print(y) # y 출력
print(torch.cat([x,y], dim = 0)) # 차원 0 (가장 큰 덩어리)를 기준으로 경계를 무너뜨리면서 x와 y를 합친다
print(torch.cat([x,y], dim = 1)) # 차원 1 (다음으로 가장 큰 덩어리)를 기준으로 경계를 무너뜨리면서 x와 y를 합친다

tensor([[1., 2.],
        [3., 4.]])
tensor([[5., 6.],
        [7., 8.]])
tensor([[1., 2.],
        [3., 4.],
        [5., 6.],
        [7., 8.]])
tensor([[1., 2., 5., 6.],
        [3., 4., 7., 8.]])


* Stack
  + 경계를 구분한 채로 붙인다
  $$\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} (*) \begin{bmatrix} 5 & 6 \\ 7 & 8 \end{bmatrix} \rightarrow \begin{bmatrix} \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} & \begin{bmatrix} 5 & 6 \\ 7 & 8 \end{bmatrix} \end{bmatrix}  $$

In [None]:
print(torch.stack([x,y], dim = 0)) # 차원0을 기준으로 경계를 구분한 채로 합친다
print(torch.stack([x,y], dim = 1)) # 차워 1을 기준으로 경계를 구분한 채로 합친다

tensor([[[1., 2.],
         [3., 4.]],

        [[5., 6.],
         [7., 8.]]])
tensor([[[1., 2.],
         [5., 6.]],

        [[3., 4.],
         [7., 8.]]])


* View / Reshape
  + data를 유지한 채 shape을 변형한다
    - Pointer를 반환하므로 원본을 훼손하지 않으려면 복사본을 이용한다

In [None]:
x = torch.rand(2, 3, 4)  # [2, 3, 4]
y = x.view(2, -1)  # [2, 12] -> -1은 변형할 수 있는 선에서 제일 최대로 변형하라는 의미
z = x.reshape(2, -1) # [2, 12]
print(x) # x출력
print(y) # y출력
print(z) # z출력
z[0] = 0.0 # z의 한 덩어리를 모두 0.0 실수로 변환
print(x) # x출력

tensor([[[0.5022, 0.5057, 0.8796, 0.0525],
         [0.8836, 0.7124, 0.8465, 0.8862],
         [0.7256, 0.5428, 0.9198, 0.6916]],

        [[0.4527, 0.6195, 0.5849, 0.9043],
         [0.7626, 0.5965, 0.5295, 0.8113],
         [0.2377, 0.9379, 0.9978, 0.6270]]])
tensor([[0.5022, 0.5057, 0.8796, 0.0525, 0.8836, 0.7124, 0.8465, 0.8862, 0.7256,
         0.5428, 0.9198, 0.6916],
        [0.4527, 0.6195, 0.5849, 0.9043, 0.7626, 0.5965, 0.5295, 0.8113, 0.2377,
         0.9379, 0.9978, 0.6270]])
tensor([[0.5022, 0.5057, 0.8796, 0.0525, 0.8836, 0.7124, 0.8465, 0.8862, 0.7256,
         0.5428, 0.9198, 0.6916],
        [0.4527, 0.6195, 0.5849, 0.9043, 0.7626, 0.5965, 0.5295, 0.8113, 0.2377,
         0.9379, 0.9978, 0.6270]])
tensor([[[0.0000, 0.0000, 0.0000, 0.0000],
         [0.0000, 0.0000, 0.0000, 0.0000],
         [0.0000, 0.0000, 0.0000, 0.0000]],

        [[0.4527, 0.6195, 0.5849, 0.9043],
         [0.7626, 0.5965, 0.5295, 0.8113],
         [0.2377, 0.9379, 0.9978, 0.6270]]])


* Squeeze
  + 불필요한 rank를 줄인다

In [None]:
_data = np.array([1,2,3,4]) # 배열 선언
x = torch.from_numpy(_data) # x에 저장
print(x) # x 출력
print(x.T) # transpose한 배열 출력 하지만 1차원이기 때문에 trans할게 없기 때문에 그대로 출력이 된다
_data = np.array([_data]) # 한 덩어리를 더 만든다 (transpose하기 위해서)
x = torch.from_numpy(_data) # x에 저장
print(x) # x 출력
print(x.T) # trans
print(x.T.squeeze()) # 불필요한 덩어리를 지우기 위해 rank 사용

tensor([1, 2, 3, 4])
tensor([1, 2, 3, 4])
tensor([[1, 2, 3, 4]])
tensor([[1],
        [2],
        [3],
        [4]])
tensor([1, 2, 3, 4])


### 3 Tensor Operations
* 사칙연산 - 요소별(Element-wise) 연산

In [None]:
# 요소별 곱셈
print(tensor)
print(tensor3d)
print(tensor * tensor3d) # 곱하기

tensor([1., 2., 3., 4.])
tensor([[[ 1.,  2.,  3.,  4.],
         [ 5.,  6.,  7.,  8.],
         [ 9., 10., 11., 12.]],

        [[13., 14., 15., 16.],
         [17., 18., 19., 20.],
         [21., 22., 23., 24.]]])
tensor([[[ 1.,  4.,  9., 16.],
         [ 5., 12., 21., 32.],
         [ 9., 20., 33., 48.]],

        [[13., 28., 45., 64.],
         [17., 36., 57., 80.],
         [21., 44., 69., 96.]]])


In [None]:
# 상수 덧셈
print(tensor3d + 3) # 더하기

tensor([[[ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [12., 13., 14., 15.]],

        [[16., 17., 18., 19.],
         [20., 21., 22., 23.],
         [24., 25., 26., 27.]]])


In [None]:
# tensor 덧셈
tensor_a = torch.FloatTensor([1, 2, 3, 4])
tensor_b = torch.FloatTensor([[1], [2], [3]])
tensor_c = torch.FloatTensor([[[1]],[[2]]]) -> 기존 행렬에 더할 행렬들 각각 선언
print(tensor3d)
print(tensor3d + tensor_a) # 더하기
print(tensor3d + tensor_b)
print(tensor3d + tensor_c)

tensor([[[ 1.,  2.,  3.,  4.],
         [ 5.,  6.,  7.,  8.],
         [ 9., 10., 11., 12.]],

        [[13., 14., 15., 16.],
         [17., 18., 19., 20.],
         [21., 22., 23., 24.]]])
tensor([[[ 2.,  4.,  6.,  8.],
         [ 6.,  8., 10., 12.],
         [10., 12., 14., 16.]],

        [[14., 16., 18., 20.],
         [18., 20., 22., 24.],
         [22., 24., 26., 28.]]])
tensor([[[ 2.,  3.,  4.,  5.],
         [ 7.,  8.,  9., 10.],
         [12., 13., 14., 15.]],

        [[14., 15., 16., 17.],
         [19., 20., 21., 22.],
         [24., 25., 26., 27.]]])
tensor([[[ 2.,  3.,  4.,  5.],
         [ 6.,  7.,  8.,  9.],
         [10., 11., 12., 13.]],

        [[15., 16., 17., 18.],
         [19., 20., 21., 22.],
         [23., 24., 25., 26.]]])


* Tensor transpose
  + shape(2, 3, 4) >> shape(4, 3, 2)
  + 3차원의 경우, 머릿속으로 상상하기 힘들다


In [None]:
print(tensor3d)
print(tensor3d.T) # transpose한 행렬 출력

tensor([[[ 1.,  2.,  3.,  4.],
         [ 5.,  6.,  7.,  8.],
         [ 9., 10., 11., 12.]],

        [[13., 14., 15., 16.],
         [17., 18., 19., 20.],
         [21., 22., 23., 24.]]])
tensor([[[ 1., 13.],
         [ 5., 17.],
         [ 9., 21.]],

        [[ 2., 14.],
         [ 6., 18.],
         [10., 22.]],

        [[ 3., 15.],
         [ 7., 19.],
         [11., 23.]],

        [[ 4., 16.],
         [ 8., 20.],
         [12., 24.]]])


* Tensor dot product
  + 마찬가지로 3차원의 경우, 머릿속으로 상상하기 힘들기 때문에 수식에 오류가 없음을 반드시 확인해야한다
  + shape(2,3,4) * shape(4) >> shape(2,3)



In [None]:
print(tensor3d.matmul(tensor)) # 곱한다

tensor([[ 30.,  70., 110.],
        [150., 190., 230.]])
tensor([[[ 30.],
         [ 70.],
         [110.]],

        [[150.],
         [190.],
         [230.]]])
tensor([[ 30.,  70., 110.],
        [150., 190., 230.]])


* Mean, Sum, Max

In [None]:
print(tensor3d)
print(tensor3d.mean())
print(tensor3d.shape)
print(tensor3d.mean(dim=0)) # dim 0을 기준으로 그 dim끼리의 평균을 구함
print(tensor3d.mean(dim=1)) # dim 1을 기준으로 그 dim끼리의 평균을 구함
print(tensor3d.mean(dim=2)) # dim 2을 기준으로 그 dim끼리의 평균을 구함

tensor([[[ 1.,  2.,  3.,  4.],
         [ 5.,  6.,  7.,  8.],
         [ 9., 10., 11., 12.]],

        [[13., 14., 15., 16.],
         [17., 18., 19., 20.],
         [21., 22., 23., 24.]]])
tensor(12.5000)
torch.Size([2, 3, 4])
tensor([[ 7.,  8.,  9., 10.],
        [11., 12., 13., 14.],
        [15., 16., 17., 18.]])
tensor([[ 5.,  6.,  7.,  8.],
        [17., 18., 19., 20.]])
tensor([[ 2.5000,  6.5000, 10.5000],
        [14.5000, 18.5000, 22.5000]])


In [None]:
print(tensor3d.sum()) # 행렬 요소의 모든 값을 더한다
print(tensor3d.sum(dim=0)) # dim 0에만 더한다

tensor(300.)
tensor([[14., 16., 18., 20.],
        [22., 24., 26., 28.],
        [30., 32., 34., 36.]])


In [None]:
print(tensor3d.max()) # 행렬의 가장 큰 값 출력
print(tensor3d.max(dim=1)) # dim1중에서 가장 큰 값 출력
values, indices = tensor3d.max(dim=1)
print(values)

tensor(24.)
torch.return_types.max(
values=tensor([[ 9., 10., 11., 12.],
        [21., 22., 23., 24.]]),
indices=tensor([[2, 2, 2, 2],
        [2, 2, 2, 2]]))
tensor([[ 9., 10., 11., 12.],
        [21., 22., 23., 24.]])


* 역행렬

In [None]:
tensor_square = torch.FloatTensor([[1, 7], [-4, 6]])
print(torch.inverse(tensor_square)) # 역행렬 출력

tensor([[ 0.1765, -0.2059],
        [ 0.1176,  0.0294]])


### 4 실습 (Assignment 6)
* 행렬 방정식 풀기 (단, Pytorch만을 사용한다)
  - 다음 행렬 방정식을 'Pseudo inverse matrix'를 이용해 풀어보자
  - $A^{T}A$의 역행렬이 존재한다고 가정
$$Ax=B$$
$$A = \begin{bmatrix}0 & 1 \\ 1 & 1 \\ 2 & 1 \\ 3 & 1 \end{bmatrix} $$
$$B = \begin{bmatrix}-1 \\ 0.2 \\ 0.9 \\ 2.1 \end{bmatrix} $$


In [1]:
import torch

A = torch.FloatTensor([[0,1],[1,1],[2,1],[3,1]]) # A 행렬 선언
b = torch.FloatTensor([-1,0.2,0.9,2.1]) # b 행렬 선언
Tb = b.reshape(4,1) # 계산해주기 위해 b 행렬을 4,1로 reshape한 것을 Tb로 선언
AA = (A.T).matmul(A) # trans한 A와 A를 곱한 것을 AA로 선언
TAA = torch.inverse(AA) # AA의 역행렬을 구하고 그것을 TAA로 선언
AT = A.T # A의 trans를 AT로 선언
ATb = AT.matmul(Tb) # AT와 Tb의 곱을 ATb로 선언
print(TAA.matmul(ATb)) # TAA와 ATb의 곱을 프린트함으로써 결과값 출력

tensor([[ 1.0000],
        [-0.9500]])
