<a href="https://colab.research.google.com/github/mlvlab/DFC609-2022S/blob/master/7_pytorch_tutorial.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Pytorch Tutorial
Reference : https://tutorials.pytorch.kr/beginner/blitz/tensor_tutorial.html#sphx-glr-beginner-blitz-tensor-tutorial-py

--------------------------------------------

### 텐서 (Tensor)
텐서(Tensor) : 배열(array)이나 행렬(matrix)와 매우 유사한 특수한 자료구조
GPU나 다른 연산 가속을 위한 하드웨어서 실행가능.

* 배열(array)이나 행렬(matrix)와 매우 유사한 특수한 자료구조
* GPU나 다른 연산 가속을 위한 하드웨어서 실행가능.
* Numpy의 ndarray와 매우 유사함

In [None]:
%matplotlib inline

In [None]:
# 텐서와 numpy 배열 사용을 위한 모듈 임포트(import)
import torch
import numpy as np

### [1] 텐서 초기화
[1-1] 데이터로부터 직접 생성하기
이때, 텐서의 자료형(data type)은 데이터로부터 자동으로 유추하여 생성합니다.

In [None]:
data = [[1, 2], [3, 4]]
x_data = torch.tensor(data)
print(x_data.type())

torch.LongTensor


In [None]:
data2 = [[1.2, 2.6], [3.4, 4.2]]
x_data2 = torch.tensor(data2)
print(x_data2.type())

torch.FloatTensor


[1-2] NumPy 배열로부터 생성하기

텐서는 NumPy 배열로 생성할 수 있습니다. (그 반대도 가능합니다.)


In [None]:
np_array = np.array(data)
x_np = torch.from_numpy(np_array)
print("data", data)
print(x_np)

data [[1, 2], [3, 4]]
tensor([[1, 2],
        [3, 4]])


In [None]:
t = torch.ones(5)
print(f"t: {t}")
n = t.numpy()
print(f"n: {n}")

t: tensor([1., 1., 1., 1., 1.])
n: [1. 1. 1. 1. 1.]


[1-3] 다른 텐서로부터 생성하기

명시적으로 재정의(override)하지 않는다면, 인자로 주어진 텐서의 속성(모양(shape), 자료형(datatype))을 유지합니다.



In [None]:
print(f"Original Tensor: \n {x_data} \n")

x_ones = torch.ones_like(x_data) # x_data의 속성을 유지합니다.
print(f"Ones Tensor: \n {x_ones} \n")

x_rand = torch.rand_like(x_data, dtype=torch.float) # x_data의 속성을 덮어씁니다.
print(f"Random Tensor: \n {x_rand} \n")


Original Tensor: 
 tensor([[1, 2],
        [3, 4]]) 

Ones Tensor: 
 tensor([[1, 1],
        [1, 1]]) 

Random Tensor: 
 tensor([[0.6433, 0.5576],
        [0.6304, 0.7674]]) 



[1-4] 무작위(random) 또는 상수(constant) 값을 사용하기

shape 은 텐서의 차원(dimension)을 나타내는 튜플(tuple)로, 아래 함수들에서는 출력 텐서의 차원을 결정합니다.

In [None]:
shape = (2, 3,)
rand_tensor = torch.rand(shape)
ones_tensor = torch.ones(shape)
zeros_tensor = torch.zeros(shape)

print(f"Random Tensor: \n {rand_tensor} \n")
print(f"Ones Tensor: \n {ones_tensor} \n")
print(f"Zeros Tensor: \n {zeros_tensor}")


Random Tensor: 
 tensor([[0.6172, 0.9820, 0.1864],
        [0.8518, 0.9221, 0.8901]]) 

Ones Tensor: 
 tensor([[1., 1., 1.],
        [1., 1., 1.]]) 

Zeros Tensor: 
 tensor([[0., 0., 0.],
        [0., 0., 0.]])


### [2] 텐서의 속성(Attribute)


텐서의 속성은 텐서의 모양(shape), 자료형(datatype) 및 어느 장치에 저장되는지를 나타냅니다.

In [None]:
tensor = torch.rand(3, 4)

print(f"Shape of tensor: {tensor.shape}")
print(f"Datatype of tensor: {tensor.dtype}")
print(f"Device tensor is stored on: {tensor.device}")


Shape of tensor: torch.Size([3, 4])
Datatype of tensor: torch.float32
Device tensor is stored on: cpu


### [3] 텐서 연산(Operation)

전치(transposing), 인덱싱(indexing), 슬라이싱(slicing), 수학 계산, 선형 대수, 임의 샘플링(random sampling) 등, 100가지 이상의 텐서 연산이 존재합니다.

각 연산들은 (일반적으로 CPU보다 빠른) GPU에서 실행할 수 있습니다. 

### 런타임 -> 런타임 유형 변경 -> GPU
### 런타임 변경 후, 런타임-> 모두 실행

In [None]:
# GPU가 존재하면 텐서를 이동합니다
if torch.cuda.is_available():
  tensor = tensor.to('cuda')
  print(f"Device tensor is stored on: {tensor.device}")


Device tensor is stored on: cuda:0


[3-1] NumPy식의 표준 인덱싱과 슬라이싱

In [None]:
tensor = torch.ones(4, 4)
print("4x4 tensor 값을 1로 초기화 \n", tensor)

tensor[:,1] = 0
print("\n 모든 행의 1열 값을 0으로 바꾸기\n", tensor)


tensor[0,:] = -1
print("\n 0열의 모든 행 값을 -1로 바꾸기\n", tensor)

4x4 tensor 값을 1로 초기화 
 tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])

 모든 행의 1열 값을 0으로 바꾸기
 tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])

 0열의 모든 행 값을 -1로 바꾸기
 tensor([[-1., -1., -1., -1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.]])


[3-2] 텐서 합치기 

torch.cat 을 사용하여 주어진 차원에 따라 일련의 텐서를 연결할 수 있습니다. 

In [None]:
print(tensor)
t1 = torch.cat([tensor, tensor, tensor], dim=1)
print("\n torch.cat\n", t1)

t2 = torch.stack([tensor, tensor, tensor], dim=1)
print("\n torch.stack\n", t2)

tensor([[-1., -1., -1., -1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.]])

 torch.cat
 tensor([[-1., -1., -1., -1., -1., -1., -1., -1., -1., -1., -1., -1.],
        [ 1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.]])

 torch.stack
 tensor([[[-1., -1., -1., -1.],
         [-1., -1., -1., -1.],
         [-1., -1., -1., -1.]],

        [[ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.]],

        [[ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.]],

        [[ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.]]])


In [None]:
t1 = torch.cat([tensor, tensor, tensor], dim=1)

t2 = torch.stack([tensor, tensor, tensor], dim=1)


[3-3] 텐서 곱하기

a.  요소별 곱(element-wise product)을 계산합니다

In [None]:
tensor = torch.ones(4, 4)
tensor[:,1] = 0

print(f"tensor.mul(tensor) \n {tensor.mul(tensor)} \n")
# 다른 문법:
print(f"tensor * tensor \n {tensor * tensor}")

tensor.mul(tensor) 
 tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]]) 

tensor * tensor 
 tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])


b. 두 텐서 간의 행렬 곱(matrix multiplication)을 계산합니다


In [None]:
print(f"tensor.matmul(tensor.T) \n {tensor.matmul(tensor.T)} \n")
# 다른 문법:
print(f"tensor @ tensor.T \n {tensor @ tensor.T}")


tensor.matmul(tensor.T) 
 tensor([[3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.]]) 

tensor @ tensor.T 
 tensor([[3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.]])


[3-4] 바꿔치기(in-place) 연산 

_ 접미사를 갖는 연산들은 바꿔치기(in-place) 연산입니다. 

예를 들어: x.copy_() 나 x.t_() 는 x 를 변경합니다.


바꿔치기 연산은 메모리를 일부 절약하지만, 기록(history)이 즉시 삭제되어 도함수(derivative) 계산에 문제가 발생할 수 있습니다. 

따라서, 사용을 권장하지 않습니다.

In [None]:
print("바꿔치기 연산 전 \n", tensor, "\n")
tensor.add_(5)
print("바꿔치기 연산 후 \n", tensor)

바꿔치기 연산 전 
 tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]]) 

바꿔치기 연산 후 
 tensor([[6., 5., 6., 6.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.]])


[3-5] squeeze 연산

tensor dimension 중 size 1인 dimension을 제거합니다.


예를 들어, (A x 1 x B x 1 x C) shape을 가진 텐서에 squeeze 연산을 적용하면,
(A x B x C) shape만 남게 됩니다.



dimension을 지정해주면, 특정 dimension에만 적용가능합니다.

In [None]:
x = torch.zeros(2, 1, 2, 1, 2)
print(" squeeze 연산 전 : \n", x.shape)

y = torch.squeeze(x)
print("\n squeeze 연산 후 : \n", y.shape)

z = torch.squeeze(x, dim=1)
print("\n 특정 dimension에만 squeeze 연산 후 : \n", z.shape)

 squeeze 연산 전 : 
 torch.Size([2, 1, 2, 1, 2])

 squeeze 연산 후 : 
 torch.Size([2, 2, 2])

 특정 dimension에만 squeeze 연산 후 : 
 torch.Size([2, 2, 1, 2])


[3-6] unsqueeze 연산

특정 위치에 크기가 1인 텐서를 생성합니다.

In [None]:
x = torch.tensor([1, 2, 3, 4])
print(" unsqueeze 연산 전 : \n", x.shape)


y = torch.unsqueeze(x, dim=0)
print("\n dimension 0에 unsqueeze 연산 후 : \n", y.shape)


z = torch.unsqueeze(x, dim=1)
print("\n dimension 1에 unsqueeze 연산 후 : \n", z.shape)

 unsqueeze 연산 전 : 
 torch.Size([4])

 dimension 0에 unsqueeze 연산 후 : 
 torch.Size([1, 4])

 dimension 1에 unsqueeze 연산 후 : 
 torch.Size([4, 1])


In [None]:
x = torch.tensor([1, 2, 3, 4])

y = torch.unsqueeze(x, dim=0)

z = torch.unsqueeze(x, dim=1)

### [4] NumPy 변환(Bridge)

CPU 상의 텐서와 NumPy 배열은 메모리 공간을 공유하기 때문에, 하나를 변경하면 다른 하나도 변경됩니다.


[4-1] 텐서를 NumPy 배열로 변환하기

In [None]:
t = torch.ones(5)
print(f"tensor t:\n {t}\n")
n = t.numpy()
print(f"numpy n:\n {n}")

tensor t:
 tensor([1., 1., 1., 1., 1.])

numpy n:
 [1. 1. 1. 1. 1.]


[4-2] 텐서의 변경 사항이 NumPy 배열에 반영됩니다.

In [None]:
t.add_(1)
print(f"tensor t:\n {t}")
print(f"numpy n:\n {n}")

tensor t:
 tensor([2., 2., 2., 2., 2.])
numpy n:
 [2. 2. 2. 2. 2.]


[4-3] NumPy 배열을 텐서로 변환하기

In [None]:
n = np.ones(5)
print(f"numpy n:\n {n}\n")
t = torch.from_numpy(n)
print(f"tensor t:\n {t}")

numpy n:
 [1. 1. 1. 1. 1.]

tensor t:
 tensor([1., 1., 1., 1., 1.], dtype=torch.float64)


[4-4] NumPy 배열의 변경 사항이 텐서에 반영됩니다.

In [None]:
np.add(n, 1, out=n)
print(f"tensor t:\n {t}")
print(f"numpy n:\n {n}")

tensor t:
 tensor([2., 2., 2., 2., 2.], dtype=torch.float64)
numpy n:
 [2. 2. 2. 2. 2.]


------------------------------------------------------------
#### [5] Exercise

#### * [5-1] torch.cat 을 이용해서, (8,4) 크기의 텐서를 생성해봅시다.

 힌트 : answer = torch.cat([tensor, tensor], dim=1)


이때, tensor의 크기와 dim에 알맞는 수를 넣어야합니다.

row, col, concat_dim에 알맞는 정수를 입력하세요.


```
# 원하는 결과
torch.Size([8, 4])
tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])
```



In [None]:
row = ? # 알맞는 수를 입력하세요
col = ? # 알맞는 수를 입력하세요
concat_dim = ? # 알맞는 수를 입력하세요 (0 또는 1)

tensor = torch.ones(row,col)
print(tensor.shape)
print(tensor)

answer = torch.cat([tensor, tensor], dim=concat_dim)
print(answer.shape)
print(answer)

torch.Size([1, 1])
tensor([[1.]])
torch.Size([1, 2])
tensor([[1., 1.]])


#### * [5-2] 텐서의 dimension을 바꿔봅시다.

텐서 a의 크기는 (1,2,4,5,1)입니다. (1,2,1,4,5)로 바꿔봅시다.
힌트 : squeeze 연산을 통해 (1,2,4,5) 크기로 변환한 후,
 unsqueeze 연산으로 dimension을 추가해서 (1,2,1,4,5)를 만듭니다.

In [None]:
a = torch.Tensor(1,2,4,5,1)
print(a.shape)

# 물음표에 알맞은 수를 넣어주세요.
a = torch.squeeze(a, dim=?) # 이 곳을 수정하시면 됩니다.
print(a.shape)

a = torch.unsqueeze(a, dim=?) # 이 곳을 수정하시면 됩니다.
print(a.shape)

torch.Size([1, 2, 4, 5, 1])
torch.Size([1, 2, 4, 5, 1])
torch.Size([1, 1, 2, 4, 5, 1])
