## Pytorch Tutorial
Reference : https://tutorials.pytorch.kr/beginner/blitz/tensor_tutorial.html#sphx-glr-beginner-blitz-tensor-tutorial-py

### 설치 
1. 가용 GPU의 CUDA 버전 확인!

  (ex) nvcc -V

2. https://pytorch.org/ 에서 버전에 맞는 설치 커맨드 확인

  (ex) pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

3. 사용할 (가상)환경에서 커맨드 실행

--------------------------------------------

### 텐서 (Tensor)
텐서(Tensor) : 배열(array)이나 행렬(matrix)와 매우 유사한 특수한 자료구조
GPU나 다른 연산 가속을 위한 하드웨어서 실행가능.

* 배열(array)이나 행렬(matrix)와 매우 유사한 특수한 자료구조
* GPU나 다른 연산 가속을 위한 하드웨어서 실행가능.
* Numpy의 ndarray와 매우 유사함

In [1]:
%matplotlib inline
!nvcc -V

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Feb_14_21:12:58_PST_2021
Cuda compilation tools, release 11.2, V11.2.152
Build cuda_11.2.r11.2/compiler.29618528_0


In [2]:
# 텐서와 numpy 배열 사용을 위한 모듈 임포트(import)
import torch
import numpy as np

### [1] 텐서 초기화
[1-1] 데이터로부터 직접 생성하기
이때, 텐서의 자료형(data type)은 데이터로부터 자동으로 유추하여 생성합니다.

In [3]:
data = [[1, 2], [3, 4]]
x_data = torch.tensor(data)
print(x_data.type())

torch.LongTensor


In [4]:
data2 = [[1.2, 2.6], [3.4, 4.2]]
x_data2 = torch.tensor(data2)
print(x_data2.type())

torch.FloatTensor


[1-2] NumPy 배열로부터 생성하기

텐서는 NumPy 배열로 생성할 수 있습니다. (그 반대도 가능합니다.)


In [5]:
np_array = np.array(data)
x_np = torch.from_numpy(np_array)
print("data", data)
print(x_np)

data [[1, 2], [3, 4]]
tensor([[1, 2],
        [3, 4]])


In [6]:
t = torch.ones(5)
print(f"t: {t}")
n = t.numpy()
print(f"n: {n}")

t: tensor([1., 1., 1., 1., 1.])
n: [1. 1. 1. 1. 1.]


[1-3] 다른 텐서로부터 생성하기

명시적으로 재정의(override)하지 않는다면, 인자로 주어진 텐서의 속성(모양(shape), 자료형(datatype))을 유지합니다.



In [7]:
print(f"Original Tensor: \n {x_data} \n")

x_ones = torch.ones_like(x_data) # x_data의 속성을 유지합니다.
print(f"Ones Tensor: \n {x_ones} \n")

x_ones = torch.ones_like(x_data, dtype=torch.float) # x_data의 속성을 덮어씁니다.
print(f"Ones Tensor: \n {x_ones} \n")

x_rand = torch.rand_like(x_data, dtype=torch.float) # x_data의 속성을 덮어씁니다.
print(f"Random Tensor: \n {x_rand} \n")


Original Tensor: 
 tensor([[1, 2],
        [3, 4]]) 

Ones Tensor: 
 tensor([[1, 1],
        [1, 1]]) 

Ones Tensor: 
 tensor([[1., 1.],
        [1., 1.]]) 

Random Tensor: 
 tensor([[0.4251, 0.8740],
        [0.3135, 0.7494]]) 



[1-4] 무작위(random) 또는 상수(constant) 값을 사용하기

shape 은 텐서의 차원(dimension)을 나타내는 튜플(tuple)로, 아래 함수들에서는 출력 텐서의 차원을 결정합니다.

In [8]:
shape = (2, 3,)
rand_tensor = torch.rand(shape)
ones_tensor = torch.ones(shape)
zeros_tensor = torch.zeros(shape)

print(f"Random Tensor: \n {rand_tensor} \n")
print(f"Ones Tensor: \n {ones_tensor} \n")
print(f"Zeros Tensor: \n {zeros_tensor}")


Random Tensor: 
 tensor([[0.6483, 0.6857, 0.8925],
        [0.6768, 0.5822, 0.8033]]) 

Ones Tensor: 
 tensor([[1., 1., 1.],
        [1., 1., 1.]]) 

Zeros Tensor: 
 tensor([[0., 0., 0.],
        [0., 0., 0.]])


### [2] 텐서의 속성(Attribute)


텐서의 속성은 텐서의 모양(shape), 자료형(datatype) 및 어느 장치에 저장되는지를 나타냅니다.

In [9]:
tensor = torch.rand(3, 4)
print(f"Shape of tensor: {tensor.shape}")
print(f"Datatype of tensor: {tensor.dtype}")
print(f"Device tensor is stored on: {tensor.device}")


Shape of tensor: torch.Size([3, 4])
Datatype of tensor: torch.float32
Device tensor is stored on: cpu


### [3] 텐서 연산(Operation)

전치(transposing), 인덱싱(indexing), 슬라이싱(slicing), 수학 계산, 선형 대수, 임의 샘플링(random sampling) 등, 100가지 이상의 텐서 연산이 존재합니다.

각 연산들은 (일반적으로 CPU보다 빠른) GPU에서 실행할 수 있습니다. 

### 런타임 -> 런타임 유형 변경 -> GPU
### 런타임 변경 후, 런타임-> 모두 실행

In [10]:
# GPU가 존재하면 텐서를 이동합니다
if torch.cuda.is_available():
  tensor = tensor.to('cuda:0')
  print(f"Device tensor is stored on: {tensor.device}")


Device tensor is stored on: cuda:0


[3-1] NumPy식의 표준 인덱싱과 슬라이싱

In [11]:
tensor = torch.ones(4, 4)
print("4x4 tensor 값을 1로 초기화 \n", tensor)

tensor[:,1] = 0
print("\n 모든 행의 1열 값을 0으로 바꾸기\n", tensor)

tensor[0,:] = -1
print("\n 0열의 모든 행 값을 -1로 바꾸기\n", tensor)

4x4 tensor 값을 1로 초기화 
 tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])

 모든 행의 1열 값을 0으로 바꾸기
 tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])

 0열의 모든 행 값을 -1로 바꾸기
 tensor([[-1., -1., -1., -1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.]])


[3-2] 텐서 합치기 

torch.cat 을 사용하여 주어진 차원에 따라 일련의 텐서를 연결할 수 있습니다. 

In [12]:
print(tensor)
t1 = torch.cat([tensor, tensor, tensor], dim=1)     # 유사 : numpy.concatenate()
print("\n torch.cat\n", t1)

t2 = torch.stack([tensor, tensor], dim=1)
print("\n torch.stack\n", t2)

tensor([[-1., -1., -1., -1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.]])

 torch.cat
 tensor([[-1., -1., -1., -1., -1., -1., -1., -1., -1., -1., -1., -1.],
        [ 1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.,  1.,  0.,  1.,  1.]])

 torch.stack
 tensor([[[-1., -1., -1., -1.],
         [-1., -1., -1., -1.]],

        [[ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.]],

        [[ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.]],

        [[ 1.,  0.,  1.,  1.],
         [ 1.,  0.,  1.,  1.]]])


[3-3] 텐서 곱하기

a.  요소별 곱(element-wise product)을 계산합니다

In [13]:
tensor1 = torch.ones(4, 4)
tensor1[:,1] = 0
tensor2 = torch.ones(4, 4)
tensor2[:,2] = 0

print(f"tensor.mul(tensor) \n {tensor1.mul(tensor2)} \n")
# 다른 문법:
print(f"tensor * tensor \n {tensor1 * tensor2}")

tensor.mul(tensor) 
 tensor([[1., 0., 0., 1.],
        [1., 0., 0., 1.],
        [1., 0., 0., 1.],
        [1., 0., 0., 1.]]) 

tensor * tensor 
 tensor([[1., 0., 0., 1.],
        [1., 0., 0., 1.],
        [1., 0., 0., 1.],
        [1., 0., 0., 1.]])


b. 두 텐서 간의 행렬 곱(matrix multiplication)을 계산합니다


In [14]:
print(f"tensor.matmul(tensor.T) \n {tensor1.matmul(tensor2)} \n")
# 다른 문법:
print(f"tensor @ tensor.T \n {tensor1 @ tensor2}")


tensor.matmul(tensor.T) 
 tensor([[3., 3., 0., 3.],
        [3., 3., 0., 3.],
        [3., 3., 0., 3.],
        [3., 3., 0., 3.]]) 

tensor @ tensor.T 
 tensor([[3., 3., 0., 3.],
        [3., 3., 0., 3.],
        [3., 3., 0., 3.],
        [3., 3., 0., 3.]])


[3-4] 바꿔치기(in-place) 연산 

_ 접미사를 갖는 연산들은 바꿔치기(in-place) 연산입니다. 

예를 들어: x.copy_() 나 x.t_() 는 x 를 변경합니다.


바꿔치기 연산은 메모리를 일부 절약하지만, 기록(history)이 즉시 삭제되어 도함수(derivative) 계산에 문제가 발생할 수 있습니다. 

따라서, 사용을 권장하지 않습니다.

In [15]:
print("바꿔치기 연산 전 \n", tensor, "\n")
tensor.add_(5)
print("바꿔치기 연산 후 \n", tensor)

바꿔치기 연산 전 
 tensor([[-1., -1., -1., -1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.],
        [ 1.,  0.,  1.,  1.]]) 

바꿔치기 연산 후 
 tensor([[4., 4., 4., 4.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.]])


[3-5] squeeze 연산

tensor dimension 중 size 1인 dimension을 제거합니다.


예를 들어, (A x 1 x B x 1 x C) shape을 가진 텐서에 squeeze 연산을 적용하면,
(A x B x C) shape만 남게 됩니다.



dimension을 지정해주면, 특정 dimension에만 적용가능합니다.

In [16]:
x = torch.zeros(2, 1, 2, 1, 2)
print(" squeeze 연산 전 : \n", x.shape)

y = torch.squeeze(x)
print("\n squeeze 연산 후 : \n", y.shape)

z = torch.squeeze(x, dim=1)
print("\n 특정 dimension에만 squeeze 연산 후 : \n", z.shape)

 squeeze 연산 전 : 
 torch.Size([2, 1, 2, 1, 2])

 squeeze 연산 후 : 
 torch.Size([2, 2, 2])

 특정 dimension에만 squeeze 연산 후 : 
 torch.Size([2, 2, 1, 2])


[3-6] unsqueeze 연산

특정 위치에 크기가 1인 텐서를 생성합니다.

In [17]:
x = torch.tensor([1, 2, 3, 4])
print(" unsqueeze 연산 전 : \n", x.shape)


y = torch.unsqueeze(x, dim=0)
print("\n dimension 0에 unsqueeze 연산 후 : \n", y.shape)


z = torch.unsqueeze(x, dim=1)
print("\n dimension 1에 unsqueeze 연산 후 : \n", z.shape)

 unsqueeze 연산 전 : 
 torch.Size([4])

 dimension 0에 unsqueeze 연산 후 : 
 torch.Size([1, 4])

 dimension 1에 unsqueeze 연산 후 : 
 torch.Size([4, 1])


### [4] NumPy 변환(Bridge)

CPU 상의 텐서와 NumPy 배열은 메모리 공간을 공유하기 때문에, 하나를 변경하면 다른 하나도 변경됩니다.


[4-1] 텐서를 NumPy 배열로 변환하기

In [18]:
t = torch.ones(5)
print(f"tensor t:\n {t}\n")
n = t.numpy()
print(f"numpy n:\n {n}")

tensor t:
 tensor([1., 1., 1., 1., 1.])

numpy n:
 [1. 1. 1. 1. 1.]


[4-2] 텐서의 변경 사항이 NumPy 배열에 반영됩니다.

In [19]:
t.add_(1)
print(f"tensor t:\n {t}")
print(f"numpy n:\n {n}")

## Exercise : t를 CUDA tensor로 만들고, 어떤 차이가 있는지 살펴보자




tensor t:
 tensor([2., 2., 2., 2., 2.])
numpy n:
 [2. 2. 2. 2. 2.]


[4-3] NumPy 배열을 텐서로 변환하기

In [20]:
n = np.ones(5)
print(f"numpy n:\n {n}\n")
t = torch.from_numpy(n)
print(f"tensor t:\n {t}")

numpy n:
 [1. 1. 1. 1. 1.]

tensor t:
 tensor([1., 1., 1., 1., 1.], dtype=torch.float64)


[4-4] NumPy 배열의 변경 사항이 텐서에 반영됩니다.

In [21]:
np.add(n, 1, out=n)
print(f"tensor t:\n {t}")
print(f"numpy n:\n {n}")

tensor t:
 tensor([2., 2., 2., 2., 2.], dtype=torch.float64)
numpy n:
 [2. 2. 2. 2. 2.]


------------------------------------------------------------
#### [5] Exercise

#### * [5-1] torch.cat 을 이용해서, (8,4) 크기의 텐서를 생성해봅시다.

 힌트 : answer = torch.cat([tensor, tensor], dim=1)


이때, tensor의 크기와 dim에 알맞는 수를 넣어야합니다.

row, col, concat_dim에 알맞는 정수를 입력하세요.


```
# 원하는 결과
torch.Size([8, 4])
tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])
```



In [22]:
row = ? # 알맞는 수를 입력하세요
col = ? # 알맞는 수를 입력하세요
concat_dim = ? # 알맞는 수를 입력하세요 (0 또는 1)

tensor = torch.ones(row,col)
print(tensor.shape)
print(tensor)

answer = torch.cat([tensor, tensor], dim=concat_dim)
print(answer.shape)
print(answer)

torch.Size([4, 4])
tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])
torch.Size([8, 4])
tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])


#### * [5-2] 텐서의 dimension을 바꿔봅시다.

텐서 a의 크기는 (1,2,4,5,1)입니다. (1,2,1,4,5)로 바꿔봅시다.
힌트 : squeeze 연산을 통해 (1,2,4,5) 크기로 변환한 후,
 unsqueeze 연산으로 dimension을 추가해서 (1,2,1,4,5)를 만듭니다.

In [23]:
a = torch.Tensor(1,2,4,5,1)
print(a.shape)

# 물음표에 알맞은 수를 넣어주세요.
a = torch.squeeze(a, dim=?) # 이 곳을 수정하시면 됩니다.
print(a.shape)

a = torch.unsqueeze(a, dim=?) # 이 곳을 수정하시면 됩니다.
print(a.shape)

torch.Size([1, 2, 4, 5, 1])
torch.Size([1, 2, 4, 5])
torch.Size([1, 2, 1, 4, 5])


# (+alpha) 간단한 Torch Model 만들기



In [24]:
# 모델 클래스 생성
class LinearModel(torch.nn.Module):
  def __init__(self):
    super().__init__()
    self.linear = torch.nn.Linear(4,1, bias=False)

  def forward(self, x):
    return self.linear(x)

model = LinearModel()

In [25]:
# 모델 파라미터 확인
for name, param in model.named_parameters():
  print(name, param)

linear.weight Parameter containing:
tensor([[ 0.0663, -0.0381, -0.1189,  0.1286]], requires_grad=True)


In [26]:
# 총 10개의 랜덤 데이터 생성
X = torch.randn(10, 4)  
Y = 0.4 * X[:,0] + 0.3 * X[:,1] + 0.2 * X[:,2] + 0.1 * X[:,3]
print(X)
print(Y)

tensor([[ 0.7928,  0.5828, -0.5254,  0.8026],
        [-0.0308, -0.2144,  1.4066, -1.9018],
        [-1.7279, -1.1837, -1.5208, -0.2449],
        [-0.8197, -1.2801, -0.1967,  0.7482],
        [-1.5260,  0.3668,  1.3715, -0.6843],
        [-0.6542, -0.3921,  0.0151, -0.2636],
        [ 0.6997,  1.0198,  0.4306, -1.1121],
        [-0.3403, -0.0662, -1.4638,  1.4606],
        [-0.3518, -0.3675, -0.8109,  0.3569],
        [ 0.7636, -0.2509,  0.6317, -1.4793]])
tensor([ 0.4671,  0.0145, -1.3749, -0.6764, -0.2945, -0.4027,  0.5607, -0.3027,
        -0.3774,  0.2086])


In [27]:
# 학습 셋업 및 학습
criterion = torch.nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.05)

for epoch in range(300):
  y_pred = model(X)
  loss = criterion(Y, y_pred.flatten())
  optimizer.zero_grad()
  loss.backward()
  optimizer.step()
  if epoch % 10 == 9 :
    print('epoch {} loss : '.format(epoch), loss.item())

epoch 9 loss :  0.03308200091123581
epoch 19 loss :  0.005225374363362789
epoch 29 loss :  0.001664559356868267
epoch 39 loss :  0.0007607939187437296
epoch 49 loss :  0.0003914849366992712
epoch 59 loss :  0.000207873250474222
epoch 69 loss :  0.00011149103374918923
epoch 79 loss :  6.015827602823265e-05
epoch 89 loss :  3.266160638304427e-05
epoch 99 loss :  1.7865577319753356e-05
epoch 109 loss :  9.86289705906529e-06
epoch 119 loss :  5.506282832357101e-06
epoch 129 loss :  3.1154468160821125e-06
epoch 139 loss :  1.7903657862916589e-06
epoch 149 loss :  1.0469957487657666e-06
epoch 159 loss :  6.240385914679791e-07
epoch 169 loss :  3.793970222432108e-07
epoch 179 loss :  2.353863663984157e-07
epoch 189 loss :  1.488611331978973e-07
epoch 199 loss :  9.587448346337624e-08
epoch 209 loss :  6.273479158380724e-08
epoch 219 loss :  4.164505895687398e-08
epoch 229 loss :  2.7979254468846193e-08
epoch 239 loss :  1.8981230809345107e-08
epoch 249 loss :  1.2981267616396508e-08
epoch 259

In [28]:
# 학습 후 모델 파라미터 확인
for name, param in model.named_parameters():
  print(name, param)

linear.weight Parameter containing:
tensor([[0.4000, 0.3001, 0.1999, 0.1000]], requires_grad=True)
