# PyTorch Basics
___
Why PyTorch
- Define by Run의 장점, 즉시 확인 가능 $\Rightarrow$ pythonic code
- CPU support, Good API and community
- 사용하기 편한 장점이 가장 큼
- TF는 production과 scalability의 장점
- Numpy + AutoGrad(자동미분) + Functions
- Numpy구조를 가지는 Tensor 객체로 array 표현
- 자동 미분 지원하여 DL연산 지원
- 다양한 형태의 DL을 지원하는 함수와 모델을 지원(Data set, Multi GPU)
- 복잡한 것을 복잡하지 않게 해주는장점

## Tensor
- 다차원 Arrays를 표현하는 PyTorch 클래스
- 다양한 numpy의 ndarray와 동일(그러므로 TensorFlow의 Tensor와 동일)
- Tensor를 생성하는 함수도 거의 동일

### numpy - ndarray

In [1]:
import numpy as np

n_array = np.arange(10).reshape(2, 5)
print(n_array)
print("ndim :",n_array.ndim,"\nshape :",n_array.shape)

[[0 1 2 3 4]
 [5 6 7 8 9]]
ndim : 2 
shape : (2, 5)


### pytorch - tensor

In [2]:
import torch

t_array = torch.FloatTensor(n_array)
print(t_array)
print("ndim :",t_array.ndim,"\nshape :",t_array.shape)

tensor([[0., 1., 2., 3., 4.],
        [5., 6., 7., 8., 9.]])
ndim : 2 
shape : torch.Size([2, 5])


## Array to Tensor
Tensor 생성은 List 나 ndarray를 사용 가능

### data to tensor

In [3]:
data = [[3,5],[10, 5]]
x_data = torch.tensor(data)
x_data

tensor([[ 3,  5],
        [10,  5]])

### ndarray to tensor

In [4]:
nd_array_ex = np.array(data)
tensor_array = torch.from_numpy(nd_array_ex)
tensor_array

tensor([[ 3,  5],
        [10,  5]])

### Tensor data types
- 기본적으로 tensor가 가질수 있는 data type은 numpy와 동일
- GPU 사용 여부로 다르기도함. 

### numpy like operations 
- 기본적으로 numpy의 대부분의 사용법이 그대로 적용됨


In [5]:
data = [[3, 5, 20], [10, 5, 50], [1, 5, 10]]
x_data = torch.tensor(data)

x_data[1:]

tensor([[10,  5, 50],
        [ 1,  5, 10]])

In [6]:
x_data[:2,1:]

tensor([[ 5, 20],
        [ 5, 50]])

In [7]:
x_data.flatten()

tensor([ 3,  5, 20, 10,  5, 50,  1,  5, 10])

In [8]:
torch.ones_like(x_data)

tensor([[1, 1, 1],
        [1, 1, 1],
        [1, 1, 1]])

In [9]:
x_data.numpy()

array([[ 3,  5, 20],
       [10,  5, 50],
       [ 1,  5, 10]])

In [10]:
x_data.shape

torch.Size([3, 3])

In [11]:
x_data.dtype

torch.int64

pytorch의 tensor는 GPU에 올려서 사용가능

In [12]:
x_data.device

device(type='cpu')

In [13]:
if torch.cuda.is_available():
    x_data_cuda = x_data.to('cuda')
x_data_cuda.device

NameError: name 'x_data_cuda' is not defined

### Tensor handling
view, squeeze, unsqueeze 등으로 tensor 조정 가능
- view : reshape과 동일하게 tensor의 shape을 변환
- squeeze : 차원의 개수가 1인 차원을 삭제(압축)
- unsqueeze : 차원의 개수가 1인 차원을 추가


In [14]:
tensor_ex = torch.rand(size=(2,3,2))
tensor_ex

tensor([[[0.8050, 0.1283],
         [0.5530, 0.0830],
         [0.8058, 0.9615]],

        [[0.7365, 0.1058],
         [0.7586, 0.5012],
         [0.9674, 0.7333]]])

In [15]:
tensor_ex.view([-1,6])

tensor([[0.8050, 0.1283, 0.5530, 0.0830, 0.8058, 0.9615],
        [0.7365, 0.1058, 0.7586, 0.5012, 0.9674, 0.7333]])

In [16]:
tensor_ex.reshape([-1,6])

tensor([[0.8050, 0.1283, 0.5530, 0.0830, 0.8058, 0.9615],
        [0.7365, 0.1058, 0.7586, 0.5012, 0.9674, 0.7333]])

#### 카피가 아니다!(메모리를 가져온다.)

In [25]:
a = torch.zeros(3, 2)
b = a.view(2, 3)
a.fill_(1)

tensor([[1., 1.],
        [1., 1.],
        [1., 1.]])

In [26]:
b

tensor([[1., 1., 1.],
        [1., 1., 1.]])

In [27]:
a

tensor([[1., 1.],
        [1., 1.],
        [1., 1.]])

In [30]:
a = torch.zeros(3, 2)
b = a.t().reshape(6)
a.fill_(1)

tensor([[1., 1.],
        [1., 1.],
        [1., 1.]])

In [31]:
b

tensor([0., 0., 0., 0., 0., 0.])

#### squeeze, unsqueeze
- axis(dim)을 지정해준다.
<img src = "../images/ai_30.png">

In [54]:
tensor_ex = torch.rand(size = (2, 1, 2))
print(tensor_ex)
tensor_ex.squeeze()

tensor([[[0.5279, 0.8712]],

        [[0.6101, 0.9681]]])


tensor([[0.5279, 0.8712],
        [0.6101, 0.9681]])

In [36]:
tensor_ex = torch.rand(size = (2, 2))
print(tensor_ex.unsqueeze(0))
tensor_ex.unsqueeze(0).shape

tensor([[[0.5156, 0.4380],
         [0.7923, 0.9763]]])


torch.Size([1, 2, 2])

In [37]:
print(tensor_ex.unsqueeze(1))
tensor_ex.unsqueeze(1).shape

tensor([[[0.5156, 0.4380]],

        [[0.7923, 0.9763]]])


torch.Size([2, 1, 2])

In [38]:
print(tensor_ex.unsqueeze(2))
tensor_ex.unsqueeze(2).shape

tensor([[[0.5156],
         [0.4380]],

        [[0.7923],
         [0.9763]]])


torch.Size([2, 2, 1])

### operation
- numpy와 동일

In [55]:
n1 = np.arange(10).reshape(2, 5)
t1 = torch.FloatTensor(n1)

t1+t1

tensor([[ 0.,  2.,  4.,  6.,  8.],
        [10., 12., 14., 16., 18.]])

In [56]:
t1 - t1

tensor([[0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.]])

In [57]:
t1 + 10

tensor([[10., 11., 12., 13., 14.],
        [15., 16., 17., 18., 19.]])

### 행렬곱셈 연산은 함수 dot이 아닌 mm을 사용
- 벡터(1차원) 연산은 dot
- 행렬간의 연산은 mm

In [68]:
n2 = np.arange(10).reshape(5, 2)
t2 = torch.FloatTensor(n2)

In [59]:
t1.mm(t2)

tensor([[ 60.,  70.],
        [160., 195.]])

In [66]:
t1.dot(t2)

RuntimeError: 1D tensors expected, but got 2D and 2D tensors

In [62]:
# mm과 같음
t1.matmul(t2)

tensor([[ 60.,  70.],
        [160., 195.]])

In [64]:
a = torch.rand(10)
b = torch.rand(10)
a.dot(b)

tensor(2.2277)

In [67]:
a.mm(b)

RuntimeError: self must be a matrix

### mm과 matmul은 broadcasting 지원 차이가 있다


In [86]:
a = torch.rand(5, 2, 3)
b = torch.rand(3)
a.mm(b) 

RuntimeError: self must be a matrix

In [87]:
a.matmul(b)

tensor([[1.4764, 1.3471],
        [1.3407, 1.4098],
        [1.6315, 1.0563],
        [1.1733, 1.1790],
        [1.4994, 0.8969]])

In [100]:
# matmul의 broadcasting은 이와 같다.

for i in range(5):
    print(a[i].mm(torch.unsqueeze(b, 1)).squeeze())

tensor([1.4764, 1.3471])
tensor([1.3407, 1.4098])
tensor([1.6315, 1.0563])
tensor([1.1733, 1.1790])
tensor([1.4994, 0.8969])


### Tensor operations for ML/DL formula
- nn.funcional 모듈을 통해 다양한 수식 변환 지원

In [104]:
import torch.nn.functional as F

tensor = torch.FloatTensor([0.5, 0.7, 0.1])
h_tensor = F.softmax(tensor, dim = 0)
print(tensor)
h_tensor

tensor([0.5000, 0.7000, 0.1000])


tensor([0.3458, 0.4224, 0.2318])

In [108]:
y = torch.randint(5,(1, 5))
print(y)
y_label = y.argmax(dim = 1)
y_label

tensor([[1, 2, 1, 0, 1]])


tensor([1])

In [109]:
F.one_hot(y_label)

tensor([[0, 1]])

## AutoGrad
- PyTorch의 핵심 기능인 자동 미분 기능 $\Rightarrow$ backward 함수 사용

$$ y = w^2 $$
$$ z = 10*y + 25 $$
$$ z = 10*w^2 + 25 $$

In [121]:
# 실제론 Linear등 함수 사용 default로 되어있어 true 설정 할 필요 x
w = torch.tensor(2.0, requires_grad = True) 
y = w**2
z = 10*y + 25
z.backward()
w.grad

tensor(40.)

$$ Q = 3a^3 - b^2 $$

In [126]:
a = torch.tensor([2., 3.], requires_grad = True)
b = torch.tensor([6., 4.], requires_grad = True)
Q = 3*a**3 - b**2
external_grad = torch.tensor([1., 1.])
Q.backward(gradient = external_grad)
a.grad

tensor([36., 81.])

In [131]:
b.grad

tensor([-12.,  -8.])

# Pytorch 프로젝트 구조 이해하기
- ML 코드를 계속 주피터에서 사용할 수는 없다
- 개발 초기 단계에서는 대화식 개발 과정(주피터)이 유리하다  
  $\rightarrow$ 학습과정과 디버깅등을 지속적으로 확인 가능하기 때문이다.
- 배포 공유 단계에서는 note book공유의 어려움의 있다.  
  $\rightarrow$ 쉬운 재현의 어려움, 실행순서 꼬임
- DL 코드도 하나의 프로그램 : 개발 용이성 확보와 유지보수 향상 필요

### 코드도 레고 블록처럼... OOP + 모듈 $\rightarrow$ 프로젝트
- 다양한 프로젝트 템플릿이 존재한다.
- 사용지 필요에 따라 수정하여 사용
- 실행, 데이터, 모델, 설정, 로깅, 지표, 유틸리티 등.
- 다양한 모듈들을 분리하여 프로젝트 템플릿화

### PyTorch Template 추천 repository
https://github.com/victoresque/pytorch-template

<img src = "../images/ai_31.png">

### CLI에서 사용
1. 새로운 가상환경 torch 생성 
    - conda activate torch 
2. 새로운 프로젝트 생성
    - python3 new_project.py MyProject. 
    - 'code . ' 을 입력하면 코드를 볼 수 있다
3. 트레이닝
    - python3 train.py -c config.json

### 구글 colab에서 사용
- 구글 colab 역시 하나의 컴퓨터이다.
- 내 컴퓨터에서 원격로 접속해 사용하게 해주는 프로그램중 하나가 ngrok이다.
1. ngrok 가입 후 token키 복사
2. colab에서 NGROK_TOKEN와 PASSWORD 설정
3. pip in stall colab-ssh 후
   from colab_ssh import launch_ssh
   launch_ssh(NGROK_TOKEN, PASSWORD) 
4. vsc설정 (remote ssh 설치 후 코랩에서 준 주소로 연결 passward 입력)
5. command + shift + p로 connect
6. /content/pytorch-template/MNIST-example 경로에서
   python3 train.py -c config.json 입력
7. /content/drive/MyDrive 에 실제 결과물들이 있다.
8. /content/drive/MyDrive cp -r /content/pytorch-templates ./
   입력 하면 구글 드라이브에서 파일 확인 가능

## 파일 보기

### 시작 : train.py
- -c or --config는 설정 파일 load후 config parser에 넘김
- config parserd의 from_args에 arg 넘김
- from_args에서는 read_json로 하나의 dict 파일로 만들고 config 변수로 만든후 return
- 이 config 파일을 기반으로 실행됨 

### getitem
- parse_config를 좀 더 살펴보면 \_\_getitem_\_ 함수가 있다.
- 이 함수는 index 를 넣으면 값을 불러오는 함수이다.

In [132]:
# 예시
class Test(object):
    def __getitem__(self, items):
        print (type(items), items)

# Driver code
test = Test()
test[5]
test[5:65:5]
test['GeeksforGeeks']
test[1, 'x', 10.0]
test['a':'z':2]
test[object()]

<class 'int'> 5
<class 'slice'> slice(5, 65, 5)
<class 'str'> GeeksforGeeks
<class 'tuple'> (1, 'x', 10.0)
<class 'slice'> slice('a', 'z', 2)
<class 'object'> <object object at 0x10d3cba10>


### get_logger
- parse_config에는 get_logger 함수가 잇다.
- 이 함수는 로깅을 'train'으로 할지 'test'로 input으로 받는다

### init_obj
- 데이터를 불러오는 역할
- getattr를 사용해서 모듈안에 있는 attribute(Mnist dataloder)를 불러온다(config.json 파일에 Mninst_dataloder를 여러개 만드는것(하드코딩)이 아닌 마음대로 수정할 수 있게 하는것)
- Data들이 하나씩 config.json 파일에 들어간다.

### model
- 모델 역시 같은 방식으로 불러온다
- module_arch를 통해 불러온다.

### train
- train.py의 Trainer는 가장 중요한 기능
- 요리하는 soup 같은 것이다.
- model, Data, loss 등의 값을 넣고
- trainder.train() 해준다.
- 여러가지 데이터를 저장 한후 train을 하게된다.
- 실제 train은 base_trainer.py에서 시행
- base_train.py 에선 epoch을 반복, 중간중간 logging해줌
- Trainer() 클래스가 이 base_trainer을 상속받았으므로 epoch을 돌 때마다 모델을 불러오게 된다. 
- data_loder로 data를 불러와 optimizer로 gradient 초기화 해줌,최종적으로 $\hat y$ (예측값) 설정, 실제값 간의 losts 값 계산 후 backward()해줌, 그리고 각각의 grad를 업데이트 해줘서 한번 batch 업데이트
- 결국 config.json에서 설정한 epoch 만큼 train을 실시하게 된다.

### test
- data_loder로 생성된모델을 불러와
- checkpoint(saved)에 저장된 파일을 불러와 성능 측정