# PyTorch Basic
---
  
  
## 1. 파이토치 패키지의 기본 구성
#### 1. torch  
메인 네임스페이스. 텐서 등의 다양한 수학 함수 포함
#### 2. torch.autograd  
자동 미분을 위한 함수들이 포함되어져 있다.
#### 3. torch.nn
신경망을 구축하기 위한 다양한 데이터 구조나 레이어 등이 정의되어져 있다.  
예를 들어 RNN, LSTM 과 같은 레이어, ReLU와 같은 활성화 함수, MSELose와 같은 손실 함수들이 있다.
#### 4. torch.optim
확률적 경사 하강법(Stochastic Gradient Descent,SGD)를 중심으로 한 파라미터 최적화 알고리즘이 구현되어져 있다.
#### 5. torch.utils.data
SGD의 반복 연산을 실행할 때 사용하는 미니 배치용 유틸리티 함수가 포함되어져 있다.
#### 6. torch.onnx
ONNX(Open Neural Network Exchange)의 포맷으로 모델을 export 할 때 사용한다.    
ONNX는 서로 다른 딥러닝 프레임워크 간에 모델을 공유할 때 사용하는 포맷이다.  
<br/><br/>
## 2. 텐서 조작하기(Tensor Manipulation)

### 1. 텐서 선언하기(PyTorch Tensor Allocation)
#### 1) 1D with PyTorch

In [4]:
import torch
import numpy as np

t = torch.FloatTensor([0,1,2,3,4,5,6])
print(t)
print(t.dim()) # rank 즉, 차원
print(t.shape) # shape
print(t.size()) # shape

print(t[0],t[1],t[-1]) # 인덱스로 접근
print(t[2:5],t[4:-1]) # 슬라이싱
print(t[:2],t[3:]) # 슬라이싱

tensor([0., 1., 2., 3., 4., 5., 6.])
1
torch.Size([7])
torch.Size([7])
tensor(0.) tensor(1.) tensor(6.)
tensor([2., 3., 4.]) tensor([4., 5.])
tensor([0., 1.]) tensor([3., 4., 5., 6.])


#### 2) 2D with PyTorch

In [12]:
t = torch.FloatTensor([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
print(t)

print(t.dim()) # rank. 즉, 차원
print(t.size()) # shape

print(t[:,1]) # 첫번째 차원을 전체 선택한 상황에서 두번째 차원의 첫번째 것만 가져옴.
print(t[:,1].size()) # ↑ 위의 경우의 크기

print(t[:,:-1]) # 첫번째 차원을 전체 선택한 상황에서 두번째 차원에서는 맨 마지막에서 첫번째를 제외하고 다 가져온다.

tensor([[ 1.,  2.,  3.],
        [ 4.,  5.,  6.],
        [ 7.,  8.,  9.],
        [10., 11., 12.]])
2
torch.Size([4, 3])
tensor([ 2.,  5.,  8., 11.])
torch.Size([4])
tensor([[ 1.,  2.],
        [ 4.,  5.],
        [ 7.,  8.],
        [10., 11.]])


#### 3) 브로드캐스팅(Broadcasting)

In [15]:
m1 = torch.FloatTensor([[1,2]])
m2 = torch.FloatTensor([3])
print(m1+m2)

m3 = torch.FloatTensor([[1,2]])
m4 = torch.FloatTensor([[3],[4]])
print(m3+m4)

tensor([[4., 5.]])
tensor([[4., 5.],
        [5., 6.]])


딥 러닝을 하게되면 크기가 다른 행렬 또는 텐서에 대해서 사칙 연산을 수행할 필요가 있다.  
이를 위해 파이토치에서는 자동으로 크기를 맞춰 연산을 수행하게 만드는 **브로드캐스팅**이라는 기능을 제공한다.
#### 4) 자주 사용되는 기능들
#### 1. 행렬 곱셈과 곱셈의 차이

In [18]:
m1 = torch.FloatTensor([[1,2],[3,4]])
m2 = torch.FloatTensor([[1],[2]])

print('Shape of Matrix 1: {}'.format(m1.shape))
print('Shape of Matrix 2: {}'.format(m2.shape))

print(m1.matmul(m2)) # Matrix Multiplication
print(m1*m2) # Multiplication

Shape of Matrix 1: torch.Size([2, 2])
Shape of Matrix 2: torch.Size([2, 1])
tensor([[ 5.],
        [11.]])
tensor([[1., 2.],
        [6., 8.]])


#### 2. 평균(Mean)

In [19]:
t = torch.FloatTensor([1,2])
print(t.mean())

tensor(1.5000)


In [22]:
t = torch.FloatTensor([[1,2],[3,4]])
print(t)
print(t.mean())

print(t.mean(dim=0)) # dim에 해당하는 차원을 제거
print(t.mean(dim=1))
print(t.mean(dim=-1)) # 마지막 차원 제거

tensor([[1., 2.],
        [3., 4.]])
tensor(2.5000)
tensor([2., 3.])
tensor([1.5000, 3.5000])
tensor([1.5000, 3.5000])


#### 3. 덧셈(Sum)

In [23]:
t = torch.FloatTensor([[1,2],[3,4]])
print(t)

print(t.sum())
print(t.sum(dim=0))
print(t.sum(dim=1))
print(t.sum(dim=-1))

tensor([[1., 2.],
        [3., 4.]])
tensor(10.)
tensor([4., 6.])
tensor([3., 7.])
tensor([3., 7.])


#### 4. 최대(Max)와 아그맥스(ArgMax)
max에 dim인자를 주면 argmax도 함께 리턴하는 특징이 있다.  
만약 max 또는 argmax만 리턴받고 싶다면 리턴값에도 인덱스를 부여하면 된다.  
0번 인덱스를 사용하면 max값, 1번 인덱스를 사용하면 argmax값만 받아올 수 있다.

In [44]:
t = torch.FloatTensor([[1,2],[3,4]])
print(t)

print(t.max())
print(t.max(dim=0))

print('Max: {}'.format(t.max(dim=0)[0]))
print('Argmax: {}'.format(t.max(dim=1)[1]))

tensor([[1., 2.],
        [3., 4.]])
tensor(4.)
torch.return_types.max(
values=tensor([3., 4.]),
indices=tensor([1, 1]))
Max: tensor([3., 4.])
Argmax: tensor([1, 1])


#### 5) 뷰(View) - 원소의 수를 유지하면서 텐서의 크기 변경
넘파이에서의 reshape와 같은 역할을 함

In [47]:
t = np.arange(12).reshape(2,2,3)
ft = torch.FloatTensor(t)
print(ft)
print(ft.shape)

tensor([[[ 0.,  1.,  2.],
         [ 3.,  4.,  5.]],

        [[ 6.,  7.,  8.],
         [ 9., 10., 11.]]])
torch.Size([2, 2, 3])


In [51]:
print(ft.view([-1,3])) # ft라는 텐서를 (?,3)의 크기로 변경
print(ft.view([-1,3]).shape)

tensor([[ 0.,  1.,  2.],
        [ 3.,  4.,  5.],
        [ 6.,  7.,  8.],
        [ 9., 10., 11.]])
torch.Size([4, 3])


In [53]:
print(ft.view([-1,1,3]))
print(ft.view([-1,1,3]).shape)

tensor([[[ 0.,  1.,  2.]],

        [[ 3.,  4.,  5.]],

        [[ 6.,  7.,  8.]],

        [[ 9., 10., 11.]]])
torch.Size([4, 1, 3])


#### 6) 스퀴즈(Squeeze) - 차원이 1인 경우 해당 차원을 제거

In [55]:
ft = torch.FloatTensor([[0],[1],[2]])
print(ft)
print(ft.shape)

print(ft.squeeze())
print(ft.squeeze().shape)

tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])
tensor([0., 1., 2.])
torch.Size([3])


#### 7) 언스퀴즈(Unsqueeze) - 특정 위치에 1인 차원을 추가

In [6]:
ft = torch.Tensor([0,1,2])
print(ft.shape)

print(ft.unsqueeze(0)) # 첫번째 차원에 1인 차원이 추가
print(ft.unsqueeze(0).shape)

print(ft.unsqueeze(1)) 
print(ft.unsqueeze(1).shape)

print(ft.unsqueeze(-1)) # 마지막 차원에 1인 차원이 추가
print(ft.unsqueeze(-1).shape)

torch.Size([3])
tensor([[0., 1., 2.]])
torch.Size([1, 3])
tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])
tensor([[0.],
        [1.],
        [2.]])
torch.Size([3, 1])


#### 8) 타입 캐스팅(Type Casting)

In [7]:
lt = torch.LongTensor([1,2,3,4])
print(lt)
print(lt.float())

bt = torch.ByteTensor([True,False,False,True])
print(bt)

print(bt.long())
print(bt.float())

tensor([1, 2, 3, 4])
tensor([1., 2., 3., 4.])
tensor([1, 0, 0, 1], dtype=torch.uint8)
tensor([1, 0, 0, 1])
tensor([1., 0., 0., 1.])


#### 9) 연결하기(concatenate)

In [6]:
x = torch.FloatTensor([[1,2],[3,4]])
y = torch.FloatTensor([[5,6],[7,8]])

print(torch.cat([x,y],dim=0)) # 첫번째 차원을 늘림

print(torch.cat([x,y],dim=1))

tensor([[1., 2.],
        [3., 4.],
        [5., 6.],
        [7., 8.]])
tensor([[1., 2., 5., 6.],
        [3., 4., 7., 8.]])


#### 10) 스택킹(Stacking)

In [9]:
x = torch.FloatTensor([1,4])
y = torch.FloatTensor([2,5])
z = torch.FloatTensor([3,6])

print(torch.stack([x,y,z]))
print(torch.cat([x.unsqueeze(0),y.unsqueeze(0),z.unsqueeze(0)],dim=0))

print(torch.stack([x,y,z],dim=1))

tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])
tensor([[1., 4.],
        [2., 5.],
        [3., 6.]])
tensor([[1., 2., 3.],
        [4., 5., 6.]])


#### 11) ones_like , zeros_like - 0으로 채워진 텐서와 1로 채워진 텐서

In [10]:
x = torch.FloatTensor([[0,1,2],[2,1,0]])
print(x)

print(torch.ones_like(x))
print(torch.zeros_like(x))

tensor([[0., 1., 2.],
        [2., 1., 0.]])
tensor([[1., 1., 1.],
        [1., 1., 1.]])
tensor([[0., 0., 0.],
        [0., 0., 0.]])


#### 12) In-place Operation(덮어쓰기 연산)

In [14]:
x = torch.FloatTensor([[1,2],[3,4]])

print(x.mul(2.))
print(x)

print(x.mul_(2.)) # 연산 뒤에 _를 붙여 기존의 값을 덮어쓰기 함.
print(x)

tensor([[2., 4.],
        [6., 8.]])
tensor([[1., 2.],
        [3., 4.]])
tensor([[2., 4.],
        [6., 8.]])
tensor([[2., 4.],
        [6., 8.]])
