# Pytorch 


### " 강력한 GPU 가속이 적용되는 파이썬으로 된 텐서와 동적 신경망 "

* 텐서(Tensor)는 물리학과 공학에 많이 사용되는 수학적 구조다. 
* GPU 가속은 대부분의 현대 심층 신경망 프레임워크에 있는 기능이다. 동적 신경망은 반복할 때마다 변경이 가능한 신경망으로, 예를 들어 파이토치 모델이 학습 중 숨은 계층을 추가하거나 제거해서 정확성과 일반성을 개선할 수 있도록 한다. 
* 파이토치는 각 반복 단계에서 즉석으로 그래프를 재생성한다. 반면 텐서플로우는 기본적으로 단일 데이터 흐름 그래프를 만들고 그래프 코드를 성능에 맞게 최적화한 다음 모델을 학습시킨다.

### Pytorch 패키지의 구성 요소 

* torch
    * main namespace로 tensor등의 다양한 수학 함수가 패키지에 포함되어 있습니다.
    * Numpy와 같은 구조를 가지고 있어서 numpy와 상당히 비슷한 문법 구조를 가지고 있습니다.
    
* torch.autograd
    * 자동 미분을 위한 함수가 포함되어 있습니다.
    * 자동 미분의 on,off를 제어하는 enable_grad 또는 no_grad 자체 미분 가능 함수를 정의할 때 사용하는 기반 클래스인 Function등이 포함
    
* torch.nn 
    * 신경망을 구축하기 위한 다양한 데이터 구조나 레이어가 정의되어 있습니다.
    * CNN, LSTM, 활성화 함수(ReLu), loss 등이 정의되어 있습니다.
    
* torch.optim
    * SGD 등의 파라미터 최적화 알고리즘 등이 구현되어 있습니다.

* torch.utils.data
    * Gradient Descent 계열의 반복 연산을 할 때, 사용하는 미니 배치용 유틸리티 함수가 포함되어 있습니다.
    
* torch.onnx
    * ONNX(Open Neural Network eXchange) 포맷으로 모델을 export 할 때 사용합니다.
    * ONNX는 서로 다른 딥러닝 프레임워크 간에 모델을 공유할 때 사용하는 새로운 포맷입니다.

##### 라이브러리 사용법 

* 파이토치의 tensor는 CPU 또는 GPU에서 연산이 가능합니다. 이 연산은 텐서에서 기초적으로 제공되고, <span style="font-weight:bold">torch.autrograd</span>에서 정제됩니다.


* 파이토치에서 신경망을 쌓기 위한 모듈은  <span style="font-weight:bold">torch.nn</span> 입니다. 완전연결층(fc:fully conected, <span style="font-weight:bold">nn.Linear</span>), 합성곱층(convolution layer, <span style="font-weight:bold">nn.Conv2d</span>), 활성화 함수(activation function), 손실함수(loss function) 등을 적용할 수 있습니다. 



* 데이터를 불러오거나 다루는(handling) 데 필요한 다용도기능은 <span style="font-weight:bold">torch.utils</span>에서 찾을 수 있습니다.



* <span style="font-weight:bold">Dataset</span>을 통해 개인적인(custom) 데이터를 pytorch 표준 텐서로 바꿀 수 있습니다.



* 그리고 <span style="font-weight:bold">DataLoader</span> 통해 배치단위로 학습 루프에 들어가기 위한 데이터를 준비해주는 데이터 로더를 만들 수 있습니다.



* 아니라 여러 대의 GPU를 데이터 로딩과 학습 연산에 사용할 수 있도록 <span style="font-weight:bold">torch.nn.DataParallel</span>과 <span style="font-weight:bold">torch.distributed</span>를 지원합니다.



* 모델의 최적화를 위해 <span style="font-weight:bold">torch.optim</span>을 지원합니다.



* Python 인터프리터의 비용을 줄이고 Python 런타임으로부터 독립적으로 모델을 실행시키기 위해, 파이토치는 TorchScript를 제공합니다. 텐서 연산에 제한된 가상 머신을 생각하면 좋습니다. 효율적 연산을 위해 Just in Time(JIT)을 지원합니다.

![image.png](attachment:image.png)

# PyTorch 기초 사용법

* 먼저 위와 같이 pytorch의 torch라는 것을 통하여 생성할 수 있습니다. 여기서 보면 앞에서 언급한 바와 같이 numpy와 상당히 비슷한 것을 느낄 수 있습니다.

* numpy스러운 문법 구조

In [1]:
import torch

nums = torch.arange(9)
nums

tensor([0, 1, 2, 3, 4, 5, 6, 7, 8])

In [2]:
nums.shape

torch.Size([9])

In [3]:
type(nums)

torch.Tensor

### Numpy Vs Torch 

* Numpy는 일반적인 머신러닝에서 사용되지만 Torch Tensor는 무거운 행렬연산에 최적화
* Torch Tensor는 Tensor 생성시 추가 Parameter로 device_type과 require_grad를 옵션으로 지원

* tensor를 numpy로 변환하는 경우? -> numpy array가 tensor보다 다루기 쉬움. image array나 데이터 연산등이 더 편리함.


## torch Vs Torch

1. Tensor

torch.Tensor란 PyTorch의 자료구조 클래스이다.

tensor형 데이터를 담고 있는 클래스를 의미한다.

 

2. tensor

torch.tensor는 어떤 데이터를 tensor 자료형으로 만들어주는 함수이다.

(내부적으로는 데이터를 copy하는 구조)

즉, tensor를 통해서 어떠한 데이터를 Tensor 데이터 타입으로 만들어준다고 보면 된다.


![image.png](attachment:image.png)

###### tensor를 넘파이로 변환

In [4]:
nums.numpy() # tensor를 numpy로 타입 변환

array([0, 1, 2, 3, 4, 5, 6, 7, 8])

In [5]:
nums.reshape(3,3)

tensor([[0, 1, 2],
        [3, 4, 5],
        [6, 7, 8]])

In [6]:
nums = torch.arange(9).reshape(3,3)
nums

tensor([[0, 1, 2],
        [3, 4, 5],
        [6, 7, 8]])

In [7]:
nums + nums

tensor([[ 0,  2,  4],
        [ 6,  8, 10],
        [12, 14, 16]])

## Tensor의 생성과 변환 

* 텐서는 Pytorch의 가장 기본이 되는 데이터 구조와 기능을 제공하는 다차원 배열을 처리하기 위한 데이터 구조입니다.

* API 형태는 <span style=font-weight:bold>Numpy</span>의 ndarray와 비슷하며 GPU를 사용하는 계산도 지원합니다.

* 텐서는 각 데이터 형태별로 정의되어 있습니다.
    * torch.FloatTensor : 32bit float point
    * torch.LongTensor : 64bit signed integer 
    
* GPU 상에서 계산할 때에는 torch.cuda.FloatTensor를 사용합니다. 일반적으로 Tensor는 FloatTensor라고 생각하면 됩니다. 


* 어떤 형태의 텐서이건 torch.tensor라는 함수로 작성할 수 있습니다.

In [14]:
# 2차원 형태의 list를 이용하여 텐서를 생성할 수 있음

torch.tensor([[1,2], [3,4.]])

# device를 지정하면 GPU에 텐서를 만들수 있습니다. 

## torch.tensor([[1,2], [3,4.]], device="cuda:0")

# dtype을 이용하여 텐서의 데이터 형태를 지정할 수도 있습니다. 

torch.tensor([[1,2], [3,4.]], dtype=torch.float64)

# arange를 이용한 1차원 텐서 

torch.arange(0,10)

# 모든 값이 0인 3 x 5의 텐서를 작성하여 to 메소드로 GPU에 전송 

torch.zeros(3,5).to("cpu")

# normal distribution 으로 3 x 5 텐서를 작성 

torch.randn(3,5)

# 텐서의 shape은 size 메서드로 확인 

t = torch.randn(3,5)
t.size()

torch.Size([3, 5])

* 텐서는 Numpy의 ndarry로 쉽게 변환 가능합니다.

* 단, GPU상의 텐서는 그대로 변환할 수 없으며 , CPU로 이동 후에 변환해야 합니다.

In [16]:
# numpy를 사용하여 ndarray로 변환 

t = torch.tensor([[1,2], [3,4.]])
x = t.numpy()
x

# GPU 상의 텐서는 to 메서드로 CPU 텐서로 변환 후 ndarray로 변한해야 합니다. 

# t = torch.tensor([[1,2], [3,4.]], device="cuda:0")
# x = t.to("cpu").numpy

array([[1., 2.],
       [3., 4.]], dtype=float32)

# 텐서의 인덱스 조작

* 텐서의 인덱스를 조작하는 방법은 여러가지가 있습니다. 

* 텐서는 Numpy의 ndarray와 같이 조작하는 것이 가능합니다. 배열처럼 인덱스를 바로 지정 가능하고 슬라이스, 마스크 배열을 사용할 수 있습니다.

In [20]:
t = torch.tensor([
    [1,2,3] , [4,5,6]
])

# 인덱스 접근 

t[0,2]

# 슬라이스로 접근 

t[:, :2]

# 마스크 배열을 이용하여 True 값만 추출 

t[t>3]

# 슬라이스를 이용하여 일괄 대입 

t[:, 1] = 10

# 마스크 배열을 사용하여 일괄 대입 

t[t>5] = 20

# 텐서 연산

* 텐서는 Numpy와 ndarray와 같이 다양한 수학 연산이 가능하며 GPU를 사용할 때에는 더 빠른 연산이 가능합니다. 


* 텐서에서의 샃칙연산은 같은 타입의 텐서 간 또는 텐서와 파이썬의 스칼라 값 사이에서만 가능합니다.
    * 텐서간이라도 타입이 다르면 연산이 되지 않습니다. FloatTensor와 DoubleTensor 간의 사칙연산은 오류가 발생합니다. 
    
* 스칼라 값을 연산할 때에는 기본적으로 broadcasting 이 지원됩니다.

##### broadcasting : 서로 크기가 다른 행렬들이 사칙연산을 수행할 수 있도록 자동으로 크기를 맞추어 연산을 수행

In [24]:
# 길이가 3인 벡터 

v = torch.tensor([1,2,3.])
w = torch.tensor([0,10,20])

# 2x3 의 행렬 

m = torch.tensor([
    [0,1,2], [100,200,300.]
])

# 벡터와 스칼라의 덧셈 

v2 = v + 10 

# 제곱 

v2 = v ** 2

# 동일 길이의 벡터간 덧셈 연산 

z = v - w
 
# 여러 가지 조합 

u = 2 * v -w  / 10 + 6.0

# 행렬과 스칼라 곱 

m2 = m * 2.0

# (2,3)인 행렬과 (3,0)인 벡터간의 덧셈이므로 브로드캐스팅 발생 

m+v

# 행렬 간 처리 

m + m 

tensor([[  0.,   2.,   4.],
        [200., 400., 600.]])

# 텐서의 차원 조작

* 텐서의 차원을 변경하는 view나 텐서를 결합하는 stack, cat, 차원을 교환하는 t, transpose 도 사용됩니다. 


* view는 numpy의 reshape와 유사합니다. 물론 pytorch 에서도 reshape 기능이 있으므로 view를 사용하던지 reshape를 사용하던지 사용 방법은 같으므로 선택해서 사용하면 됩니다. ( reshape 권장 ) 


* cat은 다른 길이의 텐서를 하나로 묶을 때 사용합니다. 


* transpose는 행렬의 전치 외에도 차원의 순서를 변경할 때에도 사용됩니다

In [32]:
x1 = torch.tensor([
    [1,2] , [3,4]
])

x2 = torch.tensor([
    [10,20,30], [40,50,60]
])

# 2x2 행렬을 4x1 로 변형합니다. 

x1.view(4,1)


x1.reshape(4,1)

# 2x2 행렬을 1차원 벡터로 변형합니다. 

x1.view(-1)

x1.reshape(-1)

# -1을 사용하면 shape에서 자동 계산 가능한 부분에 한해서 자동으로 입력됩니다. 
# 계산이 불가능 하면 오류가 발생 

x1.view(1, -1)

x1.reshape(1, -1)

# 2x3 행렬을 전치해서 3x2 행렬을 만듭니다.

x2.t()

# dim = 1 로 결합하면 2x5의 행렬로 묶을 수 있습니다. 

torch.cat([x1,x2], dim=1)

# transpose(dim0, dim1)을 사용하면 dim0의 차원과 dim1의 차원을 교환합니다.
# transpose(0, 3) 이라고 하면 0차원과 3차원을 교환하게 됩니다.
# 아래 예제는 HWC(높이, 너비, 컬러) 차원을 CHW(컬러, 높이, 너비)로 변형하는 예제입니다.
hwc_img_data = torch.rand(100, 64, 32, 3)
chw_img_data = hwc_img_data.transpose(1,2).transpose(1,3)
chw_img_data.size()

torch.Size([100, 3, 64, 32])

# Tensor 생성하기 

* Tensor를 생성할 때 대표적으로 사용하는 함수가 rand, zeros, ones 입니다. 이때 , 첫 인자는 dimension입니다. 

* 각 dimension은 tuple 형태로 묶어서 지정해 주어도 되고 콤마 형태로 풀어서 지정해 주어도 됩니다. 

* 예를 들어 torch.rand((2,3)) 와 torch.rand(2,3) 모두 같은 shape인 (2,3)을 가집니다. 

* 먼저 랜덤 넘버 생성에 대하여 다루어 보겠습니다.

In [33]:
import torch 

x = torch.rand(2,3)
print(x)

tensor([[0.5515, 0.1901, 0.8980],
        [0.4208, 0.5417, 0.4440]])


* 모든 값이 0인 zeros tensor를 생성

In [34]:
zeros = torch.zeros(2,5)
zeros

tensor([[0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.]])

* 다음은 모든 값이 1인 ones Tensor

In [35]:
ones = torch.ones(2,3)
ones

tensor([[1., 1., 1.],
        [1., 1., 1.]])

* arange를 이용한 Tensor 작성 

* torch.arange(start, end, step=1 ) -> (start, end) with step

In [36]:
torch.arange(0,3,step=0.5)


tensor([0.0000, 0.5000, 1.0000, 1.5000, 2.0000, 2.5000])

# Tensor 데이터 타입 

* Float 타입의 m행 n열 Tensor 생성하기

In [38]:
# 2행 3열의 Float 타입의 Tensor 생성 

torch.FloatTensor(2,3)

tensor([[0., 0., 0.],
        [0., 0., 0.]])

In [40]:
# 리스트를 입력하여 특정 리스트를 Tensor로 변환하기 

torch.FloatTensor([2,3])

tensor([2., 3.])

In [41]:
# Float 타입을 Int 타입으로 형변환 

x = torch.FloatTensor([2,3])
x.type_as(torch.IntTensor())

tensor([2, 3], dtype=torch.int32)