<a href="https://colab.research.google.com/github/ahn283/finance/blob/main/pytorch_framework.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### <b>1. 파이토치(PyTorch) 개요</b>

* PyTorch는 기계 학습 프레임워크(framework) 중 하나다.
  * PyTorch의 텐서(tensor)는 NumPy 배열과 매우 유사하다.
* PyTorch를 사용하면, GPU 연동을 통해 효율적으로 딥러닝 모델을 학습할 수 있다.
* Google Colab을 이용하면, 손쉽게 PyTorch를 시작할 수 있다.
* Google Colab에서는 <b>[런타임]</b> - <b>[런타임 유형 변경]</b>에서 <b>GPU를 선택</b>할 수 있다.

In [None]:
import torch

#### <b>1) GPU 사용 여부 체크하기</b>

* 텐서간의 연산을 수행할 때, 기본적으로 두 텐서가 같은 장치에 있어야 한다.
* 따라서 가능하면, 연산을 수행하는 텐서들을 모두 GPU에 올린 뒤에 연산을 수행한다.

In [None]:
data = [
    [1, 2],
    [3, 4]
]

x = torch.tensor(data)
print(x.is_cuda)

In [None]:
# GPU 로 옮기기
x = x.cuda()
print(x.is_cuda)

In [None]:
# CPU 로 옮기기
x = x.cpu()
print(x.is_cuda)

* <b>서로 다른 장치(device)</b>에 있는 텐서끼리 연산을 수행하면 오류가 발생한다.

In [None]:
# tensor on GPU
a = torch.tensor([
    [1, 1],
    [2, 2]
]).cuda()

# tensor on CPU
b = torch.tensor([
    [5, 6],
    [7, 8]
])
# print(torch.matmul(a, b))   # error
print(torch.matmul(a.cpu(), b))

### <b>2. 텐서 소개 및 생성 방법</b>

* PyTorch에서의 텐서(tensor)는 기능적으로 넘파이(NumPy)와 매우 유사하다.
* 기본적으로 <b>다차원 배열</b>을 처리하기에 적합한 자료구조로 이해할 수 있다.
* PyTorch의 텐서는 "자동 미분" 기능을 제공한다.

#### <b>1) 텐서의 속성</b>

* 텐서의 <b>기본 속성</b>으로는 다음과 같은 것들이 있다.
  * 모양(shape)
  * 자료형(data type)
  * 저장된 장치

In [None]:
tensor = torch.rand(3, 4)

print(tensor)
print(f'shape: {tensor.shape}')
print(f'Data type: {tensor.dtype}')
print(f'Device: {tensor.device}')

#### <b>2) 텐서 초기화</b>

* 리스트 데이터에서 직접 텐서를 초기화할 수 있다.

In [None]:
data = [
    [1, 2],
    [3, 4]
]
x = torch.tensor(data)
print(x)

* NumPy 배열에서 텐서를 초기화할 수 있다.

In [None]:
a = torch.tensor([5])
b = torch.tensor([7])

c = (a + b).numpy()
print(c)
print(type(c))

result = c * 10
tensor = torch.from_numpy(result)
print(tensor)
print(type(tensor))

#### <b>3) 다른 텐서로부터 텐서 초기화하기</b>

* 다른 텐서의 정보를 토대로 텐서를 초기화할 수 있다.
* <b>텐서의 속성</b>: 모양(shape), 자료형(data type)

In [None]:
x = torch.tensor([
    [5, 7],
    [1, 2]
])

# x와 같은 모양과 자료형을 가지지만, 값이 1인 텐서 생성
x_ones = torch.ones_like(x)
print(x_ones)
# x와 같은 모양을 가지되, 자료형은 float으로 덮어쓰고, 값은 랜덤으로 채우기
x_rand = torch.rand_like(x, dtype=torch.float32)  # uniform distribution [0, 1)
print(x_rand)

### <b>3. 텐서의 형변환 및 차원 조작</b>

* 텐서는 넘파이(NumPy) 배열처럼 조작할 수 있다.

#### <b>1) 텐서의 특정 차원 접근하기</b>

* 텐서의 원하는 차원에 접근할 수 있다.

In [None]:
tensor = torch.tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
])

print(tensor[0])  # first row
print(tensor[:, 0])   # first column
print(tensor[..., -1])  # last column

#### <b>2) 텐서 이어붙이기(Concatenate)</b>

* 두 텐서를 이어 붙여 연결하여 새로운 텐서를 만들 수 있다.

In [None]:
tensor = torch.tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
])

# dim: 텐서를 이어 붙이기 위한 축
# 0번 축(행)을 기준으로 이어 붙이기
result = torch.cat([tensor, tensor, tensor], dim=0)
print(result)

# 1번 축(열)을 기준으로 이어 붙이기
result = torch.cat([tensor, tensor, tensor], dim=1)
print(result)

#### <b>3) 텐서 형변환(Type Casting)</b>

* 텐서의 자료형(정수, 실수 등)을 변환할 수 있다.

In [None]:
a = torch.tensor([2], dtype=torch.int)
b = torch.tensor([5.0])

print(a.type)
print(b.type)

# 텐서 a는 자동으로 float32형으로 형변환 처리
print(a + b)
# 텐서 b를 int32형으로 형변환하여 덧셈 수행
print(a + b.type(torch.int32))

#### <b>4) 텐서의 모양 변경</b>

* view()는 텐서의 모양을 변경할 때 사용한다.
* 이때, 텐서(tensor)의 순서는 변경되지 않는다.

In [None]:
# view()는 텐서의 모양을 변경할 때 사용한다.
# 이 때, 텐서(tensor)의 순서는 변경되지 않는다.
a = torch.tensor([1, 2, 3, 4, 5, 6, 7, 8])
b = a.view(4, 2)
print(b)

# a의 값을 변경하면 b도 변경
a[0] = 7
print(b)

# a의 값을 복사(copy)한 뒤에 변경
c = a.clone().view(4, 2)
a[0] = 9
print(c)

#### <b>5) 텐서의 차원 교환</b>

* 하나의 텐서에서 특정한 차원끼리 순서를 교체할 수 있다.

In [None]:
a = torch.rand((64, 32, 3))
print(a.shape)

b = a.permute(2, 1, 0)   # 차원 자체를 교환 (3번째 차원, 2번째 차원, 1번째 차원)
# (2번째 축, 1번째 축, 0번째 축)의 형태가 되도록 한다.
print(b.shape)

### <b>4. 텐서의 연산과 함수</b>

#### <b>1) 텐서의 연산</b>

* 텐서에 대하여 사칙연산 등 기본적인 연산을 수행할 수 있다.

In [None]:
# 같은 크기를 가진 두 개의 텐서에 대해서 사칙연산 가능
# 기본적으로 요소별(element-wise) 연산
a = torch.tensor([
    [1, 2],
    [3, 4]
])
b = torch.tensor([
    [5, 6],
    [7, 8]
])
print(a + b)
print(a - b)
print(a * b)
print(a / b)

* 행렬 곱을 수행할 수 있다.

In [None]:
a = torch.tensor([
    [1, 2],
    [3, 4]
])
b = torch.tensor([
    [5, 6],
    [7, 8]
])

# 행렬 곱(matrix multiplication) 수행
print(a.matmul(b))
print(torch.matmul(a, b))

#### <b>2) 텐서의 평균 함수</b>

* 텐서의 평균(mean)을 계산할 수 있다.

In [None]:
a = torch.Tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8]
])

print(a)
print(a.mean())   # 전체 원소에 대한 평균
print(a.mean(dim=0))  # 각 열에 대하여 평균 계산
print(a.mean(dim=1))  # 각 행에 대하여 평균 계산

#### <b>4) 텐서의 최대 함수</b>

* <b>max() 함수</b>는 원소의 최댓값을 반환한다.
* <b>argmax() 함수</b>는 가장 큰 원소(최댓값)의 인덱스를 반환한다.

In [None]:
a = torch.Tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8]
])

print(a)
print(a.max())  # 전체 원소에 대한 최대값
print(a.max(dim=0)) # 각 열에 대하여 최대값 계산
print(a.max(dim=1)) # 각 행에 대하여 최대값 계산

In [None]:
a = torch.Tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8]
])
print(a)
print(a.argmax()) # 전체 원소에 대한 최대값의 인덱스
print(a.argmax(dim=0))  # 각 열에 대하여 최대값의 인덱스 계산
print(a.argmax(dim=1))  # 각 행에 대하여 최대값의 인덱스 계산

#### <b>5) 텐서의 차원 줄이기 혹은 늘리기</b>

* <b>unsqueeze() 함수</b>는  크기가 1인 차원을 추가한다.
  * 배치(batch) 차원을 추가하기 위한 목적으로 흔히 사용된다.
* <b>squeeze() 함수</b>는 크기가 1인 차원을 제거한다.

In [None]:
a = torch.Tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8]
])
print(a.shape)

# 첫 번째 축에 차원 추가
a = a.unsqueeze(0)
print(a)

# 네 번째 축에 차원 추가
a = a.unsqueeze(3)
print(a)
print(a.shape)

In [None]:
# 크기가 1인 차원 제거
print(a.shape)
a = a.squeeze()
print(a)
print(a.shape)

### <b>5. 자동 미분과 기울기(Gradient)</b>

* PyTorch에서는 연산에 대하여 자동 미분을 수행할 수 있다.

In [None]:
import torch

# requires_grad를 설정할 때만 기울기 추적
x = torch.tensor([3.0, 4.0], requires_grad=True)
y = torch.tensor([1.0, 2.0], requires_grad=True)
z = x + y 

print(z)  # [4.0, 6.0]
print(z.grad_fn) # 더하기(add)

out = z.mean()
print(out)  # 5.0
print(out.grad_fn)  # 평균(mean)

out.backward()  # sclar에 대하여 가능
print(x.grad)
print(y.grad)
print(z.grad)   # leat variable에 대해서만 gradient 추적이 가능하다. 따라서 None.

* 일반적으로 모델을 학습할 때는 <b>기울기(gradient)를 추적</b>한다.
* 하지만, 학습된 모델을 사용할 때는 파라미터를 업데이트하지 않으므로, 기울기를 추적하지 않는 것이 일반적이다.

In [None]:
temp = torch.tensor([3.0, 4.0], requires_grad=True)
print(temp.requires_grad)
print((temp ** 2).requires_grad)

# 기울기 추적을 하지 않기 때문에 계산 속도가 더 빠르다.
with torch.no_grad():
  temp = torch.tensor([3.0, 4.0], requires_grad=True)
  print(temp.requires_grad)
  print((temp ** 2).requires_grad)