# 010. PyTorch basic

In [2]:
import torch
import numpy as np
import matplotlib.pyplot as plt

device = "cuda:0" if torch.cuda.is_available() else "cpu"
device

'cpu'

In [3]:
torch.__version__

'1.11.0'

## Tensor Data Types

<img src="https://miro.medium.com/max/875/1*-C10tKbZ2h0Zd7maau86oQ.png" height="400" />

### torch.tensor 함수

`tensor(data, dtype=None, device=None, requires_grad=False) -> Tensor`

     data (array_like): list, tuple, numpy ndarray, scalar, and other types.
     dtype :  `None`인 경우 `data`에서 데이터 유형을 유추합니다.  
     device : `cpu`, `cuda`  
     require_grad(bool, optional): autograd가 작업을 기록해야 하는 경우

Float torch tensor 생성

In [5]:
# numpy array 생성
a = np.ones((2, 3))
# tensor  생성
b = torch.tensor(a)
# dtype
print(a.dtype, '\t', b.dtype)

float64 	 torch.float64


In [7]:
# numpy 생성
a = np.ones((2, 3), dtype="float32")
# tensor 생성
b = torch.tensor(a)
# dtype
print(a.dtype, '\t', b.dtype)

float32 	 torch.float32


Integer tensor 생성

In [8]:
x = torch.tensor([[1, 2, 3], [4, 5, 6]], dtype=torch.int32)
x

tensor([[1, 2, 3],
        [4, 5, 6]], dtype=torch.int32)

In [9]:
x = torch.tensor([[1, 2, 3], [4, 5, 6]], dtype=torch.int32, device=device)
x

tensor([[1, 2, 3],
        [4, 5, 6]], dtype=torch.int32)

## 1D Tensor Operation

### tensor 생성

In [10]:
a = torch.tensor([7, 4, 3, 2, 6])

a[0], a[-1]

(tensor(7), tensor(6))

In [11]:
# cpu tensor
a = torch.FloatTensor([0, 1, 2, 3, 4])
a

tensor([0., 1., 2., 3., 4.])

In [12]:
# gpu tensor
a = torch.cuda.FloatTensor([0, 1, 2, 3, 4])
a

RuntimeError: Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from http://www.nvidia.com/Download/index.aspx

### Tensor Type 변환

- cpu <--> gpu

In [None]:
# cpu tensor
a = a.type(torch.FloatTensor)
a

In [None]:
# gpu tensor
b = a.to(device)
b

In [None]:
b = a.cuda()
b

In [None]:
c = a.type(torch.cuda.FloatTensor)
c

In [None]:
# cpu tensor
d = b.to("cpu")
d

In [None]:
e = c.cpu()
e

### Tensor 생성

- 무작위로 초기화된 행렬 생성 (uniform distribution)

In [None]:
x = torch.rand(5, 3) 
print(x)

- dtype이 long이고 0으로 채워진 행렬 생성

In [None]:
x = torch.zeros(5, 3, dtype=torch.long)
print(x)

- python list로 부터 tensor 생성

In [None]:
a = torch.tensor([7, 4, 3, 2, 6])
a.type(), a.dtype

In [None]:
b = torch.FloatTensor([7, 4, 3, 2, 6])
b.type(), b.dtype

In [None]:
a == b

In [None]:
c = torch.tensor([7, 4, 3, 2, 6], dtype=torch.int64)
c

In [None]:
d = torch.LongTensor([7, 4, 3, 2, 6])
d

In [None]:
c == d

## Tensor 의 shape & dimension (rank)

In [None]:
a = torch.Tensor([0, 1, 2, 3, 4])
a.size()

In [None]:
# size() 와 shape 은 alias
a.shape

In [None]:
a.ndimension()

## reshape
- torch.view : original tensor의 memory 공유 (contiguity 제한)
- torch.reshape: contiguity 제한 없음. 필요에 따라 new tensor 생성. numpy 와 유사한 operation을 위해 기능 제공

In [None]:
print(a)
print(a.view(5, 1))
print(a.reshape(5, 1))

In [None]:
x = torch.randn(4, 4)
y = x.view(16)
z = x.view(-1, 8)        

print(x.size(), y.size(), z.size())

In [None]:
x = torch.randn(4, 4)
y = x.reshape(16)
z = x.reshape(-1, 8)         

print(x.size(), y.size(), z.size())

In [None]:
x = torch.randn(4, 4)
x

In [None]:
x.is_contiguous()

In [None]:
x.transpose(0, 1).is_contiguous()

## numpy 와 tensor 간의 호환성

- memory 를 공유하므로 하나를 수정하면 나머지에 모두 반영  

In [None]:
numpy_array = np.array([0.0, 1.0, 2.0, 3.0, 4.0, 5.0])       # numpy array
torch_tensor = torch.from_numpy(numpy_array)               # torch tensor
torch_tensor 

In [None]:
back_to_numpy = torch_tensor.numpy()           # numpy array
back_to_numpy

In [None]:
numpy_array, torch_tensor, back_to_numpy

In [None]:
back_to_numpy[0] = 100

numpy_array, torch_tensor, back_to_numpy

## Scalar value 

- 만약 tensor에 하나의 값만 존재한다면, ``.item()`` method를 사용하여 숫자 값을 얻을 수 있습니다.  

In [None]:
x = torch.randn(1)
x.item()

In [None]:
a = torch.tensor([5., 3., 4., 1.])

print(a[0])
print(a[0].item())

- tensor 가 array 형태인 경우 `numpy()` method 를 통해 ndarray 반환

In [None]:
x = torch.randn(2)
print(x)
print()
print(x.numpy())

## pandas 및 python list 와의 호환성 

In [None]:
import pandas as pd

# pandas to tensor
pandas_series = pd.Series([0.1, 0.2, 0.3, 10.1])
pandas_to_torch = torch.from_numpy(pandas_series.values)
pandas_to_torch

In [None]:
# python list to tensor
this_tensor = torch.tensor([0, 1, 2, 3])
# tensor to python list
torch_to_list = this_tensor.tolist()    
torch_to_list

In [None]:
# numpy array
this_tensor.numpy()

## Tensor 의 indexing & slicing

- Python 의 indexing & slicing 과 동일

In [None]:
c = torch.tensor([20, 1, 2, 3, 4])
c[0] = 100
c[4] = 0
c, c.dtype

In [None]:
d = c[1:4]
d

In [None]:
c[3:5] = torch.tensor([300.0, 400.0])
c

## Basic Operations - numpy 와 동일

In [None]:
# element-wise 덧셈, 뺄셈 
u = torch.tensor([1.0, 0.0])
v = torch.tensor([0.0, 1.0])
z = u + v
z

In [None]:
z = u - v
z

In [None]:
# element-wise 곱셈
u = torch.tensor([1, 2])
v = torch.tensor([3, 2])
z = u * v
z

In [None]:
# 스칼라 곱
y = torch.tensor([1, 2])
z = 2 * y
z

In [None]:
# dot product
u = torch.tensor([1, 2])
v = torch.tensor([3, 1])
result = torch.dot(u, v)
result

## 기타

In [None]:
# broadcasting
u = torch.tensor([1, 2, 3, -1])
z = u + 1          
z

In [None]:
# mean, max, Standard Deviation
a = torch.tensor([1, -2, 3, 4, 5], dtype=torch.float32)

a.mean(), a.max(), a.std()

## torch.linspace 와 np.linspace 비교

In [None]:
np_linspace = np.linspace(-2, 2, 5)
np_linspace

In [None]:
torch_linspace = torch.linspace(-2, 2, 5)
torch_linspace

## torch.arange 와 np.arange 비교

In [None]:
np.arange(-100, 100, 0.1)

In [None]:
torch.arange(-100, 100, 0.1)

## 2D Tensor Operation

In [None]:
_2d_tensor = torch.tensor([[11, 12, 13], [21, 22, 23], [31, 32, 33], [41, 42, 43]])
_2d_tensor

- ndimension  
- shape  
- size()  
- numel (number of elements)

In [None]:
print(_2d_tensor)
print(_2d_tensor.ndimension())
print(_2d_tensor.shape)
print(_2d_tensor.size())
print(_2d_tensor.numel())

## matrix 간의 연산

In [None]:
x = torch.tensor([[1, 0], [0, 1]])
y = torch.tensor([[2, 1], [1, 2]])
print(x)
print(y)

- element-wise 연산

In [None]:
x * y

## matrix multiplication

In [None]:
x = torch.tensor([[0, 1, 1], [1, 0, 1]])
y = torch.tensor([[1, 1], [1, 1], [-1, 1]])

print(x)
print(y)

In [None]:
torch.mm(x, y)

### Concatenation

- default - first axis(row 단위)로 concatenate
- column 단위로 concatenate 하려면 axis=1 로 지정

In [None]:
x_1 = torch.tensor([[1, 2, 3], [4, 5, 6]])
x_2 = torch.tensor([[7, 8, 9], [10, 11, 12]])
print(x_1)
print(x_2)

In [None]:
torch.cat([x_1, x_2])

In [None]:
torch.cat([x_1, x_2], axis=1)

### torch.sum, torch.max, torch.min, torch.argmax, torch.argmin

- torch.sum(input, dim, keepdim=False, dtype=None) → Tensor  
주어진 차원 dim에서 입력 텐서의 각 행의 합(max, min)을 반환합니다.

- dim 을 지정한 경우, 지정된 dim을 축소하는 것입니다. 따라서 dim 0(행)을 접으면 하나의 행이 됩니다(열 단위로 합산).

In [None]:
x = torch.tensor([
     [1, 2, 3],
     [4, 5, 6]
   ])
x.shape

In [None]:
torch.sum(x)

In [None]:
torch.sum(x, dim=0)

In [None]:
torch.sum(x, dim=1)

In [None]:
torch.max(x, axis=0), torch.min(x, axis=0)

In [None]:
torch.max(x, axis=1), torch.min(x, axis=1)

In [None]:
torch.argmax(x), torch.argmin(x)

In [None]:
torch.argmax(x, axis=0), torch.argmin(x, axis=0)

In [None]:
torch.argmax(x, axis=1), torch.argmin(x, axis=1)

## TORCH.AUTOGRAD를 이용한 자동 미분

- autograd 패키지는 Tensor의 모든 연산에 대해 자동 미분을 제공   

- 신경망을 훈련할 때 가장 자주 사용되는 알고리즘은 역전파이다. 이 알고리즘에서 매개 변수 (모델 가중치)는 주어진 매개 변수에 대한 손실 함수의 기울기에 따라 조정된다.  

- 이러한 그래디언트를 계산하기 위해 PyTorch에는 torch.autograd라는 내장 미분 엔진이 있다.

- ``.requires_grad`` 속성을 True 로 설정하면, 그 tensor에서 이뤄진 모든 연산들을 추적(track)하기 시작  

- 계산이 완료된 후 ``.backward()`` 를 호출하여 모든 변화도(gradient)를 자동으로 계산  

- 이 Tensor의 변화도는 ``.grad`` 속성에 누적  

- Tensor가 기록을 추적하는 것을 중단하게 하려면, ``.detach()`` 를 호출하여 연산 기록으로부터 분리(detach)하여 이후 연산들이 추적되는 것을 방지한다.

- 도함수를 계산하기 위해서는 Tensor 의 ``.backward()`` 를 호출

In [None]:
x = torch.tensor(2.0, requires_grad=True)
x

In [None]:
y = x ** 2
y

y 를 x 에 대하여 미분  
$$y(x)=x^2$$ 

$$\frac{dy(x=2)}{dx}=2x=4 \rightarrow {y.backward()}$$  

In [None]:
y.backward()

x.grad

## 편미분 
$$f(u, v) = uv + u^2$$

$$\frac{\partial{f(u, v)}}{\partial {u}}=v+2u$$
$$\frac{\partial{f(u, v)}}{\partial {v}}=u$$

In [None]:
u = torch.tensor(1.0, requires_grad=True)
v = torch.tensor(2.0, requires_grad=True)

f = u * v + u ** 2
f

In [None]:
f.backward()

In [None]:
print(u.grad)
print(v.grad)

## backpropagation

In [None]:
import torch

x = torch.ones(5)    # input tensor
y = torch.zeros(3)   # expected output

w = torch.randn(5, 3, requires_grad=True)
b = torch.randn(3, requires_grad=True)

z = torch.matmul(x, w)+b

loss = torch.nn.functional.binary_cross_entropy_with_logits(z, y)
loss

### Gradient 계산 

- 신경망에서 매개변수의 가중치를 최적화하려면 매개변수에 대한 손실 함수의 미분을 계산해야한다. 즉, x 및 y 의 일부 고정 값 아래에서 $\frac{\partial loss}{\partial w}$가 필요. 이러한 미분을 계산하려면 loss.backward ()를 호출 한 다음 w.grad 및 b.grad에서 값을 구한다.

In [None]:
loss.backward()
print("w 의 기울기 = ", w.grad)
print("b 의 기울기 = ", b.grad)

### 그라디언트 추적 비활성화

기본적으로 requires_grad=True 인 모든 텐서는 계산 기록을 추적하고 기울기 계산을 지원한다. 이를 수행 할 필요가 없는 경우, 즉 네트워크를 통해 순방향 계산만 수행하려는 경우 계산 코드를 torch.no_grad() 블록으로 둘러 싸서 계산 추적을 중지할 수 있다.

그래디언트 추적을 비활성화 해야하는 경우는 다음과 같다.  

    - pre-train 된 network 를 fine tuning 하는 경우  
    - 기울기를 추적하지 않는 텐서에 대한 계산이 더 효율적이기 때문에 순방향 패스 만 수행할 때 계산 속도를 높인다.

In [None]:
z = torch.matmul(x, w) + b

print(z.requires_grad)

with torch.no_grad():
    z = torch.matmul(x, w)+b
    
print(z.requires_grad)

- 동일한 결과를 얻는 또 다른 방법은 텐서에서 detach() 메서드를 사용하는 것

In [None]:
z = torch.matmul(x, w)+b
z_det = z.detach()

print(z_det.requires_grad)

### CUDA Tensors

- .to 메소드를 사용하여 Tensor를 어떠한 장치로도 옮길 수 있습니다.

In [None]:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
device

In [None]:
x = torch.ones(2, 2)
x

In [None]:
x = x.to(device)
x

In [None]:
y = torch.ones((2, 3), device=device)  # GPU 상에 직접적으로 tensor를 생성
y