# Pytorch Basic

In [1]:
import torch
import numpy as np
import matplotlib.pyplot as plt

device = "cuda:0" if torch.cuda.is_available() else "cpu"
device

'cpu'

### torch.tensor 함수

`tensor(data, dtype=None, device=None, requires_grad=False) -> Tensor`

     data (array_like): list, tuple, numpy ndarray, scalar, and other types.
     dtype :  `None`인 경우 `data`에서 데이터 유형을 유추합니다.  
     device : `cpu`, `cuda`  
     require_grad(bool, optional): autograd가 작업을 기록해야 하는 경우

Float torch tensor 생성

In [10]:
# numpy 생성
a = np.ones((2, 3), dtype="float32")
# tensor 생성
b = torch.tensor(a)
# dtype
print(a.dtype, '\t', b.dtype)

float32 	 torch.float32


Integer tensor 생성

In [11]:
x = torch.tensor([[1, 2, 3], [4, 5, 6]], dtype=torch.int32)
x

tensor([[1, 2, 3],
        [4, 5, 6]], dtype=torch.int32)

### Tensor 생성

- 무작위로 초기화된 행렬 생성 (uniform distribution)

In [12]:
x = torch.rand(5, 3)
print(x)

tensor([[0.6546, 0.2612, 0.9687],
        [0.7305, 0.6529, 0.5353],
        [0.3052, 0.5610, 0.4674],
        [0.1701, 0.6603, 0.4765],
        [0.5735, 0.0480, 0.8190]])


## Tensor 의 shape & dimension (rank)

In [13]:
a = torch.Tensor([0, 1, 2, 3, 4])
a.size()

torch.Size([5])

In [14]:
# size() 와 shape 은 alias
a.shape

torch.Size([5])

In [15]:
a.ndimension()

1

## numpy 와 tensor 간의 호환성

- memory 를 공유하므로 하나를 수정하면 나머지에 모두 반영  

In [16]:
numpy_array = np.array([0.0, 1.0, 2.0, 3.0, 4.0, 5.0])       # numpy array
torch_tensor = torch.from_numpy(numpy_array)               # torch tensor
torch_tensor

tensor([0., 1., 2., 3., 4., 5.], dtype=torch.float64)

In [17]:
back_to_numpy = torch_tensor.numpy()           # numpy array
back_to_numpy

array([0., 1., 2., 3., 4., 5.])

In [18]:
numpy_array, torch_tensor, back_to_numpy

(array([0., 1., 2., 3., 4., 5.]),
 tensor([0., 1., 2., 3., 4., 5.], dtype=torch.float64),
 array([0., 1., 2., 3., 4., 5.]))

In [19]:
back_to_numpy[0] = 100

numpy_array, torch_tensor, back_to_numpy

(array([100.,   1.,   2.,   3.,   4.,   5.]),
 tensor([100.,   1.,   2.,   3.,   4.,   5.], dtype=torch.float64),
 array([100.,   1.,   2.,   3.,   4.,   5.]))

## Scalar value

- 만약 tensor에 하나의 값만 존재한다면, ``.item()`` method를 사용하여 숫자 값을 얻을 수 있습니다.  

In [20]:
x = torch.randn(1)
x.item()

-0.9563308358192444

In [21]:
a = torch.tensor([5., 3., 4., 1.])

print(a[0])
print(a[0].item())

tensor(5.)
5.0


- tensor 가 array 형태인 경우 `numpy()` method 를 통해 ndarray 반환

In [22]:
x = torch.randn(2)
print(x)
print()
print(x.numpy())

tensor([-0.1851,  0.3275])

[-0.18509153  0.32745877]


## Basic Operations - numpy 와 동일

In [23]:
# element-wise 덧셈, 뺄셈
u = torch.tensor([1.0, 0.0])
v = torch.tensor([0.0, 1.0])
z = u + v
z

tensor([1., 1.])

In [24]:
z = u - v
z

tensor([ 1., -1.])

In [25]:
# element-wise 곱셈
u = torch.tensor([1, 2])
v = torch.tensor([3, 2])
z = u * v
z

tensor([3, 4])

In [26]:
# 스칼라 곱
y = torch.tensor([1, 2])
z = 2 * y
z

tensor([2, 4])

In [27]:
# dot product
u = torch.tensor([1, 2])
v = torch.tensor([3, 1])
result = torch.dot(u, v)
result

tensor(5)

## TORCH.AUTOGRAD를 이용한 자동 미분

- autograd 패키지는 Tensor의 모든 연산에 대해 자동 미분을 제공   

- 신경망을 훈련할 때 가장 자주 사용되는 알고리즘은 역전파이다. 이 알고리즘에서 매개 변수 (모델 가중치)는 주어진 매개 변수에 대한 손실 함수의 기울기에 따라 조정된다.  

- 이러한 그래디언트를 계산하기 위해 PyTorch에는 torch.autograd라는 내장 미분 엔진이 있다.

- ``.requires_grad`` 속성을 True 로 설정하면, 그 tensor에서 이뤄진 모든 연산들을 추적(track)하기 시작  

- 계산이 완료된 후 ``.backward()`` 를 호출하여 모든 변화도(gradient)를 자동으로 계산  

- 이 Tensor의 변화도는 ``.grad`` 속성에 누적  

- Tensor가 기록을 추적하는 것을 중단하게 하려면, ``.detach()`` 를 호출하여 연산 기록으로부터 분리(detach)하여 이후 연산들이 추적되는 것을 방지한다.

- 도함수를 계산하기 위해서는 Tensor 의 ``.backward()`` 를 호출

In [28]:
x = torch.tensor(2.0, requires_grad=True)
x

tensor(2., requires_grad=True)

In [29]:
y = x ** 2
y

tensor(4., grad_fn=<PowBackward0>)

y 를 x 에 대하여 미분  
$$y(x)=x^2$$

$$\frac{dy(x=2)}{dx}=2x=4 \rightarrow {y.backward()}$$  

In [30]:
y.backward()

x.grad

tensor(4.)

## 편미분
$$f(u, v) = uv + u^2$$

$$\frac{\partial{f(u, v)}}{\partial {u}}=v+2u$$
$$\frac{\partial{f(u, v)}}{\partial {v}}=u$$

In [31]:
u = torch.tensor(1.0, requires_grad=True)
v = torch.tensor(2.0, requires_grad=True)

f = u * v + u ** 2
f

tensor(3., grad_fn=<AddBackward0>)

In [32]:
f.backward()

In [33]:
print(u.grad)
print(v.grad)

tensor(4.)
tensor(1.)


## backpropagation

In [36]:
import torch

# 입력 텐서 정의 (5개의 요소, 값은 모두 1)
x = torch.ones(5)    # input tensor

# Label 텐서 정의 (3개의 요소, 값은 모두 0)
y = torch.zeros(3)   # expected output

# 가중치 행렬 (5x3 크기), requires_grad=True로 설정하여 학습 가능하도록 설정
w = torch.randn(5, 3, requires_grad=True)  # 랜덤 초기화

# 편향 벡터 (3차원), requires_grad=True로 설정
b = torch.randn(3, requires_grad=True)  # 랜덤 초기화

# 선형 연산 (z = x * w + b) 수행
z = torch.matmul(x, w) + b  # 행렬 곱 + 편향

# 이진 분류 손실 함수 계산 
loss = torch.nn.functional.binary_cross_entropy_with_logits(z, y)

# 손실 값 출력
loss

tensor(1.1270, grad_fn=<BinaryCrossEntropyWithLogitsBackward0>)

### Gradient 계산

- 신경망에서 매개변수의 가중치를 최적화하려면 매개변수에 대한 손실 함수의 미분을 계산해야한다. 즉, x 및 y 의 일부 고정 값 아래에서 $\frac{\partial loss}{\partial w}$가 필요. 이러한 미분을 계산하려면 loss.backward ()를 호출 한 다음 w.grad 및 b.grad에서 값을 구한다.

In [37]:
loss.backward()
print("w 의 기울기 = ", w.grad)
print("b 의 기울기 = ", b.grad)

w 의 기울기 =  tensor([[0.1112, 0.2161, 0.2850],
        [0.1112, 0.2161, 0.2850],
        [0.1112, 0.2161, 0.2850],
        [0.1112, 0.2161, 0.2850],
        [0.1112, 0.2161, 0.2850]])
b 의 기울기 =  tensor([0.1112, 0.2161, 0.2850])


## 연습 문제

1. Tensor 생성  
3x3 크기의 무작위로 초기화된 텐서를 생성하세요.  
이 텐서의 데이터 타입을 확인하세요.  

힌트: torch.rand()와 .dtype를 활용하세요.  
예상 출력: (3, 3) 모양의 텐서와 데이터 타입 출력.

2. Tensor의 Shape와 Dimension  
[1.0, 2.0, 3.0, 4.0, 5.0] 값을 가진 1D 텐서를 생성하세요.  
이 텐서의 크기(size)와 차원(ndimension)을 확인하세요.

힌트: torch.Tensor(), .size(), .ndimension()을 활용하세요.  
예상 출력: 텐서의 크기 (5,)와 차원 1.

3. Numpy와 Tensor 간의 호환성  
NumPy 배열 [1.0, 2.0, 3.0]을 생성하세요.  
이 배열을 PyTorch 텐서로 변환하고, 다시 NumPy 배열로 변환하세요.  
NumPy 배열을 수정한 후, PyTorch 텐서 값이 어떻게 변하는지 확인하세요.

힌트: torch.from_numpy()와 .numpy()를 활용하세요.  
예상 출력: NumPy 배열과 텐서 값이 동기화되어 변경됨.

4. Basic Operations  
[1, 2, 3]과 [4, 5, 6]으로 구성된 두 개의 텐서를 생성하세요.  
다음 연산을 수행하세요:  
두 텐서의 합.  
두 텐서의 차.  
두 텐서의 원소별 곱.  
첫 번째 텐서에 3을 곱한 결과.

힌트: +, -, * 연산과 스칼라 곱셈을 활용하세요.  
예상 출력: 합, 차, 원소별 곱, 스칼라 곱 결과.