# 010. PyTorch basic

## Tensor Data Types

<img src="https://miro.medium.com/max/875/1*-C10tKbZ2h0Zd7maau86oQ.png" height="400" />

### torch.tensor 함수

`tensor(data, dtype=None, device=None, requires_grad=False) -> Tensor`

     data (array_like): list, tuple, numpy ndarray, scalar, and other types.
     dtype :  `None`인 경우 `data`에서 데이터 유형을 유추합니다.  
     device : `cpu`, `cuda`  
     require_grad(bool, optional): autograd가 작업을 기록해야 하는 경우

Float torch tensor 생성

Integer tensor 생성

## 1D Tensor Operation

### tensor 생성

### Tensor Type 변환

- cpu <--> gpu

### Tensor 생성

- 무작위로 초기화된 행렬 생성 (uniform distribution)

- dtype이 long이고 0으로 채워진 행렬 생성

- python list로 부터 tensor 생성

torch.LongTensor --> torch.long, torch.int64

## Tensor 의 shape & dimension (rank)

## reshape
- torch.view : original tensor의 memory 공유 (contiguity 제한)
- torch.reshape: contiguity 제한 없음. 필요에 따라 new tensor 생성. numpy 와 유사한 operation을 위해 기능 제공

## numpy 와 tensor 간의 호환성

- memory 를 공유하므로 하나를 수정하면 나머지에 모두 반영  

## Scalar value 

- 만약 tensor에 하나의 값만 존재한다면, ``.item()`` method를 사용하여 숫자 값을 얻을 수 있습니다.  

- tensor 가 array 형태인 경우 `numpy()` method 를 통해 ndarray 반환

## pandas 및 python list 와의 호환성 

## Tensor 의 indexing & slicing

- Python 의 indexing & slicing 과 동일

## Basic Operations - numpy 와 동일

## 기타

## torch.linspace 와 np.linspace 비교

## torch.arange 와 np.arange 비교

## 2D Tensor Operation

- ndimension  
- shape  
- size()  
- numel (number of elements)

## matrix 간의 연산

- element-wise 연산

## matrix multiplication

### Concatenation

- default - first axis(row-wise)로 concatenate
- column-wise로 concatenate 하려면 axis=1 로 지정

### torch.sum, torch.max, torch.min, torch.argmax, torch.argmin

- torch.sum(input, dim, keepdim=False, dtype=None) → Tensor  
주어진 차원 dim에서 입력 텐서의 각 행의 합(max, min)을 반환합니다.

- dim 을 지정한 경우, 지정된 dim을 축소하는 것입니다. 따라서 dim 0(행)을 접으면 하나의 행이 됩니다(열 단위로 합산).

## TORCH.AUTOGRAD를 이용한 자동 미분

- autograd 패키지는 Tensor의 모든 연산에 대해 자동 미분을 제공   

- 신경망을 훈련할 때 가장 자주 사용되는 알고리즘은 역전파이다. 이 알고리즘에서 매개 변수 (모델 가중치)는 주어진 매개 변수에 대한 손실 함수의 기울기에 따라 조정된다.  

- 이러한 그래디언트를 계산하기 위해 PyTorch에는 torch.autograd라는 내장 미분 엔진이 있다.

- ``.requires_grad`` 속성을 True 로 설정하면, 그 tensor에서 이뤄진 모든 연산들을 추적(track)하기 시작  

- 계산이 완료된 후 ``.backward()`` 를 호출하여 모든 변화도(gradient)를 자동으로 계산  

- 이 Tensor의 변화도는 ``.grad`` 속성에 누적  

- Tensor가 기록을 추적하는 것을 중단하게 하려면, ``.detach()`` 를 호출하여 연산 기록으로부터 분리(detach)하여 이후 연산들이 추적되는 것을 방지한다.

- 도함수를 계산하기 위해서는 Tensor 의 ``.backward()`` 를 호출

y 를 x 에 대하여 미분  
$$y(x)=x^2$$ 

$$\frac{dy(x=2)}{dx}=2x=4 \rightarrow {y.backward()}$$  

## 편미분 
$$f(u, v) = uv + u^2$$

$$\frac{\partial{f(u, v)}}{\partial {u}}=v+2u$$
$$\frac{\partial{f(u, v)}}{\partial {v}}=u$$

## backpropagation

### Gradient 계산 

- 신경망에서 매개변수의 가중치를 최적화하려면 매개변수에 대한 손실 함수의 미분을 계산해야한다. 즉, x 및 y 의 일부 고정 값 아래에서 $\frac{\partial loss}{\partial w}$가 필요. 이러한 미분을 계산하려면 loss.backward ()를 호출 한 다음 w.grad 및 b.grad에서 값을 구한다.

### 그라디언트 추적 비활성화

기본적으로 requires_grad=True 인 모든 텐서는 계산 기록을 추적하고 기울기 계산을 지원한다. 이를 수행 할 필요가 없는 경우, 즉 네트워크를 통해 순방향 계산만 수행하려는 경우 계산 코드를 torch.no_grad() 블록으로 둘러 싸서 계산 추적을 중지할 수 있다.

그래디언트 추적을 비활성화 해야하는 경우는 다음과 같다.  

    - pre-train 된 network 를 fine tuning 하는 경우  
    - 기울기를 추적하지 않는 텐서에 대한 계산이 더 효율적이기 때문에 순방향 패스 만 수행할 때 계산 속도를 높인다.

- 동일한 결과를 얻는 또 다른 방법은 텐서에서 detach() 메서드를 사용하는 것

### CUDA Tensors

- .to 메소드를 사용하여 Tensor를 어떠한 장치로도 옮길 수 있습니다.