<a href="https://colab.research.google.com/github/sgr1118/PyTorch/blob/main/Chapter5_%EC%86%90%EC%8B%A4_%ED%95%A8%EC%88%98.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 5.1 평균 제곱 오차

### 손실 값
- 수식에서 모든 데이터의 입력에 대한 모방 출력과 실제 정답 사이 간 차이의 크기를 더한 것을 손실 값이라고 부른다. 따라서 손실 값이 작을수록 해당 모델은 근사 계산하고자 $f^*$를 잘 계산한다고 판단 할 수 있다.

### 1. 손실 함수 선택

#### L1
- n차원 벡터의 각 요소들 사이의 차이에 대한 절댓 값을 모두 더한것

#### L2
- 두 점 사이의 거리를 계산하는 방법이다. 따라서 L2를 활용하면 정답과 모델 출력 사이의 거리를 최소화한다고 볼 수 있다. L2는 벡터의 각 요소들 간 차이에 대해 제곱을 구하여 모두 더한 것이다.

#### RMSE
- 제곱근 평균 제곱 오차는 L2와 유사하며 제곱근을 구하기 전 벡터의 차원 크기 n만큼 나누어 평균을 취한다.

#### MSE
- 평균 제곱 오차는 RMSE에서 제곱을 취한 것과 같기 때문에 훨씬 큰 값을 반환하게 된다. RMSE에서 상수인 n으로 나눴을 때도 문제가 없었듯 제곱의 함수 꼴은 여전히 단조증가 형태를 띠므로 값들의 차이 순서가 바뀌지 않아 문제가 되지 않는다.


## 5.2 MSE Loss

MSE 손실 함수 공식

- $$MSE = \frac{1}{N*n}\sum_{i=1}^N ||x_i - x_i^||_2^2$$

In [None]:
# mse 공식 코드

def mse(x_hat, x):
    # x_hat = (bathc_size, dim)
    # x = (batch_size, dim)

    y = ((x-x_hat)**2).mean()

    return y

In [None]:
# 텐서를 사용한 MSE 손실 함수값 구하기

import torch

x = torch.FloatTensor([[1,1],
                       [2,2]])

x_hat = torch.FloatTensor([[0,0],
                       [0,0]])

print(mse(x_hat, x))

tensor(2.5000)


### 1. torch.nn.functional 사용하기

MSE 손실 함수도 토치에서 기본 제공

In [None]:
import torch.nn.functional as F
F.mse_loss(x_hat, x)

tensor(2.5000)

해당 함수는 reduction이라는 인자를 통해 MSE 손실 값을 구할 때 차원 감소 연산에 대한 설정이 가능

sum과 none 등을 선택하여 원하는 대로 MSE 손실 함수의 출력값을 얻을 수 있습니다.

In [None]:
print(F.mse_loss(x_hat, x, reduction='sum'))

print(F.mse_loss(x_hat, x, reduction='none'))


tensor(10.)
tensor([[1., 1.],
        [4., 4.]])


### 2. torch.nn 사용하기
- torch.nn.functional 이외에도 torch.nn을 활용할 수 있다. 두 방법의 차이는 없지만 이 방법을 사용하면 nn.Module의 하위 클래스 내부에 선언하기 때문에 계층의 하나처럼 취급할 수 있다.

In [None]:
import torch.nn as nn
mse_loss = nn.MSELoss()
mse_loss(x_hat, x)

tensor(2.5000)

## 5.3 마치며

### 요약

1. 손실 함수가 필요한 이유
 - 신경망의 내부 가중치 파라미터를 조절하여 함수를 근사계산할 수 있음
 - 얼마나 잘 근사계산하는지 알아야 더 좋은 가중치 파라미터를 선택할 수 있음
 - 손실 값은 얼마나 잘 근사하는지 수치로 나타낸 것(낮을수록 좋음)
 - 선형 계층의 가중치 파라미터 변화에 따라 손실 값이 변할 것
 - 가중치 파라미터를 입력으로 받아 손실 값을 출력으로 반환하는 함수를 만들 수 있는데 이것이 손실 함수임

2. 손실 함수
 - 입력 : 가중치 파라미터
 - 출력 : 손실 값 (계산 방법 : 각 샘플 별 손실 값(모델의 출력값과 정답의 차이)의 합)
 - 손실 함수 공식 내의 상수는 의미가 없음