# 5.1 평균 제곱 오차

우리가 가지고 있는 모델을 통해 알 수 없는 함수 f*를 근사계산 하고 싶을 때, 어떤 방법을 통해 근사계산을 잘 하고 있는지 판단할 수 있을까  
-> 가장 간단한 방법은 해당 모델에 수집한 데이터로 입력을 넣었을 때 원하는 출력이 나오는지 확인하는 것

이때 모델에서 반환한 출력은 원하는 출력이 아닌 다른 값을 반환할 것 이다.  

원하는 출력값과 모델이 반환한 출력값을 비교해서 차이가 적을 수록 좋은 모델이라고 판단한다. 수식은 다음과 같다.

<img src = "평균제곱오차1.jpg" width = "300" height = "300">

앞의 수식에서 y^와 y사이 간 차이의 크기를 더한 것을 "손실값" 이라고 부른다.  
따라서 손실 값이 작을수록 해당 모델은 근사계산하고자 하는 함수 f*를 잘 근사계산 하고있다 라고 판단한다.

손실 값을 최소화 하는 모델을 찾는 방법은 모델 가중치 파라미터의 값을 랜덤하게 바꿔보는 것 이다.  
그럼 모델의 동작이 바뀌면서 입력에 대한 출력 y^이 바뀌고, 손실 값도 바뀌게 된다.  
이전보다 손실값이 더 줄었다면 더 좋은 가중치 파라미터를 찾았다고 할 수 있다.  

모델의 가중치 파라미터가 바뀌면 손실 값이 바뀌기 때문에 가중치 파라미터를 함수 입력으로 주고 손실 값을 출력으로 반환하도록 만든 함수가 "손실 함수" 이다. 수식은 다음과 같다.

<img src = "평균제곱오차2.jpg" width = "300" height = "300">

### 1. 손실 함수 선택

L1 노름(norm)이란, n차원 벡터의 각 요소들 사이에 대한 절댓값을 모두 더한 것 이다.  
수식은 다음과 같다.

<img src = "손실함수선택1.jpg" width = "300" height = "300">

L2 노름(norm)이란, 유클리디안 거리로도 잘 알려져 있는 두 점 사이의 거리를 계산 하는 방법이다.  
따라서 손실 함수에 L2 노름을 잘 활용하면 정답과 모델 출력 사이의 거리를 최소화 한다고 볼 수 있다.   

L2노름은 벡터들 각 요소들 간 차이에 대해 제곱을 구해 더한 것이다.  
수식은 다음과 같다. 

<img src = "손실함수선택2.jpg" width = "300" height = "300">

제곱근 평균 제곱 오차(Root Mean Squared Error, RMSE)는 L2 노름과 유사하지만, 제곱근을 구하기 전에 벡터의 차원 크기인 n으로 나누어 평균을 취하는 것이 특징이다.  
수식은 다음과 같다.

<img src = "손실함수선택3.jpg" width = "400" height = "400">

평군 제곱 오차(Mean Squared Error, MSE)는 RMSE에 제곱을 취한 것과 같다.  
수식은 다음과 같다.

<img src = "손실함수선택4.jpg" width = "300" height = "300">

흔히 MSE와 L2노름의 제곱을 혼용하여 표기하기도 한다.  
만약 MSE를 손실함수로 활용하게 되면, 다음과 같이 손실 함수가 최종적으로 정의될 수 있을 것이다.

<img src = "손실함수선택5.jpg" width = "300" height = "300">

# 5.2 MSE Loss

In [4]:
import torch

def mse(x_hat, x):
    # |x_hat| = (batch_size, dim)
    # |x| = (batch_size, dim)
    y = ((x-x_hat)**2).mean()
    
    return y

In [5]:
x = torch.FloatTensor([[1,1],
                       [2,2]])
x_hat = torch.FloatTensor([[0,0],
                           [0,0]])
print(mse(x_hat, x))

tensor(2.5000)


### 1. torch.nn.functional 사용하기

In [6]:
import torch.nn.functional as F
F.mse_loss(x_hat, x)

tensor(2.5000)

해당 함수는 reduction이라는 인자를 통해 MSE 손실값을 구할 때 차원 감소 연산(e.g. 평균)에 대한 설정을 할 수 있다. sum과 none등을 선택하여 원하는대로 MSE 손실 함수의 출력값을 얻을 수 있다.

In [7]:
F.mse_loss(x_hat, x, reduction='sum')

tensor(10.)

In [8]:
F.mse_loss(x_hat, x, reduction='none')

tensor([[1., 1.],
        [4., 4.]])

### 2. torch.nn 활용하기

In [9]:
import torch.nn as nn
mse_loss = nn.MSELoss()
mse_loss(x_hat, x)

tensor(2.5000)