# 평균 제곱 오차
- 우리가 가지고 있는 모델을 통해 알 수 없는 함수 f*를 근사계산을 하는데, 이 근사계산을 잘 하고 있는지 판단해야한다.
- 가장 간단한 방법은 해당 모델에 수집한 데이터로 입력을 넣었을 때 원하는 출력이 나오는지 확인하는 것이다.
- 원하는 출력값과 모델이 반환한 출력값을 비교해서 차이가 적을수록 좋은 모델일 것이다. 이 차이를 손실(loss)값이라고 부른다.
- 즉, 손실 값이 작을수록 해댱 모델은 근사계산하고자하는 함수 f*를 잘 근사계산하고 있다고 판단할 수 있다.
- 손실함수
    - 모델의 가중치 파라미터가 바뀌면 손실값이 바뀌기 때문에 가중치 파라미터를 함수 입력으로 주고 손실 값을 출력으로 반환하도록 
    - 손실 함수의 출력값(손실 값)을 최소로 만드는 모델의 가중치 파라미터 집합(함수 입력값)를 찾기만 하면 된다.

## 손실 함수 선택
- 손실 값의 정의는 타깃 출력과 모델의 출력간의 차이 크기의 합이라고 했다. 
- 이 때 차이의 크기를 정의하는 방법은 다양한다.

### L1 norm
- n차원 벡터의 각 요소들 사이의 차이에 대한 절댓값을 모두 더한 것이다.

### L2 norm
- 유클리디안 거리(Euclidean distance)로도 잘 알려져 있는데 두 점 사이의 거리를 계산하는 방법
- 따라서 손실 함수에 L2 norm을 잘 활용하면 정답과 모델 출력 사이의 거리를 최소화 한다고 볼 수 있다.
- L2 norm은 벡터의 각 요소들 간 차이에 대해 제곱을 구하여 모두 더한 것이다.

### RMSE
- 제곱근 평균 제곱 오차(Root Mean Squared Error)는 앞서 살펴본 L2 norm과 매우 유사한 수식을 갖고 있다.
- 다만 제곱근을 구하기 전에 벡터의 차원 크기인 n으로 나누어 편균을 취하는 거승ㄹ 볼 수 있다.
- 즉, 오차에 제곱을 구하고 평균을 취해서 제곱근을 씌워주주는 것이다.

### MSE
- 평균 제곱 오차(Mean Squared Error)이다. 
- RMSE에 제곱을 취한 것과 같다.  
- 따라서 훨씬 쿤 차이 값을 반환하게 된다.
- MSE는 L2 norm의 제곱에 상수를 곱한 값이다. 그래서 MSE와 L2 norm의 제곱을 혼용하여 표기합니다.
- N개의 데이터 샘플에 대한 손실 값은 각 샘플의 타깃 출력값 m차원의 벡터와 모델의 출력값 m차원의 벡터 사이의 MSE에 대한 합으로 정의된다.
- 경우에 따라 샘플의 숫자 N을 추가적으로 나누어 샘플들의 MSE에 대한 평균을 취하기도 한다. 

In [1]:
def mse(x_hat, x):
    y = ((x-x_hat)**2).mean()

    return y

In [4]:
import torch
x = torch.FloatTensor([[1,1],[2,2]])
x_hat = torch.FloatTensor([[0,0],[0,0]])
print(mse(x_hat, x))

tensor(2.5000)


## torch.nn.functional 사용하기

In [5]:
import torch.nn.functional as F
F.mse_loss(x_hat,x)

tensor(2.5000)

In [6]:
F.mse_loss(x_hat, x, reduction='sum')

tensor(10.)

In [7]:
F.mse_loss(x_hat, x, reduction='none')

tensor([[1., 1.],
        [4., 4.]])

## torch.nn사용하기
- 위의 방법과의 차이는 거의 없다.
- 하지만 이 방법을 사용하게 되면 nn.Module의 하위 클래스 내부에 선언하기 때문에 계층의 하나처럼 취급할 수 있다.

In [8]:
import torch.nn as nn
mse_loss = nn.MSELoss()
mse_loss(x_hat, x)

tensor(2.5000)