# Evaluation

## Regression

회귀 문제에서 데이터를 통해 생성한 모델이 좋은지 판단하기 위한 평가 함수에 대해서 알아봅니다.

### Mean absolute error(MAE)

MAE 값은 예측 값과 실제 값의 차이의 절대값의 평균을 나타냅니다. 

\\[
\text{MAE}(y, \hat{y}) = \frac{1}{n_{\text{samples}}} \sum_{i=0}^{n_{\text{samples}}-1} \left| y_i - \hat{y}_i \right|.
\\]

예측 값이 배열 형태인 경우는 multioutput 옵션을 이용해서 MAE 값의 계산 방법을 조정할 수 있습니다. 기본적으로는 MAE 들의 평균 값을 리턴하며, 'raw_values' 값을 통해 변경 없이 리턴하거나, [0.3, 0.7] 가중치 배열를 통해 적용 비율을 달리 할 수 있습니다. 

In [1]:
from sklearn.metrics import mean_absolute_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mae = mean_absolute_error(y_true, y_pred)
print("MAE={}".format(mae))

# Multioutput
y_true = [[0.5, 1], [-1, 1], [7, -6]]
y_pred = [[0, 2], [-1, 2], [8, -5]]
mae = mean_absolute_error(y_true, y_pred) 
print("MAE={}".format(mae))

mae = mean_absolute_error(y_true, y_pred, multioutput='raw_values') 
print("MAE={}".format(mae))

mae = mean_absolute_error(y_true, y_pred, multioutput=[0.3, 0.7]) 
print("MAE={}".format(mae))

MAE=0.5
MAE=0.75
MAE=[0.5 1. ]
MAE=0.85


### Mean squared error

MSE 값은 예측 값과 실제 값의 차이의 제곱 값의 평균을 나타냅니다. 

\\[
\text{MSE}(y, \hat{y}) = \frac{1}{n_\text{samples}} \sum_{i=0}^{n_\text{samples} - 1} (y_i - \hat{y}_i)^2.
\\]


In [6]:
from sklearn.metrics import mean_squared_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mse = mean_squared_error(y_true, y_pred)
print("MSE={}".format(mse))

y_true = [[0.5, 1], [-1, 1], [7, -6]]
y_pred = [[0, 2], [-1, 2], [8, -5]]
mse = mean_squared_error(y_true, y_pred) 
print("MSE={}".format(mse))

mse = mean_squared_error(y_true, y_pred, multioutput='raw_values') 
print("MSE={}".format(mse))

mse = mean_squared_error(y_true, y_pred, multioutput=[0.3, 0.7]) 
print("MSE={}".format(mse))

MSE=0.375
MSE=0.7083333333333334
MSE=[0.41666667 1.        ]
MSE=0.825
