## 만들어진 모델의 성능은 어떻게 평가할 것인가?

- 평가할 수 있는 측정지표가 있어야 한다.

### 대표적인 측정지표들

#### 1. Mean Absolute Error (MAE)
- 잔차의 절댓값의 Sum
- 작을수록 좋음

$MAE = \frac{1}{n}\sum_{i=1}^{m}{|y_i - \hat{y_i}|} = \frac{1}{n}\sum_{i=1}^{m}{|e_i|}$

In [2]:
from sklearn.metrics import mean_absolute_error
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mean_absolute_error(y_true, y_pred)

0.5

#### 2. Rooted Mean Squared Error (RMSE)
- 잔차 제곱의 Sum의 제곱근
- 작을수록 좋음

$RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{m}{(y_i - \hat{y_i})^2}}$

In [5]:
# 루트는 안 씌워진 상태. MSE만 구해줌.
from sklearn.metrics import mean_squared_error
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mean_squared_error(y_true, y_pred)

0.375

#### 3. R Squared

- 0 과 1 사이 숫자로 크면 클수록 높은 적합도를 지님
- 단위가 없음. 절대적인 지표임

$R^2 = 1 - \frac{\sum_{i}{(y_i-\hat{y}_i)^2}}{\sum_{i}{(y_i-\mu)^2}}$

In [6]:
from sklearn.metrics import r2_score
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
r2_score(y_true, y_pred)

0.9486081370449679

### 모델을 만드는 데이터와 평가받는 데이터를 나눠야 함

- Training한 데이터로 다시 Test를 할 경우, Training data에 Overfitting이 발생할 수 있음
- 새로운 데이터가 출현했을 때, 기존 모델과의 차이가 발생함
- 모델은 새로운 데이터를 처리할 수 있도록 일반화 능력이 좋아야 함
- 이를 위해 Training Set과 Test Set을 분리함
- Training Data로 모델을 만들고, Test Data로 측정을 함. (Test Data에서 잘 돌아가는 모델을 만드는 것이 목적)

## 데이터를 나누는 대표적인 방법 : Hold-out Method(Sampling)

- 데이터를 Training과 Test로 나눠서 모델을 생성하고 테스트하는 기법
- 가장 일반적인 모델 생성을 위한 데이터 랜덤 샘플링 기법
- Training과 Test를 나누는 비율은 데이터의 크기에 따라 다름
- 일반적으로 Training Data 2/3, Test Data 1/3을 활용함

In [9]:
# Hold-out Method code
import numpy as np
from sklearn.model_selection import train_test_split

X, y = np.arange(10).reshape((5, 2)), range(5)

# random_state는 임의의 숫자를 넣어 섞어주는 것
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

In [10]:
X_train, X_test, y_train, y_test

(array([[4, 5],
        [0, 1],
        [6, 7]]),
 array([[2, 3],
        [8, 9]]),
 [2, 0, 3],
 [1, 4])