# 머신러닝 모델 평가



## 분류(Classification) 모델에 대한 평가 지표



### 정확도 (accuracy)
- 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표

```
from sklearn.metrics import accuracy_score
# 실측값, 예측값을 넣어서 평가함
accuracy_score(y_train, pred_train_dummy)
```




### 오차 행렬 (Confusion Matrix)
- 분류의 평가지표의 기준으로 사용됨
- 오차행렬을 이용하여 다영한 평가지표(정확도, 재현율, 정밀도, F1점수, AUC)를 계산함
- TP(True Positive)
- TN(True Negative)
- FP(False Positive)
- FN(False Negative)

```
                          Predicted. 
                          Negative(0).   Positive(1). 
Actural.   Negative(0).   TN.            FP. 
           Positive(1).   FN.            TP.
```




### 정밀도(Precision)

- 예측한 것 중에서 정답의 비율 (즉, Positive로 예측한 경우 중, 실제로 Positive인 비율)
- PPV(Positive Predictive Value)



```
from sklearn.metrics import precision_score
precision_score(y_val, y_pred)
```





### 재현율(Recall)
- Positive인 것 중에서 올바르게 Positive를 맞춘 비율
- 민감도(Sensitivity) 혹은 TPR(True Positive Rate)



```
# recall
from sklearn.metrics import recall_score

# 전체 출력
from sklearn.metrics import classification_report
classification_report(y_val, y_pred)
```



### F1스코어
- 정밀도(예측한 것 중에 정답의 비율)와 재현율(정답중에서 올바르게 예측한 정답의 비율)의 조화평균 점수
- F1 Score 값이 높으면 성능이 높다고 할 수 있음



```
from sklearn.metrics import f1_score
f1_score(y_test, y_pred)
```



### ROC-AUC
- ROC(Receiver Operating Characteristic)
  - ROC Curve는 보통 binary claasification 또는 medical applicatin에서 많이 쓰는 성능 척도

- AUC(Area Under the Curve)
  - ROC 곡선 아래 영역
  - AUC가 높다는 사실은 클래스를 구별하는 모델의 성능이 훌륭하다는 것을 의미

참조: https://nittaku.tistory.com/297




## 회귀 모델에 대한 평가 지표
참조: https://velog.io/@tyhlife/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%ED%9A%8C%EA%B7%80-%EB%AA%A8%EB%8D%B8%EC%9D%98-%ED%8F%89%EA%B0%80-%EC%A7%80%ED%91%9C


### MAE (Mean Absolute Error)
- 모델의 예측값과 실제값의 차이를 모두 더한것의 평균
- MSE보다 robust함.

### MSE (Mean Squareed Error)
- MAE의 (예측값-실제값)^2의 전체합의 평균
- 특이치에 민감

### RMSE (Root MEan Squared Error)
- MSE에 root 씌움

### MAPE (Mean Absolute Percentage Error)
- MAE를 퍼센트로 변환 