https://scikit-learn.org/stable/modules/model_evaluation.html

In [1]:
import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
%matplotlib inline

## Classfication(분류)
* Accuracy(정확도) 
* Confusion matrix(혼동 행렬)
* Precision(정밀도)
* Recall(재현율)

### Accuracy(정확도) 
* <img src="https://latex.codecogs.com/gif.latex?%5Cfrac%7B%5Csum%28%5Chat%7By%7D%20%3D%20y%29%7D%7Bn%7D">

In [2]:
y_true = [0,1,2,3,4,5,6,7,0,0]
pred  = [0,1,2,3,4,5,6,7,8,9]

In [3]:
from sklearn.metrics import accuracy_score
accuracy_score(y_true, pred)

0.8

### Confusion matrix(혼동 행렬)
* 예측을 수행하면서 얼마나 confused 될 수 있는가  


예측 ↓  
실제 → 

|TN|FP|  
|FN|TP|

* 정확도 = <img src="https://latex.codecogs.com/gif.latex?%5Cfrac%7B%28TN&plus;TP%29%7D%7BTN&plus;FP&plus;FN&plus;TP%7D">  
  * 불균형 데이터에서 정확도만으론 모델 신뢰성이 떨어짐  
    * Positive 예측 성능에 더 초점 => 정밀도/재현율  

In [4]:
y_true = [0,1,2  ,1,2  ,2  ,2,2]
pred  = [0,1,2  ,1,2  ,2  ,0,0]

In [5]:
from sklearn.metrics import confusion_matrix
confusion_matrix(y_true, pred)

array([[1, 0, 0],
       [0, 2, 0],
       [2, 0, 3]], dtype=int64)

| 실제 0 예측 0 | 실제 0 예측 1 | 실제 0 예측 2 |  
| 실제 1 예측 0 | 실제 1 예측 1 | 실제 1 예측 2 |  
| 실제 2 예측 0 | 실제 2 예측 1 | 실제 2 예측 2 |  

In [6]:
# Binary
y_true = [0,1,1,1,1,1,1,1]
pred  = [0,1,1,1,1,1,0,0]

### <span style="color:red">P</span>recision(정밀도)
* 예측 Positive 대상 중 예측/실제 Positive = 양성 예측도(Positive 예측 성능 정밀하게 측정)  
  * 실제 Negative를 Positive로 판단하면 안 되는 경우(예측을 Positive로 하면 안되는 경우)    
    * 업무 메일을 스팸 양성 메일로 판단하면 안됨  
* <img src="https://latex.codecogs.com/gif.latex?%5Cfrac%7BTP%7D%7B%28FP&plus;TP%29%7D">  
|TN|**F<span style="color:red">P</span>**|  
|FN|**T<span style="color:red">P</span>**|

In [7]:
from sklearn.metrics import precision_score
precision_score(y_true, pred)

1.0

### Recall(재현율)
* 실제 Positive 대상 중 예측/실제 Positive = 민감도(Sensitive) = TPR(True Positive Rate)  
  * 실제 Positive를 Negative로 판단하면 안 되는 경우  
    * 암이 양성인데 음성으로 판단하면 안됨  
    * 보험 사기 양성건을 음성으로 판단하면 회사가 손해를 봄  
* <img src="https://latex.codecogs.com/gif.latex?%5Cfrac%7BTP%7D%7B%28FN&plus;TP%29%7D">  
|TN|FP|  
|**FN|TP**|

In [8]:
from sklearn.metrics import recall_score
recall_score(y_true, pred)

0.7142857142857143

### => 정밀도 재현율 둘 다 높아야 좋은 지표(trade-off 관계: 하나 올리면 하나 떨어짐)  
* 결정 임계값(Threshold) 조정  
  * predict_proba()
```python
from sklearn.preprocessing import Binarizer
b = Binarizer(threshold=0.5)
b.fit_transform(pred_proba)
```  

* 시각화 precision_recall_curve(y_true, pred_proba)

### F1_score = 정밀도 + 재현율  
* 정밀도 + 재현율이 어느쪽으로 치우치지 않을때 높아짐  
* <img src="https://latex.codecogs.com/gif.latex?F1%20%3D%20%5Cfrac%7B2%7D%7B%5Cfrac%7B1%7D%7Brecall%7D&plus;%5Cfrac%7B1%7D%7Bprecision%7D%7D%20%3D%202*%5Cfrac%7Bprecision*recall%7D%7Bprecision&plus;recall%7D">

In [9]:
from sklearn.metrics import f1_score
f1_score(y_true, pred)

0.8333333333333333

### Roc_curve, Roc_auc_score
* [X]FPR(False Positive Rate)가 변할 때, [Y]TPR(True Positive Rate)가 변하는 곡선  
  * FPR: 재현율/민감도
  * TPR: 1 - TNR(특이도: True Negative Rate)

In [10]:
from sklearn.metrics import roc_curve, roc_auc_score

## Regression(회귀)
* MAE(Mean Absolute Error)
* MSE(Mean Sqared Error)
    * MSLE(MS Log Error)
* RMSE(Root MSE)
    * RMSLE(RMS Log Error) 로그 RMSE
* R^2

### MAE(Mean Absolute Error): 차이 절댓값 평균

In [11]:
from sklearn.metrics import mean_absolute_error

### MSE(Mean Sqared Error): 차이 제곱 평균
### MSLE(MS Log Error): 로그 MSE

In [12]:
from sklearn.metrics import mean_squared_error

def mse(y,pred):
    return mean_squared_error(y,pred)



### RMSE(Root MSE): 루트 MSE
### RMSLE(RMS Log Error) 로그 RMSE

In [13]:
def rmse(y,pred):
    return np.sqrt(mean_squared_error(y,pred))

def rmsle(y, pred):
    log_y = np.log1p(y)
    log_pred = np.log1p(pred)
    squared_error = (log_y - log_pred) ** 2
    rmsle = np.sqrt(np.mean(squared_error))
    return rmsle

### <img src="https://latex.codecogs.com/gif.latex?R%5E2">
* 분산 기반, 실제값고 분산 대비 예측 값의 분산비율, 1에 가까울수록 정확

In [14]:
from sklearn.metrics import r2_score