# CHAPTER 03. 평가

- 이진 분류 에서의 평가 지표
    - 정확도 보다는 다른 성능 평가 지표가 더 중요시되는 경우가 많다.
    - 성능 평가 지표의 종류
        - 정확도(Accuracy)
        - 오차행렬(Confusion Matrix)
        - 정밀도(Precision)
        - 재현율(Recall)
        - F1 스코어
        - ROC AUC
        
    

## 01. 정확도(Accuracy)

- 정확도 = 맞게 예측한 수 / 전체 예측 데이터 수
- 불균형한 레이블 분포를 가진 데이터 셋에서 예측 값이 한 값으로 고정된 에스티메이터를 사용하면 높은 정확도가 나올 수 있는 점에서 불균형 분포를 가진 데이터셋의 이진분류 에스티메이터의 성능을 평가하는 지표로서 정확도는 적절하지 못함.



In [17]:

from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression

def fillna(df):
    df["Age"].fillna(df["Age"].mean(), inplace=True)
    df["Cabin"].fillna("N", inplace=True)
    df["Embarked"].fillna("N", inplace=True)
    df["Fare"].fillna(0, inplace=True)
    return df

def drop_features(df):
    df.drop(["PassengerId", "Name", "Ticket"], axis = 1, inplace = True)
    return df

def format_features(df):
    df["Cabin"] = df["Cabin"].str[:1]
    features = ["Cabin", "Sex", "Embarked"]
    for f in features:
        encoder = LabelEncoder()
        encoder = encoder.fit(df[f])
        df[f] = encoder.transform(df[f])
    return df

def preprocessing(df):
    df = fillna(df)
    df = drop_features(df)
    df = format_features(df)
    return df

titanic_df = pd.read_csv("../data/titanic_train.csv")
Y_titanic_df = titanic_df["Survived"]
X_titanic_df = titanic_df.drop("Survived", axis = 1)

X_titanic_df = preprocessing(X_titanic_df)

NameError: name &#39;LabelEncoder&#39; is not defined

## 02. 오차 행렬

<pre>
[[TN, FP]
 [FN, TP]]
</pre>

- True : 맞춤, False: 틀림, Positive: 1 예상, Negative: 0 예상
- 정확도 = TN + TP / TN + FP + FN + TP (맞춘거 / 전체)



## 03. 정밀도와 재현율

- 정밀도(Precision) = TP / FP + TP 
    - Positive 라고 예상한 경우에서 실제 Positive 였던 경우
    - FN 가 낮은 정도
    - FN 이 치명적일 경우 높을 수록 좋음 ex. P: 암 양성, FN: 암환자 음성으로 판단
- 재현율(Recall) = TP / FN + TP 
    - 실제 Positive 인 경우 중 Positive 라고 예상한 경우의 수
    - FP 가 낮은 정도
    - FP 가 치명적일 경우 높을 수록 좋음 ex. P: 스팸메일임, FP 하면 일반메일 못읽음) 
- 정밀도와 재현율 모두 1 에 가까울 수록 좋지만, FN, FP 중 치명적인 경우에 따라 평가 지표의 중요성이 달라짐.


### 정밀도/재현율 트레이드오프

- 정밀도 재현율 서로 상호보완적인 관계라 하나 높이면 하나 떨어짐
- threshold 값을 정하여 positive 예측 확률을 높일 수 있음
- precision_recall_curve() : threshold 값에 따른 재현율, 정밀도를 파악할 수 있어서 적절한 threshold 를 찾을 수 있음


### 정밀도와 재현율의 맹점

- 확실한 기준일 때만 positive 예측 -> 정밀도 100%
- 모두 positive 로 예측 -> 재현율 100%
- 하나만 높이려기 보다는 둘다 적절히 높은게 좋다.


## 04. F1 스코어

- 정밀도, 재현율 중 한 쪽으로 치우치지 않을 때 높음



### ROC 곡선과 AUC

- Receiver Operation Characteristic Curve
- 민감도(True Positive Rate) 
