### 분류 모델 평가 지표

#### 1. 혼동 행렬 (Confusion Matrix)
- 혼동 행렬은 예측 결과와 실제 결과를 비교하여 TP, TN, FP, FN의 수를 보여주는 행렬이다. 
- 혼동행렬을 이용해 다양한 평가지표(정확도, 재현률, 정밀도, F1 점수, AUC 점수)를 계산할 수 있다.

![](https://velog.velcdn.com/images/newnew_daddy/post/783fb20d-ef25-4e71-b9fd-fec02eca34f6/image.png)

![](https://velog.velcdn.com/images/newnew_daddy/post/b9af8b40-695e-4df1-91fe-7506ca494f16/image.png)

- True Positive (TP): 실제 양성을 정확히 예측한 경우
- True Negative (TN): 실제 음성을 정확히 예측한 경우
- False Positive (FP): 실제는 음성인데 양성으로 잘못 예측한 경우 (Type I Error)
- False Negative (FN): 실제는 양성인데 음성으로 잘못 예측한 경우 (Type II Error)

![](https://velog.velcdn.com/images/newnew_daddy/post/fbfc9632-00ce-4dd1-bad9-9527af3273aa/image.png)

#### 2. 정확도 (Accuracy)
- 정확도는 전체 예측 중에서 정확하게 예측한 비율
$$
\text{정확도} = \frac{TP+TN}{TP+TN+FP+FN}
$$

#### 3. 정밀도 (Precision)
- Positive(양성)으로 예측한 것 중 실제 Positive(양성)인 비율
- **PPV**(Positive Predictive Value) 라고도 한다.
- ex) 스팸메일로 예측한 것 중 스팸메일의 비율. 암 환자로 예측한 사람 중 실제 암 환자의 비율
$$
\text{정밀도} = \frac{\text{TP}}{\text{TP} + \text{FP}}
$$

#### 4. 재현율/민감도 (Recall)
- 실제 Positive(양성)인 것 중에 Positive(양성)로 예측한 것의 비율
- **TPR**(True Positive Rate) 이라고도 한다.
- ex) 스팸 메일 중 스팸메일로 예측한 비율. 실제 암 환자들 중 암 환자로 예측한 비율
$$
\text{재현율} = \frac{\text{TP}}{\text{TP} + \text{FN}}
$$

#### 5. 특이도 (Specificity)
- 실제 Negative(음성)인 것들 중 Negative(음성)으로 맞게 예측 한 것의 비율
- **TNR**(True Negative Rate) 라고도 한다.
$$
\text{특이도} = \frac{\text{TN}}{\text{TN} + \text{FP}}
$$

#### 6. 위양성률 (False Positive Rate)
- 실제 음성중 양성으로 잘못 예측 한 비율
- 위양성률 = 1 - 특이도
$$
\text{위양성률} = \cfrac{FP}{TN+FP}
$$

#### 7. F1 점수 (F1 Score)
- F1 점수는 정밀도와 재현율의 조화 평균으로, 두 지표의 균형을 평가한다.
- recall과 precision이 비슷할 수록 높은 값을 가지게 된다. F1 score가 높다는 것은 recall과 precision이 한쪽으로 치우쳐저 있이 않고 둘다 좋다고 판단할 수 있는 근거가 된다.
$$
\text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}
$$

## ROC-AUC
#### 1. 개념
- ROC 곡선(Receiver Operating Characteristic Curve)은 TPR(True Positive Rate)과 FPR(False Positive Rate)의 변화 관계를 나타낸 그래프이다.
- AUC(Area Under the Curve)는 ROC 곡선 아래의 면적을 의미하며, 1에 가까울수록 모델의 성능이 좋음을 나타낸다.

#### 2. 설명

![](https://velog.velcdn.com/images/newnew_daddy/post/b2daad43-8e6f-4a31-bd07-1b75212cdab9/image.png)

- **FPR(False Positive Rate-위양성율)**
    - 1-특이도(TNR)
    - 실제 음성중 양성으로 잘못 예측 한 비율
    - 실제 Positive를 얼마나 잘 맞추는가
    $$
    \cfrac{FP}{TN+FP}
    $$
- **TPR(True Positive Rate-재현율/민감도)** 
    - 재현율(recall)
    - 실제 양성중 양성으로 맞게 예측한 비율
    - 실제 Negative를 얼마나 잘 맞추는가
    $$
    \frac{TP}{FN+TP}
    $$
- **ROC 곡선**
    - 2진 분류의 모델 성능 평가 지표 중 하나.
    - 불균형 데이터셋을 평가할 때 사용.
    - FPR을 X축, TPR을 Y축으로 놓고 임계값을 변경해서 FPR이 변할 때 TPR이 어떻게 변하는지 나타내는 곡선.
- **AUC**
    - ROC 곡선 아래쪽 면적
    - 0 ~ 1 사이 실수로 나오며 클수록 좋다.
   - **AUC 점수기준**
        - 1.0 ~ 0.9 : 아주 좋음
        - 0.9 ~ 0.8 : 좋음
        - 0.8 ~ 0.7 : 괜찮은 모델
        - 0.7 ~ 0.6 : 의미는 있으나 좋은 모델은 아님
        - 0.6 ~ 0.5 : 좋지 않은 모델