# Model Evaluation Metrics
- 모델의 성능을 객관적으로 평가하기 위해 사용되는 다양한 방법과 수치
## 회귀 모델 평가 지표
### 1. Mean Absolute Error ; MAE
- 실제 값과 예측 값의 절대적인 차이의 평균 값
- MAE는 예측의 절대적인 오차를 측정
- 모든 오차에 동일한 중요성을 부여

![image.png](attachment:image.png)

### 2. Mean Squared Error ; MSE
- 실제 값과 예측 값의 차이를 제곱한 후 평균 값
- MSE는 큰 오차에 더 큰 패털티를 부여
- 큰 오차가 모델 평가에 더 큰 영향을 미치도록 함

![image-2.png](attachment:image-2.png)

### 3. Root Mean Squared Error ; RMSE
- MSE의 제곱근
- MSE와 동일하게 큰 오차에 더 큰 패널티 부여하지만, 원래 단위로 결과를 제공
- 예측 오차의 표준편차와 유사

![image-3.png](attachment:image-3.png)

### 4. R-Squared ; R²
- 회귀 모델이 데이터의 변동성을 얼마나 설명하는지를 나타내는 지표
- R²이 1이 가까울수록 모델이 데이터를 잘 설명하고 있다는 것을 의미
- 음수 값은 모델이 평균값을 사용한 것보다 더 나쁘다는 것을 나타냄

![image-4.png](attachment:image-4.png)

### 5. Adjusted R-Squared
- R²을 조정하여 모델의 특성 수에 따라 값을 수정
- 특성 수가 많을수록 R²가 인위적으로 증가할 수 있는 것을 보정
- 모델의 복잡성을 고려하여, 적합한 특성 수를 선택하는 데 유용

![image-5.png](attachment:image-5.png)

### 6. Mean Absolute Percentage Error ; MAPE
- 예측 오차의 절대 백분율을 평균한 값
- 백분율 형태로 오차를 표현하여 예측 성능을 비교하는 데 유용
- 실제 값이 0에 가까운 경우 문제가 될 수 있음

### 7. Mean Squared Logarithmic Erro ; MSLE
- 예측 값과 실제 값의 로그를 사용하여 오차 측정
- 데이터가 큰 범위에 걸쳐 있을 때 상대적인 오차를 강조
- 예측 값이 매우 작은 경우에 유용

![image-6.png](attachment:image-6.png)

## 분류 모델 평가 지표
### 1. Accuracy 정확도
- 전체 데이터에 모델이 올바르게 분류한 데이터의 비율
- 데이터 클래스가 균형 잡혀 있을 때 유용하지만, 클래스 불균형이 있는 경우 부정확할수 있음

![image-7.png](attachment:image-7.png)

### 2. Precision 정밀도
- 모델이 긍정으로 예측한 것 중에서 실제로 긍정인 데이터의 비율
- 높은 정밀도는 모델이 긍정으로 예측할 때 잘못 예측하는 경우가 적다는 것을 의미

![image-8.png](attachment:image-8.png)

### 3. Recall 재현율 / Sensitivity
- 실제 긍정 데이터 중에서 모델이 긍정으로 올바르게 예측한 비율
- 높은 재현율은 모델이 긍정 클래스를 놓치지 않고 잘 포착한다는 것을 의미

![image-9.png](attachment:image-9.png)

### 4. F1-Secore
- 정밀도와 재현율의 조화 평균
- 두 지표를 동시에 고려하여 균형 잡힌 평가를 제공
- 클래스 불균형 문제를 다룰 때, 유용하며, 정밀도와 재현율을 모두 고려

![image-10.png](attachment:image-10.png)

### 5. ROC Curve ; Receiver Operating Characteristic Curve
- 다양한 임계값에서의 True Positive Rate(참 양성 비율)과 False Positive Rate(거짓 양성 비율)의 관계를 시각화한 곡선
- 모델의 분류 성능을 시각적으로 평가할 수 있음
- AUC 값으로 모델의 성능을 정량적으로 측정 가능

![image-22.png](attachment:image-22.png)

### 6. AUC ; Area Under the Curve
- ROC 곡선 아래의 면적
- 모델 분류 성능을 단일 숫자로 요약
- AUC값이 1에 가까울 수록 모델의 성능이 뛰어남
- 0.5는 무작위 추측과 같다는 의미

### 7. Confusion Matrix 혼동 행렬
- 실제 값과 모델의 예측 결과를 시각적으로 표시한 행렬]
- True Positive(TP), True Negative(TN), False Positive(FP), False Negative(FN)의 수를 보여줌
- 모델의 분류 성능을 상세히 분석 가능
다양한 지표를 계산하는 데 기초 자료로 사용

### 8. Log Loss  로그 손실
- 모델의 확률 예측의 로그 손실을 측정
- 예측 확률이 실제 클래스와 얼마나 잘 맞는지 평가
- 확률 예측의 품질을 측정
- 예측의 신뢰성과 정확성 평가

![image-11.png](attachment:image-11.png)

### 9. Matthews Correlation Coefficient ; MCC
- 분류의 전반적인 성능을 평가하는 지표
- TP, TN, FP, FN 모두 고려
- 불균형 데이터셋에서도 유용
- -1 ~ 1사이의 값을 가짐
- 1은 완벽한 예측 / 0은 무작위 추측과 같음 / -1은 완전 잘못된 예측

![image-23.png](attachment:image-23.png)

## 클러스터링 평가 지표
- 군집의 품질과 클러스터 간의 분리 정도를 측정
### 1. Silhouette Score 
- 각 데이터 포인트가 군집 내에서 얼마나 잘 군집화 되었는지를 측정
- 1에 가까울수록 군집이 잘 형성되었음을 의미
- -1에 가까울수록 잘못 군집화 되었음을 의미
- 각 데이터 포인트에 대해 계산된 후, 전체 데이터 포인트의 평균으로 클러스터의 품질 평가

![image-12.png](attachment:image-12.png)

### 2. Davies-Bouldin Index ; DBI
- 클러스터 간의 분리도와 클러스터 내의 응집도를 고려하여 군집의 품질 측정
- 값이 작을수록 클러스터 간 분리도가 좋고, 클러스터 내 응집도가 높음, 더 좋은 군집을 의미
- 클러스터 간 상대적 품질을 평가

![image-13.png](attachment:image-13.png)

### 3. Calinski-Harabasz Index ; CH Index
- 클러스터 간 분리도와 클러스터 내 응집도를 기반으로 클러스터의 품질을 측정
- 캅이 클수록 군집화가 잘 이루어졌음을 의미
- 클러스터 간 거리와 클러스터 내 거리의 비율을 측정

![image-14.png](attachment:image-14.png)

### 4. Inertia 응집도
- 각 데이터 포인트와 해당 클러스터의 중심 간 제곱 거리의 합
- 일반적으로 K-means에서 사용
- 클러스터가 데이터 포인트를 얼마나 잘 묶어두는지를 측정
- 값이 낮을수록 클러스터 품질이 좋다고 평가

![image-15.png](attachment:image-15.png)

### 5. Within-Cluster Sum of Squares ; WCSS
- 각 클러스터의 데이터 포인트와 클러스터 중심 간 제곱 거리 합
- Inertia와 유사
- 클러스터 내부의 분산을 측정
- 값이 낮을수록 클러스터 품질이 좋음

![image-16.png](attachment:image-16.png)

### 6. Normalized Mutual Information ; NMI
- 군집화 결과와 실제 클래스 레이블 간의 상호 정보를 측정
- 군집화 결과와 실제 클래스 레이블 간 유사성을 나타냄
- 데이터의 실제 레이블이 주어질 때, 클러스터링 결과가 얼마나 잘 일치하는지를 평가

![image-17.png](attachment:image-17.png)

### 7. Adjusted Rand Index ; ARI
- 군집화 결과와 실제 레이블 간의 유사성을 측정
- 랜드 지수의 수정된 버전으로, 클래스의 불균형을 보정
- 클러스터링과 실제 클래스 간의 일치를 평가
- 1에 가까울수록 군집화 결과가 좋음

![image-18.png](attachment:image-18.png)

### 8. Homogeneity
- 클러스터가 동일한 클래스로 구성된 비율을 측정

![image-19.png](attachment:image-19.png)

### 9. Completeness
- 동일한 클래스의 데이터가 동일한 클러스터에 속할 확률을 측정

![image-20.png](attachment:image-20.png)

### 10. V-Measure
- Homogeneity와 Completeness의 조화 평균

![image-21.png](attachment:image-21.png)

## 기타 평가 지표
### 1. Gini Coeffient (Gini Index)
- 이진 분류의 불순도를 측정하는 지표
- 주로 분류 문제에 사용
- 0은 완벽하게 균등한 분포 / 1은 불순도가 가장 큰 경우

![image-24.png](attachment:image-24.png)

### 2. Brier Score
- 확률 예측의 정확성을 측정하는 지표
- 확률 예측과 실제 결과 간의 차이를 제곱하여 평균한 값
- 값이 낮을수록 예측의 정확성이 높음

![image-25.png](attachment:image-25.png)

### 3. Kappa Score (Cohen's Kappa)
- 분류 모델의 정확성을 측정
- 우연에 의한 정확도 보정
- 1은 완벽한 일치를 의미 / 0은 우연에 의한 일치를 의미

![image-26.png](attachment:image-26.png)

### 4. Hammin Loss
- 다중 클래스 분류 문제에서 예측과 실제 클래스 간의 불일치 정도를 측정
- 값이 낮을수록 모델 성능이 좋음

![image-27.png](attachment:image-27.png)

### 5. Jaccard Index
- 두 집합의 유사성을 측정하는 지표
- 두 집합의 교집합 크기를 합집합 크기로 나눈 비율

![image-28.png](attachment:image-28.png)

- 주로 이진 분류 문제와 클러스터링에서 사용
- 1은 두 집합이 완전 동일함을 의미 / 0은 두 집합이 전혀 겹치지 않음을 의미
- 클러스터 간 유사성 평가에 사용되며, 클러스터의 분포가 얼마나 비슷한지 파악하는 데 유용
- 이진 분류에서, TP, TN, FP, FN을 이용해 계산 가능

![image-29.png](attachment:image-29.png)