# 분석 모형 평가 및 개선

## 분석 모형 평가

### 평가지표 

1) 분석 모형 설정 
- 편향(Bias) : 학습 알고리즘에서 잘못된 가정을 했을 때 발생하는 오차
- 분산(Variance) : 훈련 데이터에 내재된 작은 변동으로 발생하는 오차 
- 낮은 평향과 낮은 분산으로 설정되어야 한다 

2) 분석 모형 평가방법
- 범주형 : 혼동 행렬(Confusion Matrix)
- 연속형 : RMSE(Root Mean Squared Error) 

3) 회귀 모형 평가 지표
- 오차 제곱합(SSE) : $SSE = \sum_{i=1}^{n}(y_i - \hat y_i)^2$
- 전체 제곱합(SST) : $SST = \sum_{i=1}^{n}(y_i - \bar y_i)^2$
- 회귀 제곱합(SSR) : $SSR = \sum_{i=1}^{n}(\hat y_i - \bar y_i)^2$
- 평균 오차(AE) : $AE = \frac{1}{n} \sum_{i=1}^{n}(y_i - \hat y_i)^2$
- 평균 절대 오차(MAE) : $MAE = \frac{1}{n} \sum_{i=1}^{n}|y_i - \hat y_i|^2$
- 평균 제곱근 오차(RMSE) : $ RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n}(y_i - \hat y_i)^2}$
- 평균 절대 백분율 오차(MAPE) : $MAPE = \frac{100}{n} \sum_{i=1}^{n}|\frac{y_i - \hat y_i}{y_i}|$
- 평균 백분율 오차(MPE) : $MPE = \frac{100}{n} \sum_{i=1}^{n}(\frac{y_i - \hat y_i}{y_i})$
- 결정계수
    - Coefficient of Determination($R^2$)
    - 회귀 모형이 실제값을 얼마나 잘 나타내는지에 대한 비율 
    - 1에 가까울 수록 잘 설명
    - $R^2 = \frac{SSR}{SST}$
- 수정된 결정계수
    - 적절하지 않는 독립변수를 추가하는 것에 패널티를 부가함
    - $R_a ^ 2 = 1-(\frac{n-1}{n-p-1})\frac{SSE}{SST}$
- Mallow's $C_p$
    - 수정된 결정계수와 마찬가지로 적절하지 않는 독립변수에 패넡티를 부여 
    - 값이 작을수록 설명력이 좋음 
    
4) 분석 모형 평가지표
- 혼동 행렬(Confusion Matrix) 
    - 모델에서 구한 분류와 실제 분류를 교차표 형태로 정리한 행렬 
    - 예측 클래스
        - 예측이 정확한 경우 : TP, TN
        - 예측이 부정확한 경우 : FP, FN 
    - 평가지표 
        - 정확도(Accuracy) : $\frac{TP + TN}{TP + TN + FP + FN}$
        - 오차비율(Error rate) : $\frac{FP + FN}{TP + TN + FP + FN}$
        - 재현율(Recall) : $\frac{TP}{TP + FN}$
        - 특이도(Specify) : $\frac{TN}{TN + FP}$
        - 거짓 긍정률 : $\frac{FP}{TN + FP}$
        - 정밀도(Precision) : $\frac{TP}{TP + FP}$
        - F-Measure : $2 \times \frac{Precision \times Recall}{Precision + Recall}$
        - 카파 통계량(Kappa Statistics) : 두 관찰자가 측정한 범주 값에 대한 일치도를 측정하는 방법
- ROC 곡선
    - 가로축을 FP rate, 세로축을 TP rate로 두어 시각화한 그래프 
    - 왼쪽 꼭대기에 가깝게 그려질수록 분류 성능이 우수 
    - AUC(Area Under the ROC curve) : ROC곡선 아래의 면적을 모형의 평가지표로 설정
    - AUC가 1에 가까울수록 좋음
    
- 이익 도표(Gain Chart) 
    

### 분석 모형 진단 

### 교차 검증


### 모수 유의성 검정 

### 적합도 검정 

## 분석 모형 개선 

### 과대 적합 방지

### 매개변수 최적화 

### 분석 모형 융합 

### 최종 모형 선정 

# 분석 결과 해석 및 활용

## 분석 결과 해석

### 분석 모형 해석 

### 비즈니스 기여도 평가 

## 분석 결과 시각화

### 시공간 시각화 

### 분포 시각화 

### 관계 시각화 

### 비교 시각화 

### 인포그래픽

## 분석 결과 활용

### 분석 모형 전개

### 분석 결과 활용 시나리오 개발 

### 분석 모형 모니터링 

### 분석 모형 리모델링