# 모델 성능 평가

### 회귀 모델의 평가 지표
: 예측 대상이 수치 데이터인 경우
- MSE(Mean Square Error)
- RMSE(Root Mean Square Error)
- MAE(Mean Absolute Error)
- MAPE(Mean Absolute Percentage Error)
- $ R^2 $

![image.png](attachment:image.png)

### 분류 모델의 평가 지표
: 예측 대상이 범주형 데이터 경우
- 정확도(Accuracy)
- 재현율(Recall)
- 정밀도(Precision)
- F1 measure
- G measure
- ROC curve
- AUC

------------------------------------

In [1]:
import numpy as np 
import pandas as pd

## 분류 모델의 성능 평가 지표 : Accuracy

###  Accuracy(정확도)

- 실제 데이터와 예측 데이터가 얼마나 같은지 판단하는 지표


- $ 정확도(Accuracy) =  \frac{예측 결과가 동일한 데이터 건수}{전체 예측 데이터 건수} $


- 모델 예측 성능을 나타내는 직관적인 평가 지표

## Accuracy(정확도)의 맹점

### 예제1. 타이타닉 생존자 예측

#### 생존자 예측 Classifier 정의 : MyFirstClassifier

- BaseEstimator 상속 받음
- 훈련(학습)을 하지 않고 성별에 따라 생존자를 예측
    - 남자보다 여자의 생존률이 높으므로

In [5]:
from sklearn.base import BaseEstimator

In [11]:
class MyFirstClassifier(BaseEstimator):
    def fit(self,x,y=None):
        pass

    def predict(self, x):
        n = x.shape[0]
        pred = np.zeros((n,1))
        for i in range(n):
            if x.Sex.iloc[i] == 1:  # male -> 남성은 사망으로 가정
                pred[i] = 0
            else:                   # female -> 여성은 생존으로 가정
                pred[i] = 1
                
        return pred

#### MyFirstClassifier를 이용해 타이타닉 생존자 예측

- 데이터 전처리

In [7]:
from sklearn.preprocessing import LabelEncoder

# 결측치 처리
def fill_na(df):
    df['Age'].fillna(df['Age'].mean(), inplace=True)
    df['Cabin'].fillna('N', inplace=True)
    df['Embarked'].fillna('N', inplace=True)
    # df['Fare'].fillna(df['Fare'].mean(), inplace=True)
    return df

# 레이블 인코딩
def encode_features(df):
    for ftr in ['Sex','Cabin','Embarked']: 
        encoder = LabelEncoder()
        encoder.fit(df[ftr])
        df[ftr] = encoder.transform(df[ftr])
    return df

# 불필요 열 삭제
def drop_features(df):
    df.drop(['PassengerId', 'Name', 'Ticket'], axis=1, inplace=True)
    return df

# 전처리 함수
def preprocessing_features(df):
    df = fill_na(df)
    df = drop_features(df)
    df = encode_features(df)
    return df

- 생존자 예측

In [9]:
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

In [12]:
# 데이터 준비
train = pd.read_csv('data/titanic/train.csv')
x = train.drop('Survived', axis=1)
y = train.Survived

# 전처리
x = preprocessing_features(x)

# 학습/테스트 데이터 분할
train_x, val_x, train_y, val_y = train_test_split(x,y,test_size=0.2, random_state=0)

# 모델객체 생성
my_clf = MyFirstClassifier()

# 학습
my_clf.fit(train_x, train_y)

# 예측
pred = my_clf.predict(val_x)

# 성능평가
print(f'MyFirstClassifier(): {accuracy_score(val_y, pred):.4f}')

MyFirstClassifier(): 0.7877


### 예제2. MNIST 데이터 세트

- 0~9까지의 숫자 이미지
- sklearn.datasets의 load_digits() API

![image-2.png](attachment:image-2.png)

**digit 데이터 로드**

In [14]:
from sklearn.datasets import load_digits
digits = load_digits()
digits.keys()

dict_keys(['data', 'target', 'frame', 'feature_names', 'target_names', 'images', 'DESCR'])

In [16]:
print(digits.DESCR)

.. _digits_dataset:

Optical recognition of handwritten digits dataset
--------------------------------------------------

**Data Set Characteristics:**

    :Number of Instances: 1797
    :Number of Attributes: 64
    :Attribute Information: 8x8 image of integer pixels in the range 0..16.
    :Missing Attribute Values: None
    :Creator: E. Alpaydin (alpaydin '@' boun.edu.tr)
    :Date: July; 1998

This is a copy of the test set of the UCI ML hand-written digits datasets
https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits

The data set contains images of hand-written digits: 10 classes where
each class refers to a digit.

Preprocessing programs made available by NIST were used to extract
normalized bitmaps of handwritten digits from a preprinted form. From a
total of 43 people, 30 contributed to the training set and different 13
to the test set. 32x32 bitmaps are divided into nonoverlapping blocks of
4x4 and the number of on pixels are counted in each blo

In [18]:
digits.data.shape

(1797, 64)

In [23]:
digits.target[:10]

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

#### classifier 클래스 정의
- 입력되는 모든 데이터를 False(0)로 예측

In [24]:
class MySecondClassifier(BaseEstimator):
    def fit(self,x,y):
        pass

    def predict(self,x):
        return np.zeros((len(x),1), dtype=bool)        

#### 이진 분류 문제로 변환

- 7인 데이터는 1, 그외 데이터는 0으로 변환
- 불균형한 데이터 세트로 변형
    - 7 : 10%,
    - 그외 : 90%

In [34]:
x = digits.data
y = (digits.target == 7).astype(int)
# print(y[10:20])
# digits.target[10:20]

# 학습/평가 데이터 분할
train_x, test_x, train_y, test_y = train_test_split(x,y,test_size=0.2, random_state=11)

# 모델객체 생성
my_clf2 = MySecondClassifier()

# 학습
my_clf2.fit(train_x, train_y)

# 예측
pred2 = my_clf2.predict(test_x)

# 성능평가
print(f'MySecondClassifier: {accuracy_score(test_y, pred2):.4f}')

[0 0 0 0 0 0 0 1 0 0]
MySecondClassifier: 0.9000


**불균형한 레이블 데이터 분포도 확인**

In [39]:
train_y.shape, test_y.shape

((1437,), (360,))

In [40]:
pd.Series(test_y).value_counts()

0    324
1     36
Name: count, dtype: int64

In [41]:
pd.Series(train_y).value_counts()

0    1294
1     143
Name: count, dtype: int64

#### ★정확도 평가 지표의 맹점

- 아무것도 하지않고 무조건 특정한 결과로 찍어도 데이터가 균일하지않는 경우 높은 수치가 나타날 수 있음
    - -> 정확도만을 믿고 하면 안된다.

------------------------------------------------