In [None]:
'''
- 정량 평가의 경우 (e.g. acc 80% 이상)은 정확히 해당 지표를 맞추어야 합니다.
- 다음의 경우는 **미평가**가 될 수 있습니다.
    - **코드만 있고 결과물이 없는 경우**
        - **코드에 대한 설명이 없는 경우**
        - **회고가 없는 경우**
    - **깃헙 링크가 잘못되어 열람이 안되는 경우**
        - **(중요) 링크를 제출하기 전에 해당 링크에서 프로젝트가 잘 열리는지 꼭 확인해주세요.**
        - 만약 프로젝트의 용량이 커서 프로젝트 로딩이 안된다면 **nbviewer 링크**를 제출해주세요.
'''

In [2]:
# sklearn라이브러리를 임포트하고 버전 확인하기
import sklearn

print(sklearn.__version__)

1.0


In [3]:
# 1. import 하기
from sklearn.datasets import load_wine                  # sklearn datasets으로 wine 데이터셋 로드
from sklearn.model_selection import train_test_split    # 데이터셋을 train, test로 분할

from sklearn.metrics import classification_report       # Text summary of the precision, recall, F1 score for each class
from sklearn.metrics import accuracy_score              # sklearn.metrincs는 평가에 대한 함수 모음집, 정확도
from sklearn.metrics import confusion_matrix            # sklearn.metrincs는 평가에 대한 함수 모음집, 오차행렬

from sklearn.tree import DecisionTreeClassifier         # DecisionTree 분류기
from sklearn.ensemble import RandomForestClassifier     # Random forest 분류기
from sklearn import svm                                 # SVM 분류기
from sklearn.linear_model import SGDClassifier          # SGD 분류기
from sklearn.linear_model import LogisticRegression     # Logistic Regression 분류기


In [76]:
# 2. 데이터 준비하기
wines = load_wine()                 # wine 데이터셋의 객체 생성(자료 가져오기)
type(wines)                         # type은 Bunch으로 Dictionary 자료형과 유사한 자료형


# 3. 데이터 이해하기

# 데이터와 타켓 데이터셋 변수에 할당
wines_data = wines.data             # wines 데이터셋의 feature 값들을 data 변수에 할당
wines_label = wines.target          # wines 데이터셋의 target 값들을 label 변수에 할당

# wines 메서드 확인하기
dir(wines)                          # wines 메서드 보기
wines.keys()                        # wines 메서드 보기 (딕셔너리 형태)

# 데이터
wines_data                          # wines 데이터셋의 각 데이터(행)을 보기
                                    # type은 ndarray(1차원)
                                    # data는 머신러닝에 학습시킬 "문제지" 
wines_data.shape                    # nd.ndarray 타입이고, 178개 데이터(세로)가 있으며 13개의 속성값(가로)이 있음
wines_data[0]                       # wines.data의 첫번째 데이터(원소) 확인
wines_data[0].shape                 # 첫번째 데이터는 13개 속성이 있음

# 속성
wines.feature_names                 # 속성(Attribute)의 이름
                                    # 'pixel_0_0 처럼 0번 데이터의 0번 속성'
 
# Label, Class, Target
wines.target                        # wines 데이터셋의 속성값(열) 보기.
                                    # type은 ndarray(1차원)
                                    # target은 머신러닝 학습에 필요한 "정답지"
wines.target.shape                  # target 속성은 178개 데이터가 존재
wines.target_names                  # label 또는 Class 또는 Target 이름
target_names = wines.target_names   # target_names 변수에 할당

# 요약 문서 
print(wines.DESCR)                  # wines 데이터셋 설명

wines.frame                         # ???? NoneType이며


# 4. Train, Test로 데이터 분할하기
''' 전체 데이터를 모두 학습시키는데 사용하면 테스트용 데이터가 없으므로 데이터의 일부는 테스트용으로 떼어놓는다
    digits_data 데이터셋을 X_train, X_test(20%) 떼어두고, digits_label 데이터셋을 y_train, y_test(20%) 떼어 놓는다
    
    테스트 사이즈 0.2라는 의미는 20%를 떼어 놓겠다는 의미
    
    random_state는 데이터 분할하기 전에 임의로 돌려서 분할한다는 의미이며 숫자는 램덤 시드값.
    train_test_split 인자중 shuffle=True이므로 랜덤 씨드값만 부여하면 됨
    사용 이유는 wines.target의 값은 0으로 채우다가 1채우고 2채우는 형식이기 때문에
    먄약 랜덤으로 썩지 않고 데이터를 분할하면 앞에서부터 대부분 0과 1의 라벨값만 얻어지고 테스트는 전부 2로 할당받을 것이므로 
    데이터 결과의 정확성을 위해 임의로 썩는다
    '''
X_train, X_test, y_train, y_test = train_test_split(wines_data, wines_label, test_size=0.2, random_state=7)  

X_train.shape, y_train.shape    # train 데이터는 전체 데이터의 80% 차지
X_test.shape, y_test.shape      # test 데이터는 전체 데이터의 20% 차지

.. _wine_dataset:

Wine recognition dataset
------------------------

**Data Set Characteristics:**

    :Number of Instances: 178 (50 in each of three classes)
    :Number of Attributes: 13 numeric, predictive attributes and the class
    :Attribute Information:
 		- Alcohol
 		- Malic acid
 		- Ash
		- Alcalinity of ash  
 		- Magnesium
		- Total phenols
 		- Flavanoids
 		- Nonflavanoid phenols
 		- Proanthocyanins
		- Color intensity
 		- Hue
 		- OD280/OD315 of diluted wines
 		- Proline

    - class:
            - class_0
            - class_1
            - class_2
		
    :Summary Statistics:
    
                                   Min   Max   Mean     SD
    Alcohol:                      11.0  14.8    13.0   0.8
    Malic Acid:                   0.74  5.80    2.34  1.12
    Ash:                          1.36  3.23    2.36  0.27
    Alcalinity of Ash:            10.6  30.0    19.5   3.3
    Magnesium:                    70.0 162.0    99.7  14.3
    Total Phenols:                0

((36, 13), (36,))

In [112]:
target_names                                       # 타켓 네임 출력해보기. 악성과 양성

array(['class_0', 'class_1', 'class_2'], dtype='<U7')

In [None]:
# 5. 모델 학습

In [64]:
# 5-1. DecisionTree 모델 학습
decision_tree = DecisionTreeClassifier(random_state=32)     # DecisionTreeClassifier 객체 생성, 랜덤 씨드는 32
print(decision_tree._estimator_type)                        # decision_tree 객체 타입은 classifier인 분류기

decision_tree.fit(X_train, y_train)                         # train 데이터셋으로 의사결정나무 모델 지도학습(fitting)

y_pred_decision_tree = decision_tree.predict(X_test)        # 학습된 모델에 테스트 feature데이터 넣어서 예측값 생성
y_pred_decision_tree

classifier


array([2, 0, 2, 2, 1, 2, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 2, 0, 0, 1, 1,
       1, 1, 0, 2, 1, 2, 2, 2, 1, 0, 2, 1, 1, 1])

In [65]:
# 5-2. Random Forest 모델 학습
random_forest = RandomForestClassifier(random_state=32)  # Random Forest Classifier 객체 생성
print(random_forest._estimator_type)                     # random_forest 객체 타입은 classifier인 분류기

random_forest.fit(X_train, y_train)                      # train 데이터셋으로 랜덤 포레스트 모델 지도학습(fitting)

y_pred_random_forest = random_forest.predict(X_test)     # 학습된 모델에 테스트 feature데이터 넣어서 예측값 생성
y_pred_random_forest

classifier


array([2, 0, 2, 2, 1, 2, 1, 0, 1, 2, 0, 1, 2, 1, 1, 1, 1, 2, 0, 0, 1, 1,
       1, 1, 0, 2, 1, 2, 2, 2, 1, 0, 2, 1, 1, 1])

In [66]:
# 5-3. SVM 모델 학습
svm_model = svm.SVC()                                    # SVM Classifier 객체 생성
print(svm_model._estimator_type)                         # svm_model 객체 타입은 classifier인 분류기


svm_model.fit(X_train, y_train)                          # train 데이터셋으로 svm 모델 지도학습(fitting)

y_pred_svm_model = svm_model.predict(X_test)             # 학습된 모델에 테스트 feature데이터 넣어서 예측값 생성
y_pred_svm_model 

classifier


array([1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1,
       1, 1, 0, 1, 1, 2, 1, 1, 1, 2, 1, 1, 1, 2])

In [67]:
# 5-4. SGD Classifier 모델 학습
sgd_model = SGDClassifier()                              # SGD Classifier 객체 생성
print(sgd_model._estimator_type)                         # sgd_model 객체 타입은 classifier인 분류기

sgd_model.fit(X_train, y_train)                          # train 데이터셋으로 sgd 모델 지도학습(fitting)

y_pred_sgd_model = sgd_model.predict(X_test)             # 학습된 모델에 테스트 feature데이터 넣어서 예측값 생성
y_pred_sgd_model

classifier


array([0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0,
       1, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0])

In [68]:
# 5-5. Logistic Regression 모델 학습
logistic_model = LogisticRegression(max_iter=10000)      # Logistic Regression 객체 생성
print(logistic_model._estimator_type)                    # logistic_model 객체 타입은 classifier인 분류기

logistic_model.fit(X_train, y_train)                     # train 데이터셋으로 logistic regression 모델 지도학습(fitting)

y_pred_logistic_model = logistic_model.predict(X_test)   # 학습된 모델에 테스트 feature데이터 넣어서 예측값 생성
y_pred_logistic_model

classifier


array([2, 0, 2, 2, 1, 2, 1, 0, 1, 2, 0, 1, 2, 1, 1, 1, 1, 2, 0, 0, 1, 1,
       1, 1, 0, 2, 1, 2, 2, 1, 1, 0, 2, 1, 1, 1])

In [None]:
# 6. 분류에 사용되는 척도 종류 및 성능 평가
# 척도 종류
#    1) accuracy_score
#    2) confusion matrix
#    3) classification_report

In [None]:
# 6-1 DecisionTree 평가

In [72]:
# 6-1-1 Accuracy 평가
# 실제 정답 y_test과 예측값 y_pred 비교하여 정확도 측정하기
accuracy = accuracy_score(y_test, y_pred_decision_tree)
accuracy

# 결과 해석 : 
# Accuracy가 94%이므로 나쁘지 않다. 테스트 데이터가 약 36개이므로 총 33.8개 맞았다는 의미
# 단, 정확도는 데이터가 imbalanced이면 결과값의 신뢰도는 떨어진다. 따라서 오차 행렬도 같이 알아보겠다

0.9444444444444444

In [70]:
# 6-1-2 confusion matrix 평가
confusion_matrix(y_test, y_pred_decision_tree)

# 오차 행렬 해석
# Accuracy
# 전체 예측한 데이터 중에서 실제로 예측이 맞은 것(TP + TN)의 비율
# 위의 결과에 따라 94%
# 그러나 실제 클래스 별 표본의 개수가 서로 차이가 많이 나서 imbalanced한 데이터셋이므로 Accuracy의 결과값은 신뢰성이 없을 수 있으므로 F1-score 값을 확인해야 한다
# F1-Score을 알려면 정확도와 재현율을 알아야 함

# Recall
# 실제 클래스 0: 총 7개중 실제 class 0을 보여주고 올바르게 0이라고 예측한 경우(TP)가 7개 -> 100%
# 실제 클래스 1: 총 17개중 실제 class 1을 보여주고 올바르게 1이라고 예측한 경우(TP)가 17개 -> 100 %
# 실제 클래스 2: 총 12개중 실제 class 2를 보여주고 올바르게 2이라고 예측한 경우(TP)가 10개, 실제 class 2을 보여줬는데 예측 class 1로 예측한 경우(FN) 2개 -> 83%
# 즉, 실제 각 양성클래스 중에서 제대로 양성이라고 예측한 것의 비율이 높다(재현율이 높다)

# Precision
# 예측 클래스 0: 총 7개중 양성 클래스 0에 속한다고 예측한 것 중에서 실제 0인 경우(TP)가 7 -> 100%
# 예측 클래스 1: 총 19개중 양성 클래스 1에 속한다고 예측한 것 중에서 실제 1인 경우(TP)가 17 -> 89%
# 예측 클래스 2: 총 10개중 양성 클래스 2에 속한다고 예측한 것 중에서 실제 2인 경우(TP)가 10 -> 100%
# 즉, 예측한 것 중에서 실제 양성으로 예측한 수의 비율이 높다(정확도가 높다)

# 결론
# Decisiion Tree 모델의 f1-score의 단순평균(Macro)과 가중평균(Weighted)는 0.95와 0.94로 정확도와 차이가 거의 없다.
# Accuracy도 괜찮고 F1-score도 괜찮다

array([[ 7,  0,  0],
       [ 0, 17,  0],
       [ 0,  2, 10]])

In [77]:
# 6-1-3 classification_report 평가
print(classification_report(y_test, y_pred_decision_tree, target_names=target_names))

# 오차 행렬의 요약 버전
# 이미 위에서 설명했음

              precision    recall  f1-score   support

     class_0       1.00      1.00      1.00         7
     class_1       0.89      1.00      0.94        17
     class_2       1.00      0.83      0.91        12

    accuracy                           0.94        36
   macro avg       0.96      0.94      0.95        36
weighted avg       0.95      0.94      0.94        36



In [None]:
# 6-2. Random Forest 평가

In [102]:
# 6-2-1 Accuracy 평가
# 실제 정답 y_test과 예측값 y_pred 비교하여 정확도 측정하기
accuracy = accuracy_score(y_test, y_pred_random_forest)
accuracy

# 결과 해석 : 
# Accuracy가 100%이므로 나쁘지 않다. 테스트 데이터가 약 36개이므로 총 34.6개 맞았다는 의미
# 단, 정확도는 데이터가 imbalanced이면 결과값의 신뢰도는 떨어진다. 따라서 오차 행렬도 같이 알아보겠다

1.0

In [81]:
# 6-2-2 confusion matrix 평가
confusion_matrix(y_test, y_pred_random_forest)

# 오차 행렬 해석

# Accuracy
# 전체 예측한 데이터 중에서 실제로 예측이 맞은 것(TP + TN)의 비율
# 위의 결과에 따라 100%
# 그러나 실제 클래스 별 표본의 개수가 서로 차이가 많이 나서 imbalanced한 데이터셋이므로 Accuracy의 결과값은 신뢰성이 없을 수 있으므로 F1-score 값을 확인해야 한다
# F1-Score을 알려면 정확도와 재현율을 알아야 함

# Recall
# 실제 클래스 0: 총 7개중 실제 class 0을 보여주고 올바르게 0이라고 예측한 경우(TP)가 7개 -> 100%
# 실제 클래스 1: 총 17개중 실제 class 1을 보여주고 올바르게 1이라고 예측한 경우(TP)가 17개 -> 100%
# 실제 클래스 2: 총 12개중 실제 class 2를 보여주고 올바르게 2이라고 예측한 경우(TP)가 12개 -> 100%
# 즉, 실제 각 양성클래스 중에서 제대로 양성이라고 예측한 것의 비율이 높다(재현율이 높다)

# Precision
# 예측 클래스 0: 총 7개중 양성 클래스 0에 속한다고 예측한 것 중에서 실제 0인 경우(TP)가 7 -> 100%
# 예측 클래스 1: 총 19개중 양성 클래스 1에 속한다고 예측한 것 중에서 실제 1인 경우(TP)가 17 -> 100%
# 예측 클래스 2: 총 12개중 양성 클래스 2에 속한다고 예측한 것 중에서 실제 2인 경우(TP)가 12 -> 100%
# 즉, 예측한 것 중에서 실제 양성으로 예측한 수의 비율이 높다(정확도가 높다)

# 결론
# Random Forest 모델의 f1-score의 단순평균(Macro)과 가중평균는 1.00 으로 정확도와 차이가 거의 없다.
# Accuracy도 괜찮고 F1-score도 괜찮다

array([[ 7,  0,  0],
       [ 0, 17,  0],
       [ 0,  0, 12]])

In [80]:
# 6-2-3 classification_report 평가
print(classification_report(y_test, y_pred_random_forest, target_names=target_names))

# 오차 행렬의 요약 버전
# 이미 위에서 설명했음

              precision    recall  f1-score   support

     class_0       1.00      1.00      1.00         7
     class_1       1.00      1.00      1.00        17
     class_2       1.00      1.00      1.00        12

    accuracy                           1.00        36
   macro avg       1.00      1.00      1.00        36
weighted avg       1.00      1.00      1.00        36



In [None]:
# 6-3. SVM 평가

In [82]:
# 6-3-1 Accuracy 평가
# 실제 정답 y_test과 예측값 y_pred 비교하여 정확도 측정하기
accuracy = accuracy_score(y_test, y_pred_svm_model)
accuracy

# 결과 해석 : 
# Accuracy가 61%이므로 나쁘다. 테스트 데이터가 약 36개이므로 총 22개 맞았다는 의미
# 단, 정확도는 데이터가 imbalanced이면 결과값의 신뢰도는 떨어진다. 따라서 오차 행렬도 같이 알아보겠다

0.6111111111111112

In [103]:
# 6-3-2 confusion matrix 평가
confusion_matrix(y_test, y_pred_svm_model)

# 오차 행렬 해석

# Accuracy
# 전체 예측한 데이터 중에서 실제로 예측이 맞은 것(TP + TN)의 비율
# 위의 결과에 따라 61%
# 그러나 실제 클래스 별 표본의 개수가 서로 차이가 많이 나서 imbalanced한 데이터셋이므로 Accuracy의 결과값은 신뢰성이 없을 수 있으므로 F1-score 값을 확인해야 한다
# F1-Score을 알려면 정확도와 재현율을 알아야 함

# Recall
# 실제 클래스 0: 총 7개중 실제 class 0을 보여주고 올바르게 0이라고 예측한 경우(TP)가 6개, 실제 class 0을 보여줬는데 class 2로 예측한 경우(FN) 1개 -> 86%
# 실제 클래스 1: 총 17개중 실제 class 1을 보여주고 올바르게 1이라고 예측한 경우(TP)가 15개, 
#             실제 class 1을 보여줬는데 class 0로 예측한 경우(FN) 1개, 실제 class 1을 보여줬는데 class 2로 예측한 경우(FN) 1개 -> 88%
# 실제 클래스 2: 총 12개중 실제 class 2를 보여주고 올바르게 2이라고 예측한 경우(TP)가 1개,
#             실제 class 1을 보여줬는데 class 1로 예측한 경우(FN) 11개 -> 8%
# 즉, 실제 각 양성클래스 중에서 제대로 양성이라고 예측한 것의 비율이 class 2에서 8%로 낮게 나왔다. 이런 경우 f1-score 조화평균값 확인 필요

# Precision
# 예측 클래스 0: 총 7개중 양성 클래스 0에 속한다고 예측한 것 중에서 실제 0인 경우(TP)가 6 -> 86%
# 예측 클래스 1: 총 19개중 양성 클래스 1에 속한다고 예측한 것 중에서 실제 1인 경우(TP)가 15 -> 58%
# 예측 클래스 2: 총 12개중 양성 클래스 2에 속한다고 예측한 것 중에서 실제 2인 경우(TP)가 11 -> 33%
# 즉, 예측한 것 중에서 실제 양성으로 예측한 수의 비율이 33%으로 낮게 나왔다. 이런 경우 f1-score 조화평균값 확인 필요

# 결론
# SV 모델의 f1-score의 단순평균(Macro)와 가중평균(Weighted Avg)는 0.56과. 0.54으로 정확도와 차이가 거의 없으며 전체 f1-score 평균이 낮으므로
# SVM 학습 모델은 적절치 않다


array([[ 6,  0,  1],
       [ 1, 15,  1],
       [ 0, 11,  1]])

In [85]:
# 6-3-3 classification_report 평가
print(classification_report(y_test, y_pred_svm_model, target_names=target_names))

# 오차 행렬의 요약 버전
# 이미 위에서 설명했음

              precision    recall  f1-score   support

     class_0       0.86      0.86      0.86         7
     class_1       0.58      0.88      0.70        17
     class_2       0.33      0.08      0.13        12

    accuracy                           0.61        36
   macro avg       0.59      0.61      0.56        36
weighted avg       0.55      0.61      0.54        36



In [None]:
# 6-4. SGD Classifier 평가

In [87]:
# 6-4-1 Accuracy 평가
# 실제 정답 y_test과 예측값 y_pred 비교하여 정확도 측정하기
accuracy = accuracy_score(y_test, y_pred_sgd_model)
accuracy

# 결과 해석 : 
# Accuracy가 47.2%이므로 나쁘지 않다. 테스트 데이터가 약 36개이므로 총 34개 맞았다는 의미
# 단, 정확도는 데이터가 imbalanced이면 결과값의 신뢰도는 떨어진다. 따라서 오차 행렬도 같이 알아보겠다

0.4722222222222222

In [104]:
# 6-4-2 confusion matrix 평가
confusion_matrix(y_test, y_pred_sgd_model)

# 오차 행렬 해석

# Accuracy
# 전체 예측한 데이터 중에서 실제로 예측이 맞은 것(TP + TN)의 비율
# 위의 결과에 따라 47.2%
# 그러나 실제 클래스 별 표본의 개수가 서로 차이가 많이 나서 imbalanced한 데이터셋이므로 Accuracy의 결과값은 신뢰성이 없을 수 있으므로 F1-score 값을 확인해야 한다
# F1-Score을 알려면 정확도와 재현율을 알아야 함

# Recall
# 실제 클래스 0: 총 7개중 실제 class 0을 보여주고 올바르게 0이라고 예측한 경우(TP)가 7개 -> 100%
# 실제 클래스 1: 총 17개중 실제 class 1을 보여주고 올바르게 1이라고 예측한 경우(TP)가 10개, 
#             실제 class 1을 보여줬는데 class 0로 예측한 경우(FN) 7개 -> 59%
# 실제 클래스 2: 총 12개중 실제 class 2를 보여주고 올바르게 2이라고 예측한 경우(TP)가 0개,
#             실제 class 2을 보여줬는데 class 0로 예측한 경우(FN) 11개, 실제 class 2을 보여줬는데 class 1로 예측한 경우(FN) 1개 -> 0%
# 즉, 실제 각 양성클래스 중에서 제대로 양성이라고 예측한 것의 비율이 class 2에서 0%으로 도출됨. 이런 경우 f1-score 조화평균값으로 더 알아봄

# Precision
# 예측 클래스 0: 총 25개중 양성 클래스 0에 속한다고 예측한 것 중에서 실제 0인 경우(TP)가 7개 -> 28%
# 예측 클래스 1: 총 11개중 양성 클래스 1에 속한다고 예측한 것 중에서 실제 1인 경우(TP)가 10개 -> 91%
# 예측 클래스 2: 총 0개중 양성 클래스 2에 속한다고 예측한 것 중에서 실제 2인 경우(TP)가 0개 -> 0%
# 즉, 예측한 것 중에서 실제 양성으로 예측한 수의 비율이 class 2에서 낮게 나왔다. 이런 경우 f1-score 조화평균값으로 더 알아봄

# 결론
# SGD 모델의 f1-score의 단순평균(Macro)과 가중평균(weighted avg)는 0.38과 0.42로 너무 낮다. class 2에서 정밀도와 재현율의 TP가 0이게 되어
# 둘 다 0%으로 나왔고 조화평균인 f1-score도 값이 0이 되었다(zerodivision 0이 되므로 인자에서 warning을 수정함)
# 따라서 SGD 평가도 사용할 수 없다

array([[ 7,  0,  0],
       [ 7, 10,  0],
       [11,  1,  0]])

In [95]:
# 6-4-3 classification_reprot 평가
print(classification_report(y_test, y_pred_sgd_model, target_names=target_names, zero_division=0))

# 오차 행렬의 요약 버전
# 이미 위에서 설명했음

              precision    recall  f1-score   support

     class_0       0.28      1.00      0.44         7
     class_1       0.91      0.59      0.71        17
     class_2       0.00      0.00      0.00        12

    accuracy                           0.47        36
   macro avg       0.40      0.53      0.38        36
weighted avg       0.48      0.47      0.42        36



In [90]:
# 6-5. Logistic Regression 평가

In [105]:
# 6-5-1 Accuracy 평가
# 실제 정답 y_test과 예측값 y_pred 비교하여 정확도 측정하기
accuracy = accuracy_score(y_test, y_pred_logistic_model)
accuracy

# 결과 해석 : 
# Accuracy가 97.2%이므로 나쁘지 않다. 테스트 데이터가 약 36개이므로 총 35개 맞았다는 의미
# 단, 정확도는 데이터가 imbalanced이면 결과값의 신뢰도는 떨어진다. 따라서 오차 행렬도 같이 알아보겠다

0.9722222222222222

In [106]:
# 6-5-2 confusion matrix 평가
confusion_matrix(y_test, y_pred_logistic_model)

# 오차 행렬 해석

# Accuracy
# 전체 예측한 데이터 중에서 실제로 예측이 맞은 것(TP + TN)의 비율
# 위의 결과에 따라 97.2%
# 그러나 실제 클래스 별 표본의 개수가 서로 차이가 많이 나서 imbalanced한 데이터셋이므로 Accuracy의 결과값은 신뢰성이 없을 수 있으므로 F1-score 값을 확인해야 한다
# F1-Score을 알려면 정확도와 재현율을 알아야 함

# Recall
# 실제 클래스 0: 총 7개중 실제 class 0을 보여주고 올바르게 0이라고 예측한 경우(TP)가 7개 -> 100%
# 실제 클래스 1: 총 17개중 실제 class 1을 보여주고 올바르게 1이라고 예측한 경우(TP)가 17개 -> 100%
# 실제 클래스 2: 총 12개중 실제 class 2를 보여주고 올바르게 2이라고 예측한 경우(TP)가 11개,
#             실제 class 2을 보여줬는데 class 1로 예측한 경우(FN) 1개 -> 92%
# 즉, 실제 각 양성클래스 중에서 제대로 양성이라고 예측한 것의 비율이 높다(재현율이 높다)

# Precision
# 예측 클래스 0: 총 7개중 양성 클래스 0에 속한다고 예측한 것 중에서 실제 0인 경우(TP)가 7개 -> 100%
# 예측 클래스 1: 총 18개중 양성 클래스 1에 속한다고 예측한 것 중에서 실제 1인 경우(TP)가 17개 -> 94%
# 예측 클래스 2: 총 11개중 양성 클래스 2에 속한다고 예측한 것 중에서 실제 2인 경우(TP)가 11개 -> 100%
# 즉, 예측한 것 중에서 실제 양성으로 예측한 수의 비율이 class 2에서 낮게 나왔다. 이런 경우 f1-score 조화평균값으로 더 알아봄

# 결론
# Logistic Regression 모델의 f1-score의 단순평균(Macro)과 가중평균(weighted avg)는 0.98과 0.97으로 정확도와 차이가 거의 없다.
# Accuracy도 괜찮고 F1-score도 괜찮다

array([[ 7,  0,  0],
       [ 0, 17,  0],
       [ 0,  1, 11]])

In [107]:
# 6-5-3 classification_report 평가
print(classification_report(y_test, y_pred_logistic_model, target_names=target_names))

# 오차 행렬의 요약 버전
# 이미 위에서 설명했음

              precision    recall  f1-score   support

     class_0       1.00      1.00      1.00         7
     class_1       0.94      1.00      0.97        17
     class_2       1.00      0.92      0.96        12

    accuracy                           0.97        36
   macro avg       0.98      0.97      0.98        36
weighted avg       0.97      0.97      0.97        36



In [108]:
# 최종 결과 해석
# 어떤 모델이 가장 좋은 성능을 보이는가? 
# -> Random Forest 모델
# 모델 성능 평가 지표로 무엇으로 설정하겠는가?
# -> Random Forest 모델의 평가가 정확도가 높고 데이터셋의 각 클래스마다 데이터들이 balanced하다. 따라서 정확도만으로도 평가해도 좋지만 추가적으로 오차행렬을
#    진행했는데 그중에서 F1-Score 점수가 1.00으로 다른 모델에 비해 가장 높았으므로 최종 모델을 Random Forest으로 선정함
# sklearn.metrics에서 제공하는 평가지표 선정하고 선택한 이유?
# -> classification_report와 confusion_matrix을 선택했고, 그 이유는 오차행렬을 알면 정확도, 재현율, 정밀도, 가중조화평균, 단순평균, 가중평균을 구할 수 있기 때문

In [111]:
# 회고

'''
1. 이번 프로젝트에서 어려웠던 점
    앞의 프로젝트와 마찬가지로 데이터를 해석하는데 어려움이 있었다. 또한 SGD 학습 모델 성능 평가에서 class 2의 정밀도와 재현율이 0%가 되어 f1-score
    도 0이 되었다. 이 경우 sklearn에서 zerodivision을 0으로 설정해서 에러는 없앴지만 이렇게 하는 것이 맞는지 모르겠다
    
2. 프로젝트를 진행하면서 알아낸 점 혹은 아직 모호한 점
    평가 모델의 정확한 의미와 해석하는 방법. 그리고 제로디비전을 처리하는 방법이 맞았는지 모르겠음
    
3. 루브릭 평가 지표를 맞추기 위해 시도한 것들
   1) wines 데이터셋의 관련 메서드를 모두 출력해보고 속성과 타켓/클래스 이름 등 각각이 무엇을 의미하는지 확인해보았습니다.
      feature은 총 13개며 클래스는 class 0 ~ 2까지가 있었습니다
   2) 5가지 모델에 전부 학습 시키고 그 결과를 비교하여 최종 모델을 선정하였습니다
   3) 평가 지표 선택 이유와 그 근거를 위에 기술함
    
4. 만약에 루브릭 평가 관련 지표를 달성 하지 못했을 때, 이유에 관한 추정
    달성 완료함
    
5. 자기 다짐
    같은 내용 반복이라 처음 데이터 성능 평가보다는 빠르게 했지만 그래도 데이터 해석하고 결론을 도출하는데 이해도가 아직 떨어진다. 조금 더 알아봐야겠다
    
'''

'\n1. 이번 프로젝트에서 어려웠던 점\n    앞의 프로젝트와 마찬가지로 데이터를 해석하는데 어려움이 있었다. 또한 SGD 학습 모델 성능 평가에서 class 2의 정밀도와 재현율이 0%가 되어 f1-score\n    도 0이 되었다. 이 경우 sklearn에서 zerodivision을 0으로 설정해서 에러는 없앴지만 이렇게 하는 것이 맞는지 모르겠다\n    \n2. 프로젝트를 진행하면서 알아낸 점 혹은 아직 모호한 점\n    평가 모델의 정확한 의미와 해석하는 방법. 그리고 제로디비전을 처리하는 방법이 맞았는지 모르겠음\n    \n3. 루브릭 평가 지표를 맞추기 위해 시도한 것들\n    이번 평가에는 루브릭 평가가 없었음\n    \n4. 만약에 루브릭 평가 관련 지표를 달성 하지 못했을 때, 이유에 관한 추정\n    이번 평가에는 루브릭 평가가 없었음\n    \n5. 자기 다짐\n    같은 내용 반복이라 처음 데이터 성능 평가보다는 빠르게 했지만 그래도 데이터 해석하고 결론을 도출하는데 이해도가 아직 떨어진다. 조금 더 알아봐야겠다\n    \n'