In [35]:
import sklearn
sklearn.__version__

'1.2.2'

## (1) 필요한 모듈 import하기

In [36]:
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report

## (2) 데이터 준비
load_digits 메서드를 사용합니다.

In [37]:
data = load_digits()

dir(data)

['DESCR', 'data', 'feature_names', 'frame', 'images', 'target', 'target_names']

## (3) 데이터 이해하기
지피지기면 백전불태! 다루어야 할 데이터를 자세히 살펴봅시다.

- Feature Data 지정하기
- Label Data 지정하기
- Target Names 출력해 보기
- 데이터 Describe 해 보기

In [38]:
import pandas as pd

feature_data = data.data
label_data = data.target

feature_data.shape, label_data.shape

((1797, 64), (1797,))

In [39]:
data.target_names

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [40]:
print(data.DESCR)

.. _digits_dataset:

Optical recognition of handwritten digits dataset
--------------------------------------------------

**Data Set Characteristics:**

    :Number of Instances: 1797
    :Number of Attributes: 64
    :Attribute Information: 8x8 image of integer pixels in the range 0..16.
    :Missing Attribute Values: None
    :Creator: E. Alpaydin (alpaydin '@' boun.edu.tr)
    :Date: July; 1998

This is a copy of the test set of the UCI ML hand-written digits datasets
https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits

The data set contains images of hand-written digits: 10 classes where
each class refers to a digit.

Preprocessing programs made available by NIST were used to extract
normalized bitmaps of handwritten digits from a preprinted form. From a
total of 43 people, 30 contributed to the training set and different 13
to the test set. 32x32 bitmaps are divided into nonoverlapping blocks of
4x4 and the number of on pixels are counted in each blo

## (4) train, test 데이터 분리
모델 학습과 테스트용 문제지와 정답지를 준비해 봅시다.  
X_train, X_test, y_train, y_test를 생성하는 방법을 참고해 보세요.


In [41]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(feature_data, label_data,
                                                    test_size=0.2, stratify=label_data,
                                                    random_state=42)

X_train.shape, X_test.shape, y_train.shape, y_test.shape

((1437, 64), (360, 64), (1437,), (360,))

## (5) 다양한 모델로 학습시켜보기
학습데이터 X_train, y_train 을 활용해 분류기 모델을 만들어 봅시다. 어떤 모델이 가장 좋은 성능을 보일까요?

- Decision Tree 사용해 보기
- Random Forest 사용해 보기
- SVM 사용해 보기
- SGD Classifier 사용해 보기
- Logistic Regression 사용해 보기

In [42]:
from sklearn.tree import DecisionTreeClassifier

# 학습
DecisionTreeClassifier_model = DecisionTreeClassifier()
DecisionTreeClassifier_model.fit(X_train, y_train)

# 평가
y_pred = DecisionTreeClassifier_model.predict(X_test)
print(classification_report(y_test, y_pred))

              precision    recall  f1-score   support

           0       0.94      0.94      0.94        36
           1       0.78      0.69      0.74        36
           2       0.79      0.86      0.82        35
           3       0.82      0.89      0.86        37
           4       0.89      0.89      0.89        36
           5       0.85      0.95      0.90        37
           6       0.97      0.86      0.91        36
           7       0.80      0.89      0.84        36
           8       0.74      0.71      0.72        35
           9       0.84      0.72      0.78        36

    accuracy                           0.84       360
   macro avg       0.84      0.84      0.84       360
weighted avg       0.84      0.84      0.84       360



In [43]:
from sklearn.ensemble import RandomForestClassifier

# 학습
RandomForestClassifier_model = RandomForestClassifier()
RandomForestClassifier_model.fit(X_train, y_train)

# 평가
y_pred = RandomForestClassifier_model.predict(X_test)
print(classification_report(y_test, y_pred))

              precision    recall  f1-score   support

           0       1.00      0.97      0.99        36
           1       0.90      1.00      0.95        36
           2       1.00      1.00      1.00        35
           3       0.97      1.00      0.99        37
           4       0.97      1.00      0.99        36
           5       1.00      1.00      1.00        37
           6       1.00      0.94      0.97        36
           7       0.97      1.00      0.99        36
           8       0.91      0.89      0.90        35
           9       1.00      0.92      0.96        36

    accuracy                           0.97       360
   macro avg       0.97      0.97      0.97       360
weighted avg       0.97      0.97      0.97       360



In [61]:
from sklearn.svm import SVC

# 학습
SVC_model = SVC(probability=True)
SVC_model.fit(X_train, y_train)

# 평가
y_pred = SVC_model.predict(X_test)
print(classification_report(y_test, y_pred))

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        36
           1       0.95      1.00      0.97        36
           2       1.00      1.00      1.00        35
           3       1.00      1.00      1.00        37
           4       1.00      1.00      1.00        36
           5       1.00      1.00      1.00        37
           6       1.00      1.00      1.00        36
           7       0.97      1.00      0.99        36
           8       1.00      0.94      0.97        35
           9       1.00      0.97      0.99        36

    accuracy                           0.99       360
   macro avg       0.99      0.99      0.99       360
weighted avg       0.99      0.99      0.99       360



In [45]:
from sklearn.linear_model import SGDClassifier

# 학습
SGDClassifier_model = SGDClassifier()
SGDClassifier_model.fit(X_train, y_train)

# 평가
y_pred = SGDClassifier_model.predict(X_test)
print(classification_report(y_test, y_pred))

              precision    recall  f1-score   support

           0       1.00      0.97      0.99        36
           1       0.92      0.92      0.92        36
           2       1.00      1.00      1.00        35
           3       1.00      0.92      0.96        37
           4       0.95      1.00      0.97        36
           5       0.88      1.00      0.94        37
           6       0.97      0.97      0.97        36
           7       0.97      0.97      0.97        36
           8       0.94      0.91      0.93        35
           9       1.00      0.94      0.97        36

    accuracy                           0.96       360
   macro avg       0.96      0.96      0.96       360
weighted avg       0.96      0.96      0.96       360



In [46]:
from sklearn.linear_model import LogisticRegression

# 학습
LogisticRegression_model = LogisticRegression()
LogisticRegression_model.fit(X_train, y_train)

# 평가
y_pred = LogisticRegression_model.predict(X_test)
print(classification_report(y_test, y_pred))

              precision    recall  f1-score   support

           0       1.00      0.97      0.99        36
           1       0.89      0.89      0.89        36
           2       0.97      1.00      0.99        35
           3       0.95      1.00      0.97        37
           4       0.95      1.00      0.97        36
           5       0.97      0.97      0.97        37
           6       1.00      0.97      0.99        36
           7       1.00      0.97      0.99        36
           8       0.86      0.86      0.86        35
           9       1.00      0.94      0.97        36

    accuracy                           0.96       360
   macro avg       0.96      0.96      0.96       360
weighted avg       0.96      0.96      0.96       360



STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


- `DecisionTree`를 제외한 다른 모델들은 대부분 성능이 매우 높게 나왔다.
- 그 중에서도 `SVC`가 평균 성능이 가장 높게 나왔다.

## (6) 모델을 평가해 보기
학습된 모델들의 테스트데이터 예측 결과를 어떻게 해석해야 할까요? 모델의 성능을 평가하는 지표로는 무엇이 좋을까요?  
sklearn.metrics 에서 제공하는 평가지표 중 적절한 것을 선택해 보세요. 선택하신 이유도 설명해 주세요.

- 지표 선택 시 모델을 어느 용도로 사용하냐가 가장 중요한 요소가 될 것이다.
  - 클래스 간 데이터 불균형이 없어 단순 모델 성능 측정이라면 F1 지표를 사용하는 편이 적당할 것이다.
  - 숫자를 잘못 예측하는 것이 서비스에 큰 문제가 되는 경우 Precision 지표를 사용하는게 좋을 것이다.


In [67]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score

y_pred = SVC_model.predict(X_test)
y_pred_proba = SVC_model.predict_proba(X_test)

print(f"Accuracy Score: {accuracy_score(y_test, y_pred)}")
print(f"Precision Score: {precision_score(y_test, y_pred, average='weighted')}")
print(f"Recall Score: {recall_score(y_test, y_pred, average='weighted')}")
print(f"F1 Score: {f1_score(y_test, y_pred, average='weighted')}")
print(f"ROC AUC Score: {roc_auc_score(y_test, y_pred_proba, multi_class='ovo')}")

Accuracy Score: 0.9916666666666667
Precision Score: 0.9920341394025605
Recall Score: 0.9916666666666667
F1 Score: 0.9916595064551902
ROC AUC Score: 0.9999296982167352
