### Sklearn 모델 추천 함수 활용
---
-sklearn.utils 모듈의 all_estimators(type_filter)
    * type_filter 파라미터 : 'classifier' , 'regressor' 지정
    * 반환 : 해당 타입의 모델 리스트 => 모델이름, 모델 객체

In [9]:
# 모듈 로딩 ------------------------
from sklearn.utils import all_estimators
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import numpy as np

### [1] 데이터 로딩 및 확인

In [10]:
# 아무것도 설정하지 않으면 Bunch 데이터 타입 => dict와 유사한 형태
data = load_iris()

In [11]:
data.keys()

dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename', 'data_module'])

In [12]:
# data, target ==> numpy 타입
# target_names ==> 라벨 ==> setosa, versicolor, ..
# feature_names ==> 컬럼명
input_data = data['data']
input_target = data['target']

### [2]학습 데이터 분리

In [13]:
# 학습 - 테스트 데이터 셋 80:20
train_X, test_X, train_y, test_y = train_test_split(input_data,
                                                   input_target,
                                                   test_size=0.2)

In [29]:
# 학습 - 검증용 데이터 셋 80:20
train_X, val_X, train_y, val_y = train_test_split(train_X,
                                                   train_y,
                                                   test_size=0.2)

### [3] 학습
---
- 학습방법 선정 => 분류 / 회귀
    * 분류 => knn, LogisticRegression, DecisionTreeClassifier,SGDClassifier, SVC...
    * 분류 모델 적용 후 결과 => all_estimators()

In [18]:
# 필터 타입에 해당하는 sklearn에 존재하는 모든 모델 이름과 객체 리스트로 반환
models = all_estimators(type_filter='classifier')

In [17]:
models

[('AdaBoostClassifier', sklearn.ensemble._weight_boosting.AdaBoostClassifier),
 ('BaggingClassifier', sklearn.ensemble._bagging.BaggingClassifier),
 ('BernoulliNB', sklearn.naive_bayes.BernoulliNB),
 ('CalibratedClassifierCV', sklearn.calibration.CalibratedClassifierCV),
 ('CategoricalNB', sklearn.naive_bayes.CategoricalNB),
 ('ClassifierChain', sklearn.multioutput.ClassifierChain),
 ('ComplementNB', sklearn.naive_bayes.ComplementNB),
 ('DecisionTreeClassifier', sklearn.tree._classes.DecisionTreeClassifier),
 ('DummyClassifier', sklearn.dummy.DummyClassifier),
 ('ExtraTreeClassifier', sklearn.tree._classes.ExtraTreeClassifier),
 ('ExtraTreesClassifier', sklearn.ensemble._forest.ExtraTreesClassifier),
 ('GaussianNB', sklearn.naive_bayes.GaussianNB),
 ('GaussianProcessClassifier',
  sklearn.gaussian_process._gpc.GaussianProcessClassifier),
 ('GradientBoostingClassifier',
  sklearn.ensemble._gb.GradientBoostingClassifier),
 ('HistGradientBoostingClassifier',
  sklearn.ensemble._hist_gradi

In [26]:
# names = []
# scores = []
# for name, model in models:
#     try:
#         # 모델 객체 생성
#         md=model()
#         # 학습
#         md.fit(train_X, train_y)
#         # 평가
#         result=md.score(test_X, test_y)
#         names.append((name))
#         scores.append((result))
#     except:
#         pass

In [27]:
scores = []
for name, model in models:
    try:
        # 모델 객체 생성
        md=model()
        # 학습
        md.fit(train_X, train_y)
        # 평가
        result=md.score(test_X, test_y)
        scores.append((name, result))
    except:
        pass

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

In [28]:
scores

[('AdaBoostClassifier', 0.9),
 ('BaggingClassifier', 0.9333333333333333),
 ('BernoulliNB', 0.26666666666666666),
 ('CalibratedClassifierCV', 0.8666666666666667),
 ('CategoricalNB', 0.8666666666666667),
 ('ComplementNB', 0.5666666666666667),
 ('DecisionTreeClassifier', 0.9333333333333333),
 ('DummyClassifier', 0.26666666666666666),
 ('ExtraTreeClassifier', 0.9333333333333333),
 ('ExtraTreesClassifier', 0.9333333333333333),
 ('GaussianNB', 0.9666666666666667),
 ('GaussianProcessClassifier', 0.9333333333333333),
 ('GradientBoostingClassifier', 0.9333333333333333),
 ('HistGradientBoostingClassifier', 0.9333333333333333),
 ('KNeighborsClassifier', 0.9666666666666667),
 ('LabelPropagation', 0.9666666666666667),
 ('LabelSpreading', 0.9666666666666667),
 ('LinearDiscriminantAnalysis', 0.9666666666666667),
 ('LinearSVC', 0.9333333333333333),
 ('LogisticRegression', 0.9333333333333333),
 ('LogisticRegressionCV', 0.9666666666666667),
 ('MLPClassifier', 0.9333333333333333),
 ('MultinomialNB', 0.63