### アルゴリズムの正解率を比較

In [3]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import warnings
from sklearn.utils.testing import all_estimators

# アヤメデータの読み込み
iris_data = pd.read_csv("iris.csv", encoding="utf-8")

# アヤメデータをラベルと入力データに分離
y = iris_data.loc[:,"Name"]
x = iris_data.loc[:,["SepalLength","SepalWidth","PetalLength","PetalWidth"]]

# 学習用とテスト用に分離
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2, train_size = 0.8, shuffle = True)

# 「将来変更される予定であることを示す警告」　非表示
warnings.filterwarnings("ignore")

# classiffierのアルゴリズムをすべて取得
allAlgorithms = all_estimators(type_filter="classifier")

for(name, algorithm) in allAlgorithms:

    try:
        # 各アルゴリズムのオブジェクトを作成
        clf = algorithm()

        # 学習、評価
        clf.fit(x_train, y_train)
        y_pred = clf.predict(x_test)
        print(name,"正解率 = ", accuracy_score(y_test, y_pred))
    except:
        print("error", algorithm)

AdaBoostClassifier 正解率 =  0.9666666666666667
BaggingClassifier 正解率 =  0.9666666666666667
BernoulliNB 正解率 =  0.26666666666666666
CalibratedClassifierCV 正解率 =  0.9666666666666667
CategoricalNB 正解率 =  0.9
error <class 'sklearn.utils._mocking.CheckingClassifier'>
error <class 'sklearn.multioutput.ClassifierChain'>
ComplementNB 正解率 =  0.7333333333333333
DecisionTreeClassifier 正解率 =  0.9666666666666667
DummyClassifier 正解率 =  0.26666666666666666
ExtraTreeClassifier 正解率 =  0.9666666666666667
ExtraTreesClassifier 正解率 =  0.9666666666666667
GaussianNB 正解率 =  0.9666666666666667
GaussianProcessClassifier 正解率 =  0.9666666666666667
GradientBoostingClassifier 正解率 =  0.9666666666666667
HistGradientBoostingClassifier 正解率 =  0.9666666666666667
KNeighborsClassifier 正解率 =  1.0
LabelPropagation 正解率 =  0.9666666666666667
LabelSpreading 正解率 =  0.9666666666666667
LinearDiscriminantAnalysis 正解率 =  0.9666666666666667
LinearSVC 正解率 =  0.9666666666666667
LogisticRegression 正解率 =  0.9666666666666667
LogisticRegress

### クロスバリデーション

In [8]:
# K分割クロスバリデーション
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score

# K分割クロスバリデーション用オブジェクト
kfold_cv = KFold(n_splits=5, shuffle=True)

for(name, algorithm) in allAlgorithms:

    try:
        # 各アルゴリズムのオブジェクトを作成
        clf = algorithm()
        
        # scoreメソッドを持つクラスを対象とする
        if hasattr(clf,"score"):
            # 学習、評価
            scores = cross_val_score(clf, x, y, cv=kfold_cv)
            print(name,"正解率 = ")
            print(scores)
    except:
        print("error", algorithm)

AdaBoostClassifier 正解率 = 
[1.         0.93333333 0.93333333 0.96666667 0.86666667]
BaggingClassifier 正解率 = 
[0.96666667 0.9        1.         0.96666667 0.96666667]
BernoulliNB 正解率 = 
[0.23333333 0.3        0.2        0.3        0.26666667]
CalibratedClassifierCV 正解率 = 
[0.96666667 0.93333333 0.8        0.93333333 0.96666667]
CategoricalNB 正解率 = 
[1.         0.93333333 0.86666667 0.9        0.93333333]
CheckingClassifier 正解率 = 
[nan nan nan nan nan]
error <class 'sklearn.multioutput.ClassifierChain'>
ComplementNB 正解率 = 
[0.63333333 0.6        0.8        0.66666667 0.63333333]
DecisionTreeClassifier 正解率 = 
[0.9        0.9        1.         0.96666667 0.93333333]
DummyClassifier 正解率 = 
[0.23333333 0.33333333 0.36666667 0.4        0.33333333]
ExtraTreeClassifier 正解率 = 
[0.83333333 1.         0.86666667 0.93333333 0.93333333]
ExtraTreesClassifier 正解率 = 
[0.9        1.         0.96666667 0.96666667 0.93333333]
GaussianNB 正解率 = 
[0.93333333 0.96666667 1.         0.96666667 0.9       ]
Gaussi