In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import warnings
from sklearn.utils.testing import all_estimators

iris_data = pd.read_csv("iris.csv", encoding="utf-8")

y = iris_data.loc[:, "Name"]
x = iris_data.loc[:, ["SepalLength", "SepalWidth", "PetalLength", "PetalWidth"]]

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, train_size=0.8, shuffle=True)

# get all classifier algorithms
warnings.filterwarnings('ignore')
allAlgorithms = all_estimators(type_filter="classifier")

for (name, algorithm) in allAlgorithms:
    # create algoriths object
    clf = algorithm()
    
    # learn & evaluate
    clf.fit(x_train, y_train)
    y_pred = clf.predict(x_test)
    print(name, "の正解率 = ", accuracy_score(y_test, y_pred))

AdaBoostClassifier の正解率 =  0.9333333333333333
BaggingClassifier の正解率 =  0.8666666666666667
BernoulliNB の正解率 =  0.26666666666666666
CalibratedClassifierCV の正解率 =  0.9
ComplementNB の正解率 =  0.6333333333333333
DecisionTreeClassifier の正解率 =  0.8666666666666667
ExtraTreeClassifier の正解率 =  0.9333333333333333
ExtraTreesClassifier の正解率 =  0.8666666666666667
GaussianNB の正解率 =  0.9333333333333333
GaussianProcessClassifier の正解率 =  0.8666666666666667
GradientBoostingClassifier の正解率 =  0.8666666666666667
KNeighborsClassifier の正解率 =  0.9333333333333333
LabelPropagation の正解率 =  0.9666666666666667
LabelSpreading の正解率 =  0.9666666666666667
LinearDiscriminantAnalysis の正解率 =  1.0
LinearSVC の正解率 =  1.0
LogisticRegression の正解率 =  0.9666666666666667
LogisticRegressionCV の正解率 =  0.8333333333333334
MLPClassifier の正解率 =  1.0
MultinomialNB の正解率 =  0.9
NearestCentroid の正解率 =  0.8333333333333334
NuSVC の正解率 =  0.8666666666666667
PassiveAggressiveClassifier の正解率 =  0.7333333333333333
Perceptron の正解率 =  0.63333333333

In [6]:
import pandas as pd
from sklearn.utils.testing import all_estimators
from sklearn.model_selection import KFold
import warnings
from sklearn.model_selection import cross_val_score

iris_data = pd.read_csv("iris.csv", encoding="utf-8")

y = iris_data.loc[:, "Name"]
x = iris_data.loc[:, ["SepalLength", "SepalWidth", "PetalLength", "PetalWidth"]]

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, train_size=0.8, shuffle=True)

# get all classifier algorithms
warnings.filterwarnings('ignore')
allAlgorithms = all_estimators(type_filter="classifier")

# cross validation 5 times
kfold_cv = KFold(n_splits=5, shuffle=True)

for (name, algorithm) in allAlgorithms:
    # create algoriths object
    clf = algorithm()
    
    if hasattr(clf, "score"):
        scores = cross_val_score(clf, x, y, cv=kfold_cv)
        print(name, "の正解率 = ")
        print(scores)

AdaBoostClassifier の正解率 = 
[0.9        1.         0.9        0.86666667 0.93333333]
BaggingClassifier の正解率 = 
[0.96666667 0.96666667 0.9        0.9        0.96666667]
BernoulliNB の正解率 = 
[0.3        0.26666667 0.3        0.26666667 0.3       ]
CalibratedClassifierCV の正解率 = 
[0.93333333 0.96666667 0.8        0.96666667 0.96666667]
ComplementNB の正解率 = 
[0.66666667 0.63333333 0.76666667 0.66666667 0.6       ]
DecisionTreeClassifier の正解率 = 
[0.96666667 0.93333333 0.96666667 0.96666667 1.        ]
ExtraTreeClassifier の正解率 = 
[1.         0.93333333 0.93333333 0.83333333 0.93333333]
ExtraTreesClassifier の正解率 = 
[0.96666667 0.93333333 0.96666667 0.93333333 1.        ]
GaussianNB の正解率 = 
[0.93333333 0.93333333 0.96666667 0.93333333 1.        ]
GaussianProcessClassifier の正解率 = 
[0.93333333 0.96666667 0.93333333 1.         0.96666667]
GradientBoostingClassifier の正解率 = 
[0.93333333 0.9        0.96666667 0.96666667 0.93333333]
KNeighborsClassifier の正解率 = 
[0.96666667 1.         0.96666667 1.       

In [12]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.model_selection import KFold
from sklearn.model_selection import GridSearchCV

iris_data = pd.read_csv("iris.csv", encoding="utf-8")
y = iris_data.loc[:, "Name"]
x = iris_data.loc[:, ["SepalLength", "SepalWidth", "PetalLength", "PetalWidth"]]

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, train_size=0.8, shuffle=True)

parameters = [
    {"C": [1, 10, 100, 1000], "kernel": ["linear"]},
    {"C": [1, 10, 100, 1000], "kernel": ["rbf"], "gamma": [0.001, 0.0001]},
    {"C": [1, 10, 100, 1000], "kernel": ["sigmoid"], "gamma": [0.001, 0.0001]}
]

kfold_cv = KFold(n_splits=5, shuffle=True)
clf = GridSearchCV(SVC(), parameters, cv=kfold_cv)
clf.fit(x_train, y_train)
print("最適なパラメータ = ", clf.best_estimator_)

y_pred = clf.predict(x_test)
print("評価時の正解率 = ", accuracy_score(y_test, y_pred))

最適なパラメータ =  SVC(C=1000, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma=0.001, kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)
評価時の正解率 =  1.0
