# 分類の予測モデル作成

In [3]:
from sklearn.datasets import load_iris
# Irisデータセットを読み込む
iris = load_iris()
X, y = iris.data, iris.target
# 先頭5行を表示
print('X:')
print(X[:5, :])
print('y:')
print(y[:5])

X:
[[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]
 [4.7 3.2 1.3 0.2]
 [4.6 3.1 1.5 0.2]
 [5.  3.6 1.4 0.2]]
y:
[0 0 0 0 0]


In [4]:
# Inputを学習データとテストデータに分割
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
print(X_train.shape)
print(X_test.shape)
print(y_train.shape)
print(y_test.shape)

(105, 4)
(45, 4)
(105,)
(45,)


## 決定木 (Decision Tree)

In [5]:
from sklearn.tree import DecisionTreeClassifier
# 決定木をインスタンス化する (気の最大の深さ3)
tree = DecisionTreeClassifier(max_depth=3)
# 学習
tree.fit(X_train, y_train)

DecisionTreeClassifier(class_weight=None, criterion='gini', max_depth=3,
            max_features=None, max_leaf_nodes=None,
            min_impurity_decrease=0.0, min_impurity_split=None,
            min_samples_leaf=1, min_samples_split=2,
            min_weight_fraction_leaf=0.0, presort=False, random_state=None,
            splitter='best')

In [6]:
# 予測
y_pred = tree.predict(X_test)
y_pred

array([0, 0, 2, 2, 2, 2, 2, 0, 2, 2, 0, 2, 0, 1, 1, 2, 2, 0, 0, 2, 1, 1,
       2, 0, 0, 1, 0, 0, 2, 1, 1, 0, 0, 0, 1, 1, 2, 2, 2, 1, 2, 0, 1, 1,
       2])

## ランダムフォレスト

In [7]:
from sklearn.ensemble import RandomForestClassifier
# ランダムフォレストをインスタンス化する
forest = RandomForestClassifier(n_estimators=100)
# 学習
forest.fit(X_train, y_train)
# 予測
y_pred = forest.predict(X_test)
y_pred

array([0, 0, 2, 2, 2, 2, 2, 0, 2, 2, 0, 2, 0, 1, 1, 2, 1, 0, 0, 2, 1, 1,
       2, 0, 0, 1, 0, 0, 2, 1, 1, 0, 0, 0, 1, 1, 2, 2, 2, 1, 2, 0, 1, 1,
       2])

## サポートベクターマシン

In [8]:
from sklearn.datasets import load_iris
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split

# Irisデータセットの読み込み
iris = load_iris()
X, y = iris.data[:100, :], iris.target[:100]

# 学習データセットとテストデータセットに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# SVMのインスタンス化
svc = SVC(gamma='scale')

# SVMで学習
svc.fit(X_train, y_train)

# テストデータセットの予測
y_pred = svc.predict(X_test)

### 予測結果の精度を評価

In [11]:
from sklearn.metrics import classification_report
# 適合率、再現率、F値を出力
print(classification_report(y_test, y_pred))

              precision    recall  f1-score   support

           0       1.00      1.00      1.00        16
           1       1.00      1.00      1.00        14

   micro avg       1.00      1.00      1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30



In [13]:
# 交差検証 = クロスバリデーション
# モデルの構築と評価を複数回実行する
from sklearn.model_selection import cross_val_score
# 10分割の交差検証を実行
svc = SVC(gamma='scale')
cross_val_score(svc, X, y, cv=10, scoring='precision')

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])