In [6]:
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

iris = datasets.load_iris()  # 鸢尾花数据集
iris_X = iris.data  # 特征
iris_Y = iris.target  # 标签
X_train, X_test, Y_train, Y_test = train_test_split(iris_X, iris_Y, test_size=0.3)  # 随机取70%数据作为训练，30%作为测试

knn = KNeighborsClassifier()  # K近邻(K-Nearest Neighbor)分类器
knn.fit(X_train, Y_train)  # 进行分类
Y_predict = knn.predict(X_test)
print(Y_predict)  # 预测值
print(Y_test)   # 真实值
print(knn.score(X_train, Y_train))  # 正确率

[0 2 1 0 2 2 2 1 2 1 2 0 0 0 1 1 1 2 1 0 0 2 2 2 1 2 1 2 1 0 0 0 2 1 2 1 1
 1 1 2 0 2 1 1 2]
[0 2 1 0 2 2 2 1 1 1 2 0 0 0 1 1 1 1 1 0 0 2 2 2 1 2 1 2 1 0 0 0 1 1 2 1 1
 1 1 2 0 2 1 1 2]
0.9714285714285714


In [7]:
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
from sklearn import tree
import numpy as np

#1.数据获取
iris = datasets.load_iris()
x = iris.data
y = iris.target
print(x.shape)

#2.数据预处理
#random_state：生成随机种子。生成该组随机数的编号，下次再次输入该编号，得到的随机分组是相同的
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=1)

#3.使用决策树对鸢尾花数据进行类别建模，预测
clf = DecisionTreeClassifier()
clf.fit(x_train,y_train)
y_predict = clf.predict(x_test)

#4.获取结果报告
print('Accracy:',clf.score(x_test,y_test))
print(classification_report(y_predict,y_test,target_names=['setosa', 'versicolor', 'virginica']))

#5.保存生成的决策树
with open("Decision_tree_iris.dot","w") as f:
    f = tree.export_graphviz(clf, out_file=f)

#6.用graphviz进行决策树图的输出
#进入cmd，切换到目标文件目录
#输入指令  dot -Tpdf Decision_tree_iris.dot -o output2.pdf

(150, 4)
Accracy: 0.9666666666666667
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        11
  versicolor       0.92      1.00      0.96        12
   virginica       1.00      0.86      0.92         7

    accuracy                           0.97        30
   macro avg       0.97      0.95      0.96        30
weighted avg       0.97      0.97      0.97        30



In [8]:
from sklearn.datasets import load_iris
from sklearn import datasets
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import cross_val_score
iris = load_iris()

"""
data对应了样本的4个特征，150行4列
target对应了样本的类别（目标属性），150行1列
iris.target用0、1和2三个整数分别代表了花的三个品种
"""
X = iris.data
y = iris.target
"""
选择总数据的30％的数据
"""
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30, random_state=1)

"""
用KNN算法建模，参数优化，寻找最优模型参数
"""
knn_test = KNeighborsClassifier()
params = {"n_neighbors": [3, 4, 8, 10]}
gridCv = GridSearchCV(knn_test, param_grid=params, cv=5)
gridCv.fit(X_train, y_train)  
print("k-flod交叉验证中最好的结果：", gridCv.best_score_)
print("最好的模型参数是：", gridCv.best_estimator_.n_neighbors)
k_neighbor=gridCv.best_estimator_.n_neighbors

"""
对特征值进行标准化处理
"""
std = StandardScaler()
X_train = std.fit_transform(X_train)
X_test = std.transform(X_test)

"""
建模并进行预测
"""
knn = KNeighborsClassifier(n_neighbors=k_neighbor)  
knn.fit(X_train, y_train)  
y_predict = knn.predict(X_test)

"""
结果展示
"""
labels = ["山鸢尾", "虹膜锦葵", "变色鸢尾"]
tplt = "{0:{3}^10}\t{1:{3}^10}\t{2:^10}"
print(tplt.format("第i次测试","真实值","预测值",chr(12288)))
for i in range(len(y_predict)):
    print(tplt.format((i+1),labels[y_predict[i]],labels[y_test[i]],chr(12288)))
print("准确率为",knn.score(X_test, y_test))

k-flod交叉验证中最好的结果： 0.9619047619047618
最好的模型参数是： 8
　　第i次测试　　　	　　　真实值　　　　	   预测值    
　　　　1　　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　2　　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　3　　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　4　　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　5　　　　　	　　　变色鸢尾　　　	   变色鸢尾   
　　　　6　　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　7　　　　　	　　　变色鸢尾　　　	   变色鸢尾   
　　　　8　　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　9　　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　10　　　　	　　　变色鸢尾　　　	   变色鸢尾   
　　　　11　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　12　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　13　　　　	　　　变色鸢尾　　　	   变色鸢尾   
　　　　14　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　15　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　16　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　17　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　18　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　19　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　20　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　21　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　22　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　23　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　24　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　25　　　　	　　　变色鸢尾　　　	   变色鸢尾   
　　　　26　　　　	　　　虹膜锦葵　　　	   虹膜锦葵   
　　　　27　　　　	　　　山鸢尾　　　　	   山鸢尾    
　　　　28　　　　	　　　山鸢尾　　　　	   山鸢