In [2]:
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

In [14]:
# 数据集特征(iris.feature_names)
# 花萼长度: sepal length (cm)
# 花萼宽度: sepal width (cm)
# 花瓣长度: petal length (cm)
# 花瓣宽度: petal width (cm)

# 数据集目标分类(iris.target_names)
# 山鸢尾花: setosa
# 变色鸢尾花: versicolor
# 韦尔吉尼娅鸢尾花: virginica

iris = datasets.load_iris()
iris_X = iris.data # 应用所有特征(花萼长度, 花萼宽度, 花瓣长度, 花瓣宽度)
iris_Y = iris.target

X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_Y, test_size=0.1)

knn = KNeighborsClassifier(
    n_neighbors = 3,     # [O] 近邻的个数
    weights='uniform',   # [O] 权重 1. uniform: 无论近邻距离多远, 权重一样 2. 'distance': 距离越近权重越大
    algorithm = 'auto',  # [O] 构建算法 1. audo: 自动选择 2. ball_tree(球树) 3. kd_tree(KD树) 4. brute(蛮力实现)
    leaf_size = 30,      # [O] 建子树的叶子节点数量的阈值(algorithm==brute时无效)
    metric = 'minkowski',# [O] 距离函数 1. euclidean(欧式距离) 2. manhattan(曼哈顿距离) 3. chebyshev(切比雪夫距离) 4. minkowski(闵可夫斯基距离)
    p = 2                # [O] 当metric='minkowski'时有效, 作为距离函数的参数                  
)

knn.fit(X_train, y_train);

sepal_length = float(input('输入花萼的长度:'))
sepal_width = float(input('输入花萼的宽度:'))
petal_length = float(input('输入花瓣的长度:'))
petal_width = float(input('输入花瓣的宽度:'))
x = np.array([sepal_length, sepal_width, petal_length, petal_width])
print('预测结果:', iris.target_names[knn.predict([x])[0]])

输入花萼的长度:5.8
输入花萼的宽度:4.0
输入花瓣的长度:1.2
输入花瓣的宽度:0.2
预测结果: setosa
