python实现knn
knn
算法介绍:
k近邻算法,就是计算各个点的距离(可以是欧氏距离或者曼哈顿距离,一般是欧氏距离),然后取距离最近的前k个点,然后将k个点中属性标签最多的标签赋给预测点;
https://www.cnblogs.com/ybjourney/p/4702562.html
实现过程:
支持数据向量维度的输入,示例数据是四维数据;将文件转为数据二维列表;将数据进行归一化,减少误差;
计算数据点的欧式距离并排序,取前k个点统计他们的属性,最多的属性就是预测点的属性; 先采用训练集训练最优的k,然后使用最优的k对测试集的类别进行预测