# <center>k-Nearest Neighbours, kNN
`sklearn.neighbors.[KNeighborsClassifier, KNeighborsRegressor]`
* `n_neighbors` — количество  соседей, по умолчанию `5`.
* `weights{'uniform', 'distance'}` — вес объекта в зависимости от удаленности от объекта. Как говорилось ранее, если `'uniform'`, то расстояние не будет учитываться в подсчёте вероятности для классификации. По умолчанию оно не учитывается, параметр имеет значение `'uniform'`. При `'distance'` расстояние учитывается.
* `algorithm` — алгоритм, используемый при подсчёте расстояния.
    * `'ball_tree'` использует *BallTree*.
    * `'kd_tree'` использует  *KDTree*.
    * `'brute'` использует жадный алгоритм.
    * `'auto'` выбирает оптимальный из вышепредставленных.
* `leaf_size` — параметр для поиска расстояния *BallTree* или *KDTree*. По умолчанию равен `30`.
* `p` — значение p-метрики Миньковского. `p=1` — расстояние Манхэттена (L1), `p=2` — Евклидово расстояние (L2). По умолчанию `p=2`.
* `metric` — метрика для оценки расстояний, по умолчанию расстояние Миньковского.
* `n_jobs` — количество задач, выполняемых параллельно, ограничено количеством ядер вычислительной машины. При `n_jobs=-1` использует все.


In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.simplefilter('ignore')
from sklearn.neighbors import KNeighborsClassifier

In [2]:
data = pd.DataFrame([[0,0,0],[0.2,0.1,0], [1,0,0], [2,1,1],[2.5,0.9,1], [3,1,1]], columns = ['x','y', 'target'])
data

Unnamed: 0,x,y,target
0,0.0,0.0,0
1,0.2,0.1,0
2,1.0,0.0,0
3,2.0,1.0,1
4,2.5,0.9,1
5,3.0,1.0,1


In [3]:
X = data.drop(['target'], axis=1)
Y = data['target']

neigh = KNeighborsClassifier(n_neighbors=3)
neigh.fit(X, Y)

In [None]:
for item in np.linspace(0,3,10):
    x = item
    y = item*0.25
    plt.figure(figsize = (5,5))
    red = data[data.target == 1]
    blue = data[data.target == 0]
    red_prob = round(neigh.predict_proba([[x,y]])[0][1],2)*100 #вероятность принадлежности к красным
    blue_prob = round(neigh.predict_proba([[x,y]])[0][0],2)*100 #вероятность принадлежности к синим
    plt.title(f'Красный на {red_prob} %, синий на {blue_prob} %')
    plt.xlabel('значения признака x')
    plt.ylabel('значение признака y')
    plt.scatter(red.x.values,red.y.values ,c= 'r')
    plt.scatter(blue.x.values,blue.y.values ,c= 'b')
    plt.scatter(x,y ,c= 'g')
    plt.grid()
    plt.show()

![](https://lms.skillfactory.ru/assets/courseware/v1/c4c79d126fd3418893ea4a4bdc572871/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/dst-3-ml-8-35.gif)

In [None]:
# Добавим учёт расстояния
neigh = KNeighborsClassifier(n_neighbors=3, weights='distance')
neigh.fit(X, Y)

![](https://lms.skillfactory.ru/assets/courseware/v1/81762e2463d290254d65de6d9a8489c4/asset-v1:SkillFactory+DSPR-2.0+14JULY2021+type@asset+block/dst-3-ml-8-36.gif)