# KNN Classifier

### Dataset

In [1]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

In [2]:
#Load data
iris = pd.read_csv('Iris.csv')
#data cleaning
iris.drop(columns="Id",inplace=True)

In [3]:
#features and labels
X=iris.iloc[:,0:4].values
y=iris.iloc[:,4].values

#Train and Test split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=0)

In [4]:
class K_nearest_neighbour():
    
    # Function to initialise K_nearest_neighbour class for given K
    def __init__(self, K):
        self.K = K
        
    # Function to fit and prepare model for given training data
    def fit(self, X_train, y_train):
        self.X_train = X_train
        self.y_train = y_train
        
    # Function to find distance of a test point from all training points
    def euclidean_distances(self, X_test):
        distances = []
        for j in range(X_train.shape[0]):
            distances.append(np.sum(np.square(X_test - self.X_train[j])))
        return distances
    
    # Function to find mode of an array
    def mode(self, arr):
        return max(set(arr), key=arr.tolist().count)
    
    # Function to get labels for k nearest neighbours based distances
    def find_neighbors(self, distances):
        inds = [distances.index(x) for x in sorted(distances)]
        k_nearest_labels = self.y_train[inds]
        k_nearest_labels = k_nearest_labels[:self.K]
        return k_nearest_labels
    
    # Function to predict label for test points
    def predict(self, X_test):
        
        total_correct = 0
        total_features = X_test.shape[1]
        y_pred = []
        
        for i in range(X_test.shape[0]):
            distances = self.euclidean_distances(X_test[i])
            k_nearest_labels = self.find_neighbors(distances)
            y_pred.append(self.mode(k_nearest_labels))

            if y_test[i] == y_pred[-1]:
                total_correct += 1
        
        accuracy = (total_correct / y_test.shape[0]) * 100
        
        self.accuracy = accuracy
        self.y_pred = y_pred

In [5]:
print("K Accuracy(out of 100)")
print("-----------------------------")
    
for k in range(1,8):
    model = K_nearest_neighbour(K=k)
    model.fit(X_train, y_train)
    model.predict(X_test)
    print(k, model.accuracy)
    

K Accuracy(out of 100)
-----------------------------
1 100.0
2 96.66666666666667
3 96.66666666666667
4 96.66666666666667
5 96.66666666666667
6 96.66666666666667
7 100.0
8 100.0
9 100.0
10 100.0
11 100.0
12 100.0
13 100.0
14 100.0
15 100.0
16 100.0
17 100.0
18 100.0
19 100.0
20 100.0
21 100.0
22 100.0
23 100.0
24 100.0
25 100.0
26 93.33333333333333
27 96.66666666666667
28 96.66666666666667
29 96.66666666666667
30 96.66666666666667
31 96.66666666666667
32 93.33333333333333
33 96.66666666666667
34 96.66666666666667
35 96.66666666666667
36 93.33333333333333
37 96.66666666666667
38 93.33333333333333
39 96.66666666666667
40 93.33333333333333
