In [2]:
import numpy as np
import matplotlib.pyplot as plt
import sklearn.datasets as datasets
import sklearn.model_selection as model_selection

In [4]:
#O algoritmo KNN (k-Nearest Neighbors) é um algoritmo de aprendizado de máquina que classifica ou faz previsões com base na proximidade dos vizinhos mais próximos. Ele armazena um conjunto de pontos de treinamento com seus rótulos correspondentes.

#Implementando o KNN usando numpy

class KNN:
    #Definindo numeros de vizinhos e elementos de treinamento
    def __init__(self, k, X_train, y_train):
        self.k = k 
        self.X_train = X_train
        self.y_train = y_train
    #Calcular a distância euclidiana
    def distancia(self, n1, n2):
        distance = np.linalg.norm(n1-n2)
        return distance
    
    #Retornar os K vizinhos mais próximos de value
    def get_neighbors(self, value):
        distances = []
        for x in self.X_train:
            distances.append(self.distancia(value,x))
        distances = np.asarray(distances)
        indices = np.argpartition(distances, self.k)
        k_first = indices[:self.k]
        return k_first
    
    #Realizando a previsão de um elemento dado o conjunto de treinamento
    def predict(self, value):
        knn_indices = self.get_neighbors(value)
        knn_labels=[]
        for i in knn_indices:
            knn_labels.append(self.y_train[i])
        occurrences = np.bincount(knn_labels)
        node=np.argmax(occurrences)
        return node
    
    #Retornar a acurácia
    def accuracy(self, y_test, predictions):
        correct = y_test == predictions
        acc = (np.sum(correct) / y_test.shape[0])*100
        return acc

In [9]:
#Testando classe acima
X,y = datasets.load_iris(return_X_y=True) #Carregando o dataset iris
X_train, X_test, y_train, y_test = model_selection.train_test_split(X,y,test_size=0.3, random_state=13) #Dividindo o dataset em treinamento e teste
knn = KNN(10, X_train, y_train) #Instanciando o knn

preds=[] #Variável que vai armazenar o resultado da previsão

for x in X_test:
    preds.append(knn.predict(x)) # Realizando a previsão em cada elemento de X_test e guardando em preds

acc = knn.accuracy(y_test, preds) #Comparando resultados
print(f"Acuracia de {acc}% (Classe implementada por mim)")

#Comparando com o modelo do sklearn
from sklearn.neighbors import KNeighborsClassifier
from sklearn import metrics
knnSKL = KNeighborsClassifier(n_neighbors=10)
knnSKL.fit(X_train, y_train)
y_pred = knnSKL.predict(X_test)
acc = metrics.accuracy_score(y_test, y_pred)*100
print(f"Acuracia de {acc}% (Utilizando SKLEARN)")





Acuracia de 93.33333333333333% (Classe implementada por mim)
Acuracia de 93.33333333333333% (Utilizando SKLEARN)
