# **KNN**

Ele faz a distância com os `k` vizinhos mais próximos, e analisa quantos desses possui uma determinada classificação e encaixa o objeto de estudo nessa classe. 
- **Exemplo 1**: Se tivermos 5 círculos da cor verde e 3 da cor vermelha, e queremos saber qual a cor de um dado circulo. O algoritmo calculará a distancia entre esse circulo e os demais, estabelecendo um `k=3` ele vai pegar os 3 mais próximos, se 2 deles forem vermelhos ele classifica o circulo como vermelho. Agora se analisarmos `k=5` pode ocorrer de termos 2 vermelhos e 3 verdes, assim o circulo será classificado como verde. Logo pode-se notar que o valor de `k` afeta o resultado final.

- **Exemplo 2**: Suponhamos que 3 pessoas na netflix, `A`, `B` e `C`, deram notas para os filmes `X` e `Y`. 

|.|X|Y|
|-|-|-|
|A|3|5|
|B|3|4|
|C|5|2|
    
Note que a distancia `AB` é muito menor que a distancia `AC`, assim a pessoa `A` receberá recomendações de filmes com base nos filmes que `B` assistiu.

> OBS.: Veja que como o KNN tem base em um cálculo de distância, não podemos utilizar atributos categóricos, assim temos que [converter](#2.6-TRANSFORMAÇÃO-DE-VARIÁVEIS-CATEGÓRICAS) os dados para numéricos e também temos que fazer o [escalonamento](#2.5-ESCALONAMENTO-DE-ATRIBUTOS).

O método KNN funciona problemas linearmente e não linearmente separáveis. E assim como os outros ele também é capaz de efetuar classificação de múltiplas classes.

![](https://importq.files.wordpress.com/2017/11/knn_neigh.gif?w=656)

Fonte: https://importq.wordpress.com/2017/11/24/mnist-analysis-using-knn/

![](https://zeidigital.files.wordpress.com/2016/08/class_prediction.jpg?w=640)

Fonte: https://zeidigital.wordpress.com/2016/08/13/k-nearest-neighbour-classification-algorithm-implementation-in-python/


---
- Links para aprender mais:
    - [Introdução ao Algoritmo KNN - IAexpert](https://iaexpert.com.br/index.php/2017/10/09/introducao-ao-algoritmo-knn/).
    - [K-Nearest Neighbors - Cognitive Class](https://youtu.be/VC3TgpFVcXE)
    - [MNIST analysis using KNN - ImportQ](https://importq.wordpress.com/2017/11/24/mnist-analysis-using-knn/)
    - [K-Nearest Neighbour(KNN) classification algorithm implementation in Python - Zeiselt](https://zeidigital.wordpress.com/2016/08/13/k-nearest-neighbour-classification-algorithm-implementation-in-python/)
---

> O Algoritmo KNN pode ser utilizado para classificação e para regressão

# **IMPLEMENTAÇÃO**
Para a implementação do algoritmo foi utilizada a biblioteca Sklearn, veja a [Documentação](https://scikit-learn.org/stable/modules/classes.html#)

## BASE DE DADOS
A base de dados que será utilizada será a MNIST que já pode ser encontrada na base de dados do keras.
Porém para trabalhar com o algoritmo em questão ela deve modificada em sua dimensão.

In [1]:
from keras.datasets import mnist

# Importando base de dados
(x_train, y_train),(x_test, y_test) = mnist.load_data()

# Normalizando os valores
x_train, x_test = x_train/255, x_test/255

# Ajustando formato
x_train = x_train.reshape(x_train.shape[0], x_train.shape[1]*x_train.shape[2])
x_test = x_test.reshape(x_test.shape[0], x_test.shape[1]*x_test.shape[2])

Using TensorFlow backend.


Downloading data from https://s3.amazonaws.com/img-datasets/mnist.npz


In [2]:
#-------------------------------Bibliotecas-----------------------------------#
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import confusion_matrix, accuracy_score

#----------------------------Criando classificador----------------------------# 
# Com 5 visinhos, métrica minkowski e com p=2 (distância Euclidiana)          #
# OBS.: Todos esses parâmetros são default, porém coloquei eles aqui para     #
#       Manter a didatica.                                                    #
#-----------------------------------------------------------------------------#
classificador = KNeighborsClassifier(n_neighbors=5, metric='minkowski', p=2)
classificador.fit(x_train, y_train)

#----Passando os dados de teste pelo algoritmo e armazenando as previsões-----#
previsoes = classificador.predict(x_test)

#----------------Exibindo a precisão e a matriz de confusão-------------------#
precisao = accuracy_score(y_test, previsoes)
matriz = confusion_matrix(y_test, previsoes)
print('precisao: {}'.format(precisao),'\n','matriz de confusão: \n{}' .format(matriz))

precisao: 0.9688 
 matriz de confusão: 
[[ 974    1    1    0    0    1    2    1    0    0]
 [   0 1133    2    0    0    0    0    0    0    0]
 [  11    8  991    2    1    0    1   15    3    0]
 [   0    3    3  976    1   13    1    6    3    4]
 [   3    7    0    0  944    0    4    2    1   21]
 [   5    0    0   12    2  862    4    1    2    4]
 [   5    3    0    0    3    2  945    0    0    0]
 [   0   22    4    0    3    0    0  988    0   11]
 [   8    3    5   13    6   12    5    5  913    4]
 [   5    7    3    9    7    3    1   10    2  962]]
