# K-Nearest Neighbors (KNN)
# K-Nearest Neighbors (KNN) é um método simples, mas poderoso, usado para classificação e regressão. Em ambos os casos, a entrada consiste nos k exemplos de treinamento mais próximos no espaço de características.

## Como funciona
* Definir o Número de Vizinhos (k): KNN começa com a escolha do número 'k' de vizinhos mais próximos. 'k' é geralmente um número ímpar para evitar empates.

* Cálculo da Distância: Calcula-se a distância entre o ponto de consulta e cada ponto de dados usando medidas de distância como Euclidiana, Manhattan, ou Hamming.

* Encontrar os Vizinhos Mais Próximos: Identifica-se os 'k' pontos de dados mais próximos do ponto de consulta.

* Votação para Classificação / Média para Regressão: Para classificação, o label mais frequente entre os k vizinhos mais próximos é escolhido como a previsão. Para regressão, a média dos valores dos vizinhos mais próximos é usada.

### Vantagens

* Simplicidade e Eficácia: KNN é fácil de entender e implementar e pode ser muito eficaz em alguns casos.

* Não Paramétrico: Como é um método não paramétrico, é versátil e pode ser usado em situações complexas onde a relação entre dados não é conhecida.

* Adapta-se a Mudanças de Dados: KNN não assume nada sobre a distribuição subjacente dos dados, tornando-o uma boa escolha em casos onde a distribuição dos dados é desconhecida.

### Desvantagens
* Lento em Grandes Conjuntos de Dados: Como KNN requer que a distância seja calculada entre o ponto de consulta e todos os pontos de dados, ele pode ser muito lento em grandes datasets.

* Sensível a Features Irrelevantes: KNN é sensível a características irrelevantes ou redundantes, pois todas as características contribuem igualmente para a determinação da similaridade.

* Sensível a Dados Desequilibrados: Em datasets com desequilíbrios de classe, KNN pode ter um viés para as classes mais frequentes.

#### Exemplo de Código com KNN

In [1]:
from sklearn.datasets import load_wine
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.preprocessing import StandardScaler

In [2]:
wine_data = load_wine()
X = wine_data.data
y = wine_data.target

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)


In [3]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)

In [4]:
y_pred = knn.predict(X_test)
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

[[19  0  0]
 [ 1 19  1]
 [ 0  0 14]]
              precision    recall  f1-score   support

           0       0.95      1.00      0.97        19
           1       1.00      0.90      0.95        21
           2       0.93      1.00      0.97        14

    accuracy                           0.96        54
   macro avg       0.96      0.97      0.96        54
weighted avg       0.97      0.96      0.96        54

