# 🧠 KNN (K-Nearest Neighbors)

O **KNN (K-Nearest Neighbors)** é um dos algoritmos de aprendizado supervisionado mais simples e intuitivos, utilizado tanto para **classificação** quanto para **regressão**.

---

## 🧩 Ideia Principal

A ideia central do KNN é classificar um ponto com base em **seus vizinhos mais próximos** no espaço de características.

1. **Escolhe-se um número \( K \)** — o número de vizinhos.
2. **Calcula-se a distância** entre o ponto novo e todos os pontos de treinamento (geralmente usa-se a **distância Euclidiana**).
3. **Selecionam-se os \( K \)** pontos mais próximos.
4. - **Para classificação**: o ponto é atribuído à classe mais comum entre os vizinhos.  
   - **Para regressão**: a saída é a média (ou mediana) dos valores dos vizinhos.

---

## 🧮 Fórmula da Distância Euclidiana

Para dois pontos $( x = (x_1, x_2, ..., x_n) )$ e $( y = (y_1, y_2, ..., y_n) )$:


$$d(x, y) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2}$$

---

## ⚙️ Hiperparâmetros Importantes

- **K**: número de vizinhos considerados.  
  - Valores pequenos → modelo mais sensível a ruído (overfitting).  
  - Valores grandes → modelo mais suave (underfitting).
- **Métrica de distância**: Euclidiana, Manhattan, Minkowski etc.
- **Peso dos vizinhos**:  
  - `"uniform"` — todos os vizinhos têm o mesmo peso.  
  - `"distance"` — vizinhos mais próximos têm mais peso.

---


In [1]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, classification_report

# 1. Carregar dataset de exemplo
data = load_iris()
X = data.data
y = data.target

# 2. Dividir em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. Criar o modelo KNN
knn = KNeighborsClassifier(n_neighbors=5, metric='euclidean', weights='distance')

# 4. Treinar o modelo
knn.fit(X_train, y_train)

# 5. Fazer previsões
y_pred = knn.predict(X_test)

# 6. Avaliar desempenho
print("Acurácia:", accuracy_score(y_test, y_pred))
print("\nRelatório de Classificação:\n", classification_report(y_test, y_pred))




Acurácia: 1.0

Relatório de Classificação:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        10
           1       1.00      1.00      1.00         9
           2       1.00      1.00      1.00        11

    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30

