## K-Nearest Neighbors (KNN)
K-Nearest Neighbors (KNN) adalah algoritma *supervised learning* untuk klasifikasi dan regresi yang memprediksi berdasarkan *tetangga terdekat*.
- Klasifikasi: Voting mayoritas kelas dari *k* tetangga terdekat.
- Regresi: Rata-rata nilai dari *k* tetangga terdekat.

### Main Parameter
1. k (jumlah tetangga)
2. Metrik Jarak (contoh: Euclidean, Manhattan)
3. Bobot Voting (uniform atau berbasis jarak).

### Math in KNN
Tidak ada rumus matematis "model" yang dipelajari, tetapi proses prediksi mengikuti langkah:
1. Hitung jarak antara titik baru ke semua titik data latih.
2. Pilih k titik dengan jarak terdekat.
3. Klasifikasi: Ambil kelas mayoritas.
   $$ \text{Predicted Class} = \arg\max_{c} \sum_{i=1}^k I(y_i = c) $$
4. Regresi: Hitung rata-rata nilai.
   $$ \text{Predicted Value} = \frac{1}{k} \sum_{i=1}^k y_i $$

### Manual Calculation Example
Dataset:  
| Fitur 1 | Fitur 2 | Kelas    |  
|---------|---------|----------|  
| 2       | 3       | A        |  
| 5       | 7       | B        |  
| 1       | 2       | A        |  

Titik Baru: (4, 5)  
k = 2  

Langkah 1: Hitung jarak Euclidean ke semua titik:  
1. Ke (2,3):  
   $$ \sqrt{(4-2)^2 + (5-3)^2} = \sqrt{4 + 4} = 2.83 $$  
2. Ke (5,7):  
   $$ \sqrt{(4-5)^2 + (5-7)^2} = \sqrt{1 + 4} = 2.24 $$  
3. Ke (1,2):  
   $$ \sqrt{(4-1)^2 + (5-2)^2} = \sqrt{9 + 9} = 4.24 $$  

Langkah 2: Pilih 2 tetangga terdekat → (5,7) dan (2,3) dengan jarak 2.24 dan 2.83.  

Langkah 3: Voting kelas → B (1 vote) dan A (1 vote).  
*Jika terjadi seri, KNN memilih secara acak atau prioritas kelas pertama.*  

---

### Python Library  
```python
from sklearn.neighbors import KNeighborsClassifier

# Data
X_train = [[2, 3], [5, 7], [1, 2]]
y_train = ['A', 'B', 'A']

# Model KNN dengan k=2
knn = KNeighborsClassifier(n_neighbors=2, metric='euclidean')
knn.fit(X_train, y_train)

# Prediksi
new_point = [[4, 5]]
print("Predicted Class:", knn.predict(new_point))  # Output: ['A'] atau ['B'] (tergantung prioritas)
```

---

#### What Is `scikit-learn`?  
`scikit-learn` (disebut *"sklearn"*) adalah library machine learning untuk Python yang menyediakan:  
- Algoritma klasifikasi, regresi, clustering.  
- Tools untuk preprocessing, evaluasi model, dan utilitas dataset.  

#### What Is `KNeighborsClassifier`?  
Kelas dalam `sklearn.neighbors` untuk implementasi KNN klasifikasi.  

Parameter Penting:  
- `n_neighbors` (nilai k).  
- `metric` (metrik jarak: `'euclidean'`, `'manhattan'`, dll).  
- `weights` (`'uniform'` atau `'distance'`).  

---

### Kapan Menggunakan KNN?  
1. Dataset kecil (karena kompleksitas komputasi O(n)).  
2. Data dengan pola non-linear.  
3. Interpretasi sederhana (misal: "Kenapa titik ini diprediksi kelas A? Karena tetangganya adalah A!").  

---

### Kode Manual Sederhana  
```python
import numpy as np
from collections import Counter

def knn_predict(X_train, y_train, x_new, k=3):
    distances = [np.sqrt(np.sum((x - x_new)2)) for x in X_train]
    k_indices = np.argsort(distances)[:k]
    k_labels = [y_train[i] for i in k_indices]
    return Counter(k_labels).most_common(1)[0][0]

# Contoh penggunaan
print("Prediksi Manual:", knn_predict(X_train, y_train, [4,5], k=2))  # Output: 'A' atau 'B'
```

---

### FAQ  
Q: Mengapa KNN disebut *lazy learning*?  
A: Karena tidak ada proses "training" — semua komputasi dilakukan saat prediksi.  

Q: Apa kelemahan KNN?  
A: Mahal secara komputasi untuk dataset besar dan sensitif terhadap skala fitur.  

Q: Bagaimana memilih nilai k yang optimal?  
A: Gunakan *cross-validation* atau grid search.  