## Ilustrasi Algoritma K-NN

- Kasus:

Sebuah pabrik benang, melakukan pengujian terhadap bahan yang akan dijual. Pengukuran yang dilakukan adalah kekuatan tarikan sebuah benang. Hasil dari pengujian sebelumnya adalah:

X, Y, Z

7, 6, Bagus

7, 4, Bagus

3, 4, Jelek

2, 4, Jelek

Dimana X adalah banyaknya serat, Y adalah banyaknya uliran, dan Z adalah hasil pengujian
Hari ini, pabrik tersebut akan membuat sebuah benang baru dengan kriteria banyaknya serat (X) = 3, dan banyaknya uliran (Y) = 6.

- Pertanyaan:

Prediksi kan, apakah benang baru tersebut termasuk bagus atau jelek menggunakan algoritma K-NN

## Step 1 

Rubah dataset dalam bentuk array:

In [1]:
dataset = [
    [7,6,"Bagus"],
    [7,4,"Bagus"],
    [3,4,"Jelek"],
    [2,4,"Jelek"]
]

Masukkan masing2 value ke dalam variabel X, Y, dan Z

In [2]:
all_X = [d[0] for d in dataset]
all_Y = [d[1] for d in dataset]
all_Z  = [d[2] for d in dataset]

In [3]:
print(all_X)
print(all_Y)
print(all_Z)

[7, 7, 3, 2]
[6, 4, 4, 4]
['Bagus', 'Bagus', 'Jelek', 'Jelek']


## Step 2 

Menghitung kedekatan dari data yang baru, menggunakan rumus Euclidian:

d = √(x1-x2)^2 + (y1-y2)^2

In [4]:
from tqdm import tqdm_notebook

X_uji = 3
Y_uji = 6

matrix_result = []

for i in range(len(dataset)):
    x1 = all_X[i]
    y1 = all_Y[i]
    x2 = X_uji
    y2 = Y_uji
    z = all_Z[i]
    
    d = ((all_X[i] - X_uji)**2) + ((all_Y[i] - Y_uji)**2)
    
    print("Jarak ({x1},{y1}) -> ({x1}-{x2})^2 + ({y1}-{y2})^2 = {d}".format(x1=x1, x2=x2, y1=y1, y2=y2, d=d))
    
    matrix_result.append([all_X[i], all_Y[i], d, all_Z[i]])

Jarak (7,6) -> (7-3)^2 + (6-6)^2 = 16
Jarak (7,4) -> (7-3)^2 + (4-6)^2 = 20
Jarak (3,4) -> (3-3)^2 + (4-6)^2 = 4
Jarak (2,4) -> (2-3)^2 + (4-6)^2 = 5


In [5]:
print("X\tY\tJarak\tHasil")
print('-'*30)
for m in matrix_result:
    print("{0}\t{1}\t{2}\t{3}".format(m[0],m[1],m[2],m[3]))

X	Y	Jarak	Hasil
------------------------------
7	6	16	Bagus
7	4	20	Bagus
3	4	4	Jelek
2	4	5	Jelek


## Step 3

Mengurutkan jarak terpendek ke terpanjang

In [6]:
matrix_sorted = sorted(matrix_result, key=lambda x: x[2], reverse=False)

In [7]:
print("X\tY\tJarak\tHasil")
print('-'*30)
for m in matrix_sorted:
    print("{0}\t{1}\t{2}\t{3}".format(m[0],m[1],m[2],m[3]))

X	Y	Jarak	Hasil
------------------------------
3	4	4	Jelek
2	4	5	Jelek
7	6	16	Bagus
7	4	20	Bagus


## Step 4

Menentukan jumlah K, dan memotong matrix sesuai jumlah K.

Sebagai contoh, kita menggunakan K=3

In [8]:
k = 3
matrix_k3 = []

for m in matrix_sorted[:k]:
    matrix_k3.append(m)

In [9]:
print("X\tY\tJarak\tHasil")
print('-'*30)
for m in matrix_k3:
    print("{0}\t{1}\t{2}\t{3}".format(m[0],m[1],m[2],m[3]))

X	Y	Jarak	Hasil
------------------------------
3	4	4	Jelek
2	4	5	Jelek
7	6	16	Bagus


## Step 5

Kesimpulan:

Dengan melihat matrix yang tersisa, dapat diambil kesimpulan bahwa benang yang baru dengan X=3 dan Y=6, adalah "JELEK"

In [10]:
jumlah_jelek = 0
jumlah_bagus = 0

for m in matrix_k3:
    if m[3] == "Bagus":
        jumlah_bagus += 1
    else:
        jumlah_jelek += 1
        
if jumlah_bagus > jumlah_jelek:
    prediksi = "Bagus"
else:
    prediksi = "Jelek"
    
print(prediksi)

Jelek


## Using Library 

Dengan menggunakan library python yaitu Scikit.Learn, dapat diselesaikan dengan code berikut:

In [11]:
all_X = [[d[2]] for d in matrix_result]
all_Z = [d[3] for d in matrix_result]

In [12]:
from sklearn.neighbors import KNeighborsClassifier

neigh = KNeighborsClassifier(n_neighbors=3)
neigh.fit(all_X, all_Z)
print('')




Untuk memprediksi suatu nilai termasuk "Bagus" atau "Jelek", maka:

In [13]:
print(neigh.predict([[3]]))

['Jelek']


In [14]:
print(neigh.predict([[6]]))

['Jelek']


In [15]:
print(neigh.predict([[15]]))

['Bagus']
