# Perceptron

## Fungsi-fungsi *Plotting*

Jangan mengubah kode pada *cell* di bawah ini.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

def line(w, th=0):
    w2 = w[2] + .001 if w[2] == 0 else w[2]

    return lambda x: (th - w[1] * x - w[0]) / w2


def plot(f1, f2, X, target, padding=1, marker='o'):
    X = np.array(X)

    x_vals, y_vals = X[:, 1], X[:, 2]
    xmin, xmax, ymin, ymax = x_vals.min(), x_vals.max(), y_vals.min(), y_vals.max()
    markers = f'r{marker}', f'b{marker}'
    line_x = np.arange(xmin-padding-1, xmax+padding+1)

    for c, v in enumerate(np.unique(target)):
        p = X[np.where(target == v)]

        plt.plot(p[:,1], p[:,2], markers[c])

    plt.axis([xmin-padding, xmax+padding, ymin-padding, ymax+padding])
    plt.plot(line_x, f1(line_x))
    plt.plot(line_x, f2(line_x))
    plt.show()

## Praktikum

### a) Fungsi *Step* Perceptron

Tulis kode ke dalam *cell* di bawah ini:

In [None]:
def percep_step(input, th=0):
    return 1 if input > th else -1 if input < -th else 0

### b) Fungsi *training* Perceptron

Tulis kode ke dalam *cell* di bawah ini:

In [None]:
def percep_fit(X, target, th=0, a=1, max_epoch=-1, verbose=False,
draw=False):
    w = np.zeros(len(X[0]) + 1)
    bias = np.ones((len(X), 1))
    X = np.hstack((bias, X))
    stop = False
    epoch = 0

    while not stop and (max_epoch == -1 or epoch < max_epoch):
        stop = True
        epoch += 1

        if verbose:
            print('\nEpoch', epoch)

        for r, row in enumerate(X):
            y_in = np.dot(row, w)
            y = percep_step(y_in, th)

            if y != target[r]:
                stop = False

            w = [w[i] + a * target[r] * row[i] for i in range(len(row))]

            if verbose:
                print('Bobot:', w)

            if draw:
                plot(line(w, th), line(w, -th), X, target)

    return w, epoch

### c) Fungsi *testing* Perceptron

Tulis kode ke dalam *cell* di bawah ini:

In [None]:
def percep_predict(X, w, th=0):
    Y = []

    for x in X:
        y_in = w[0] + np.dot(x, w[1:])
        y = percep_step(y_in, th)

        Y.append(y)

    return Y

In [None]:
def calc_accuracy(a, b):
    s = [1 if a[i] == b[i] else 0 for i in range(len(a))]

    return sum(s) / len(a)

### d) Logika AND

Tulis kode ke dalam *cell* di bawah ini:

In [None]:
train = (1, 1), (1, -1), (-1, 1), (-1, -1)
target = 1, -1, -1, -1
th = .2
model, epoch = percep_fit(train, target, th, verbose=True,
draw=True)
output = percep_predict(train, model)
accuracy = calc_accuracy(output, target)

print('Epochs:', epoch)
print('Output:', output)
print('Target:', target)
print('Accuracy:', accuracy)

### e) Logika OR

Tulis kode ke dalam *cell* di bawah ini:

In [None]:
train = (1, 1), (1, -1), (-1, 1), (-1, -1)
target = 1, 1, 1, -1
th = .2
model, epoch = percep_fit(train, target, th, verbose=True,
draw=True)
output = percep_predict(train, model)
accuracy = calc_accuracy(output, target)

print('Epochs:', epoch)
print('Output:', output)
print('Target:', target)
print('Accuracy:', accuracy)

### f) Logika AND NOT

Tulis kode ke dalam *cell* di bawah ini:

In [None]:
train = (1, 1), (1, -1), (-1, 1), (-1, -1)
target = -1, 1, -1, -1
th = .2
model, epoch = percep_fit(train, target, th, verbose=True,
draw=True)
output = percep_predict(train, model)
accuracy = calc_accuracy(output, target)

print('Epochs:', epoch)
print('Output:', output)
print('Target:', target)
print('Accuracy:', accuracy)

### g) Logika XOR

Tulis kode ke dalam *cell* di bawah ini:

In [None]:
train = (1, 1), (1, -1), (-1, 1), (-1, -1)
target = -1, 1, 1, -1
th = .2
model, epoch = percep_fit(train, target, th, max_epoch=50,
verbose=True, draw=False)
output = percep_predict(train, model)
accuracy = calc_accuracy(output, target)

print('Output:', output)
print('Accuracy:', accuracy)

## *Dataset* Iris

![Iris Dataset](https://www.spataru.at/images/blog/iris-dataset-svm/iris_types.jpg)

### h) *Load* dan *plot* data

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

iris = sns.load_dataset('iris')

sns.pairplot(iris, hue='species')
plt.show()

### i) Menghapus Kelas Virginica

In [None]:
iris = iris.loc[iris['species'] != 'virginica']

sns.pairplot(iris, hue='species')
plt.show()

### j) Menghapus ciri `sepal_width` dan `petal_width`

In [None]:
iris = iris.drop(['sepal_width', 'petal_width'], axis=1)

sns.pairplot(iris, hue='species')
plt.show()

### k) Proses *Training* dan *Testing*

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import minmax_scale

X = iris[['sepal_length', 'petal_length']].to_numpy()
X = minmax_scale(X)

y = iris['species'].to_numpy()
c = {'setosa': -1, 'versicolor': 1}
y = [c[i] for i in y]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)
w, epoch = percep_fit(X_train, y_train, verbose=True, draw=True)
out = percep_predict(X_test, w)
accuracy = calc_accuracy(out, y_test)

print('Epochs:', epoch)
print('Accuracy:', accuracy)

## Analisis

1. Mengapa Perceptron gagal dalam melakukan proses training menggunakan data logika XOR? Jelaskan.

 - Perceptron gagal dalam melakukan proses training untuk data logika XOR karena keterbatasannya yang hanya dapat memisahkan data yang linearly separable. Perceptron bekerja dengan mencari garis lurus (dalam dua dimensi) atau hyperplane (dalam dimensi yang lebih tinggi) untuk memisahkan kelas-kelas data. Namun, data XOR memiliki pola di mana tidak ada satu garis lurus yang bisa memisahkan dua kelas dengan benar. Misalnya, titik (1,1)(1, 1)(1,1) dan (−1,−1)(-1, -1)(−1,−1) memiliki label -1, sementara (1,−1)(1, -1)(1,−1) dan (−1,1)(-1, 1)(−1,1) memiliki label 1. Keteraturan ini membuat perceptron gagal, karena memerlukan lebih dari satu garis untuk memisahkan titik-titik tersebut.

 - Untuk memecahkan masalah XOR, diperlukan model yang lebih kompleks yang mampu menangani data yang tidak dapat dipisahkan secara linear. Salah satu solusi yang lebih umum adalah menggunakan multi-layer perceptron (MLP) atau jaringan saraf tiruan yang memiliki lapisan tersembunyi dan fungsi aktivasi non-linear. Dengan adanya lapisan tersembunyi ini, model dapat mempelajari representasi yang lebih kompleks dan memisahkan data XOR dengan benar. Jadi, perceptron tunggal tidak cukup untuk kasus seperti ini, tetapi jaringan saraf yang lebih dalam dan kompleks bisa menyelesaikannya.

2. Lakukan pelatihan data logika AND dengan learning rate yang berbeda-beda. Amati jumlah epoch yang dilakukan. Bagaimanakah efeknya pada proses pelatihan?

 - Pada pelatihan data logika AND, perubahan **learning rate** memiliki dampak signifikan pada jumlah **epoch** yang dibutuhkan oleh model perceptron untuk belajar. Learning rate menentukan seberapa besar perubahan bobot setiap kali model memperbarui bobotnya berdasarkan kesalahan yang dihitung. Ketika learning rate sangat kecil (misalnya \( \alpha = 0.01 \)), proses pembaruan bobot berlangsung sangat lambat. Akibatnya, model memerlukan lebih banyak epoch untuk mencapai hasil yang diinginkan, meskipun stabil, pelatihan menjadi lebih lama dan bisa memakan waktu yang cukup banyak.
 - Sebaliknya, jika learning rate terlalu besar (misalnya \( \alpha = 1 \) atau lebih), pembaruan bobot terjadi dengan langkah yang terlalu besar, menyebabkan model berpotensi "melompati" solusi optimalnya. Dalam situasi ini, model mungkin tidak konvergen sama sekali atau bahkan menjadi tidak stabil. Model bisa saja mencapai hasil dalam jumlah epoch yang lebih sedikit, tetapi hasil tersebut mungkin tidak akurat, dan model bisa berosilasi atau menghasilkan pembelajaran yang buruk.
 - Dengan learning rate yang moderat (misalnya \( \alpha = 0.1 \)), model biasanya menemukan keseimbangan yang baik antara kecepatan pembelajaran dan stabilitas. Proses pembaruan bobot terjadi cukup cepat tanpa melompati solusi yang optimal, sehingga jumlah epoch yang dibutuhkan cenderung lebih sedikit, namun tetap stabil dan akurat. Oleh karena itu, pemilihan learning rate yang tepat sangat penting untuk memastikan proses pelatihan yang efisien dan mencapai akurasi yang tinggi tanpa terlalu banyak epoch atau ketidakstabilan dalam pelatihan.


## Kesimpulan

1. Jelaskan perbedaan antara Perceptron dengan Hebb net?
 - Perceptron adalah model jaringan saraf sederhana yang digunakan untuk klasifikasi biner. Perceptron menggunakan fungsi aktivasi step untuk memutuskan keluaran apakah 1 atau -1 (atau 0 dan 1). Dalam pelatihan, perceptron memperbarui bobot berdasarkan kesalahan antara prediksi dan target menggunakan aturan pembaruan perceptron. Perceptron mampu menyelesaikan masalah linear separable, tetapi tidak dapat menangani kasus non-linear separable seperti XOR.
 - Hebb Net, di sisi lain, mengikuti Hebbian Learning Rule yang didasarkan pada prinsip "cells that fire together wire together." Dalam Hebb Net, bobot diperbarui jika ada korelasi positif antara input dan output. Hebb Net tidak menggunakan fungsi aktivasi seperti perceptron, dan tidak memperhitungkan kesalahan saat memperbarui bobot. Hebb Net juga lebih sederhana dan tidak memiliki mekanisme yang bisa mengatasi kasus yang lebih rumit.

2. Mengapa learning rate dibutuhkan?
 - Learning rate adalah parameter penting dalam algoritma pembelajaran yang menentukan seberapa besar langkah yang diambil saat memperbarui bobot jaringan. Learning rate dibutuhkan untuk mengontrol kecepatan pembelajaran model. Jika learning rate terlalu kecil, pembaruan bobot akan lambat, dan model membutuhkan banyak epoch untuk mencapai konvergensi, yang berarti proses pelatihan menjadi sangat lambat. Sebaliknya, jika learning rate terlalu besar, model bisa melompat jauh melewati solusi optimal, menyebabkan ketidakstabilan dan kemungkinan model tidak konvergen. Dengan learning rate yang tepat, proses pembaruan bobot bisa lebih cepat dan stabil.

3. Menurut Anda, kasus seperti apa yang bisa diselesaikan dan tidak bisa diselesaikan oleh Perceptron?
 - Kasus yang bisa diselesaikan oleh Perceptron adalah masalah linear separable, yaitu ketika data dapat dipisahkan oleh sebuah garis lurus (atau hyperplane dalam dimensi yang lebih tinggi). Contoh kasus yang dapat diselesaikan oleh perceptron adalah logika AND dan OR. Dalam masalah-masalah ini, titik data dari kelas yang berbeda dapat dipisahkan dengan jelas menggunakan satu garis lurus.
 - Kasus yang tidak bisa diselesaikan oleh Perceptron adalah masalah non-linear separable, di mana data tidak dapat dipisahkan dengan satu garis lurus. Contoh terkenal dari kasus ini adalah logika XOR, di mana tidak ada satu garis lurus yang dapat memisahkan kelas-kelas data secara sempurna. Untuk menangani kasus seperti ini, diperlukan model yang lebih kompleks, seperti multi-layer perceptron (MLP) yang menggunakan lapisan tersembunyi dan fungsi aktivasi non-linear untuk memisahkan data yang tidak dapat dipisahkan secara linear.
