# JS13 - Artificial Neural Network (ANN) dan Evaluasi Classifier

## Praktikum 1

1. Buat dataset sederhana (XOR).
2. Inisialisasi bobot dan bias.
3. Implementasikan forward pass.
4. Hitung error dan lakukan backpropagation.
5. Update bobot menggunakan gradient descent.

In [1]:
import numpy as np

# Dataset XOR
X = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([[0],[1],[1],[0]])

# Parameter
input_size = 2
hidden_size = 2
output_size = 1
lr = 0.1

# Inisialisasi bobot
W1 = np.random.randn(input_size, hidden_size)
b1 = np.zeros((1, hidden_size))
W2 = np.random.randn(hidden_size, output_size)
b2 = np.zeros((1, output_size))

# Fungsi aktivasi
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    return x * (1 - x)

# Training
for epoch in range(10000):
    # Forward pass
    z1 = np.dot(X, W1) + b1
    a1 = sigmoid(z1)
    z2 = np.dot(a1, W2) + b2
    a2 = sigmoid(z2)

    # Hitung error
    error = y - a2

    # Backpropagation
    d_a2 = error * sigmoid_derivative(a2)
    d_W2 = np.dot(a1.T, d_a2)
    d_b2 = np.sum(d_a2, axis=0, keepdims=True)

    d_a1 = np.dot(d_a2, W2.T) * sigmoid_derivative(a1)
    d_W1 = np.dot(X.T, d_a1)
    d_b1 = np.sum(d_a1, axis=0, keepdims=True)

    # Update bobot
    W1 += lr * d_W1
    b1 += lr * d_b1
    W2 += lr * d_W2
    b2 += lr * d_b2

    if epoch % 1000 == 0:
        loss = np.mean(np.square(error))
        print(f"Epoch {epoch}, Loss: {loss}")

# Output akhir
print("Prediksi:")
print(a2)

Epoch 0, Loss: 0.2749564253095904
Epoch 1000, Loss: 0.22317719899262783
Epoch 2000, Loss: 0.17251388060636563
Epoch 3000, Loss: 0.14663460582881999
Epoch 4000, Loss: 0.13733783334753819
Epoch 5000, Loss: 0.1332966319591163
Epoch 6000, Loss: 0.13114950357570238
Epoch 7000, Loss: 0.1298453227948768
Epoch 8000, Loss: 0.12897845716707082
Epoch 9000, Loss: 0.1283643800840707
Prediksi:
[[0.05139412]
 [0.49808886]
 [0.94963875]
 [0.50452241]]


# Tugas 1:

1. Ubah jumlah neuron hidden layer menjadi 3.

In [2]:
import numpy as np

# Dataset XOR
X = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([[0],[1],[1],[0]])

# Parameter
input_size = 2
hidden_size = 3   # neutron
output_size = 1
lr = 0.1

# Inisialisasi bobot
W1 = np.random.randn(input_size, hidden_size)
b1 = np.zeros((1, hidden_size))
W2 = np.random.randn(hidden_size, output_size)
b2 = np.zeros((1, output_size))

# Fungsi aktivasi
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    return x * (1 - x)

# Training
for epoch in range(10000):
    # Forward pass
    z1 = np.dot(X, W1) + b1
    a1 = sigmoid(z1)
    z2 = np.dot(a1, W2) + b2
    a2 = sigmoid(z2)

    # Hitung error
    error = y - a2

    # Backprop
    d_a2 = error * sigmoid_derivative(a2)
    d_W2 = np.dot(a1.T, d_a2)
    d_b2 = np.sum(d_a2, axis=0, keepdims=True)

    d_a1 = np.dot(d_a2, W2.T) * sigmoid_derivative(a1)
    d_W1 = np.dot(X.T, d_a1)
    d_b1 = np.sum(d_a1, axis=0, keepdims=True)

    # Update
    W1 += lr * d_W1
    b1 += lr * d_b1
    W2 += lr * d_W2
    b2 += lr * d_b2

    if epoch % 1000 == 0:
        loss = np.mean(np.square(error))
        print(f"Epoch {epoch}, Loss: {loss}")

# Output akhir
print("\nPrediksi akhir:")
print(a2)


Epoch 0, Loss: 0.2637912109145535
Epoch 1000, Loss: 0.24861590861372887
Epoch 2000, Loss: 0.23795505207402906
Epoch 3000, Loss: 0.11167502753495133
Epoch 4000, Loss: 0.023554701715889068
Epoch 5000, Loss: 0.010416766902385145
Epoch 6000, Loss: 0.006339597160730793
Epoch 7000, Loss: 0.00446490808114226
Epoch 8000, Loss: 0.003411363890313673
Epoch 9000, Loss: 0.0027439542481342244

Prediksi akhir:
[[0.04361979]
 [0.94763568]
 [0.9540407 ]
 [0.04888583]]


2. Bandingkan hasil loss dengan konfigurasi awal.

Dengan neuron 2:

![image.png](attachment:image.png)

Dengan neuron 3:

![image.png](attachment:image.png)

Tampak bahwa hasil loss dengan menggunakan neuron 3 lebih kecil daripada kode dengan menggunakan neuron 2

3. Tambahkan fungsi aktivasi ReLU dan bandingkan hasil.

In [3]:
import numpy as np

# Dataset XOR
X = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([[0],[1],[1],[0]])

# Parameter
input_size = 2
hidden_size = 3
output_size = 1
lr = 0.1

# Inisialisasi bobot
W1 = np.random.randn(input_size, hidden_size)
b1 = np.zeros((1, hidden_size))
W2 = np.random.randn(hidden_size, output_size)
b2 = np.zeros((1, output_size))

# Fungsi aktivasi
def relu(x):
    return np.maximum(0, x)

def relu_derivative(x):
    return np.where(x > 0, 1, 0)

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    return x * (1 - x)

# Training
for epoch in range(10000):
    # Forward pass
    z1 = np.dot(X, W1) + b1
    a1 = relu(z1)               # >>> ReLU digunakan di hidden layer
    z2 = np.dot(a1, W2) + b2
    a2 = sigmoid(z2)

    # Hitung error
    error = y - a2

    # Backprop
    d_a2 = error * sigmoid_derivative(a2)
    d_W2 = np.dot(a1.T, d_a2)
    d_b2 = np.sum(d_a2, axis=0, keepdims=True)

    d_a1 = np.dot(d_a2, W2.T) * relu_derivative(z1)  # derivative ReLU
    d_W1 = np.dot(X.T, d_a1)
    d_b1 = np.sum(d_a1, axis=0, keepdims=True)

    # Update
    W1 += lr * d_W1
    b1 += lr * d_b1
    W2 += lr * d_W2
    b2 += lr * d_b2

    if epoch % 1000 == 0:
        loss = np.mean(np.square(error))
        print(f"Epoch {epoch}, Loss: {loss}")

print("\nPrediksi akhir (ReLU):")
print(a2)


Epoch 0, Loss: 0.24369016697243384
Epoch 1000, Loss: 0.16706826343849024
Epoch 2000, Loss: 0.1668262231439403
Epoch 3000, Loss: 0.16676126112293793
Epoch 4000, Loss: 0.16672199027189574
Epoch 5000, Loss: 0.16671202108169136
Epoch 6000, Loss: 0.16670205245288894
Epoch 7000, Loss: 0.1666972419716564
Epoch 8000, Loss: 0.16669544104363632
Epoch 9000, Loss: 0.16668914513129074

Prediksi akhir (ReLU):
[[0.3334577]
 [0.9909502]
 [0.3334577]
 [0.3334577]]


Hasil di atas merupakan hasil dengan menambahkan fungsi aktivasi reLU. Sedangkan dengan neuron yang sama dan tidak menggunakan fungsi aktivasi reLU tersebut hasilnya sebagai berikut:

![image.png](attachment:image.png)

Berdasarkan hal tersebut, tampak bahwa loss yang dihasilkan aktivasi sigmoid lebih kecil dibandingkan dengan menggunakan aktivasi ReLU pada hidden layer dengan jumlah neuron yang sama. Selain itu, pada prediksi yang dihasilkan oleh aktivasi sigmoid lebih mendekati nilai target (0 atau 1) dibandingkan dengan menggunakan aktivasi ReLU. 