# Neural Network

Neural network atau jaringan saraf adalah model matematika yang terinspirasi dari cara kerja otak manusia. Model ini terdiri dari banyak unit kecil yang disebut "neuron" yang terhubung satu sama lain melalui jaringan koneksi yang kompleks. Setiap neuron menerima input dari neuron lainnya dan menghasilkan output berdasarkan fungsi aktivasi yang ditentukan. Output dari satu neuron kemudian menjadi input untuk neuron lainnya, membentuk rangkaian pemrosesan informasi yang kompleks.

Neural network digunakan dalam berbagai aplikasi seperti pengenalan gambar, pengenalan suara, pemrosesan bahasa alami, analisis data, dan banyak lagi. Dalam pembelajaran mesin, neural network digunakan untuk mengekstraksi fitur dari data dan mempelajari hubungan yang kompleks antara input dan output. Proses pembelajaran ini melibatkan menyesuaikan bobot koneksi antara neuron untuk mencapai hasil yang diinginkan.

## Aplikasi neural network di berbagai bidang

1. Computer Vision
Neural network digunakan dalam pengenalan gambar dan video. Contohnya, convolutional neural network (CNN) digunakan untuk klasifikasi gambar dan deteksi objek dalam gambar. Salah satu aplikasi yang populer adalah deteksi wajah pada kamera CCTV dan kamera smartphone.

2. Natural Language Processing
Neural network digunakan untuk pemrosesan bahasa alami seperti penerjemahan mesin, analisis sentimen, dan pengenalan suara. Contohnya, recurrent neural network (RNN) digunakan untuk penerjemahan mesin dan speech recognition.

3. Medicine
Neural network digunakan dalam diagnosis medis, penelitian obat, dan pengobatan pasien. Contohnya, neural network digunakan untuk memprediksi hasil tes medis dan mengidentifikasi pasien yang berisiko terkena penyakit tertentu.

4. Keuangan
Neural network digunakan dalam prediksi harga saham, deteksi kecurangan, dan analisis risiko. Contohnya, neural network digunakan untuk mengidentifikasi pola dalam data pasar saham dan memprediksi harga saham di masa depan.

5. Teknologi
Neural network digunakan dalam berbagai teknologi seperti self-driving car, pengenalan suara dan tulisan tangan, dan asisten virtual. Contohnya, neural network digunakan untuk mengenali objek dan pergerakan di sekitar mobil otonom.

6. Industri
Neural network digunakan dalam otomatisasi dan optimasi proses industri seperti manufaktur dan transportasi. Contohnya, neural network digunakan untuk memprediksi kegagalan mesin dan memperbaiki proses produksi.

7. Gaming
Neural network digunakan dalam game untuk membuat bot yang cerdas dan beradaptasi dengan permainan. Contohnya, neural network digunakan dalam game catur dan game strategi lainnya untuk membuat bot yang bisa belajar dan meningkatkan kemampuan permainannya.

Dalam setiap aplikasi, neural network membantu menyelesaikan masalah yang kompleks dan mempercepat proses pengambilan keputusan.

## Dasar-dasar Neural Network

![alternative text](images/basic-neural-network.png)

Berikut adalah bagian-bagian dari neural network beserta penjelasannya:

1. Input layer
Input layer adalah bagian pertama dari neural network, yang menerima input data dalam bentuk vektor. Vektor input tersebut bisa berisi data seperti piksel gambar, angka, atau variabel lainnya.

2. Hidden layer
Hidden layer adalah layer di antara input layer dan output layer. Hidden layer terdiri dari beberapa neuron yang menerima input dari input layer dan menghasilkan output yang kemudian menjadi input untuk output layer. Jumlah hidden layer dan jumlah neuron di dalam setiap layer tergantung pada kompleksitas tugas yang ingin diselesaikan.

3. Output layer
Output layer adalah layer terakhir dari neural network yang menghasilkan output dari proses pemrosesan input. Output layer dapat menghasilkan satu nilai (dalam kasus regresi) atau beberapa nilai yang merepresentasikan kategori (dalam kasus klasifikasi).

4. Bobot
Bobot adalah variabel yang digunakan untuk menghubungkan neuron dalam satu layer dengan neuron di layer berikutnya. Bobot menggambarkan kekuatan koneksi antara neuron dalam satu layer dengan neuron di layer berikutnya. Selama proses pelatihan, bobot diatur sedemikian rupa sehingga neural network dapat menghasilkan output yang akurat.

5. Fungsi aktivasi
Fungsi aktivasi adalah fungsi matematis yang diterapkan pada output neuron dalam satu layer untuk menghasilkan output yang lebih berguna. Fungsi aktivasi umumnya non-linear dan beragam, seperti sigmoid, relu, dan tanh.

6. Pelatihan
Pelatihan adalah proses untuk mengoptimalkan bobot dalam neural network untuk menghasilkan output yang tepat. Proses pelatihan ini melibatkan perhitungan biaya (cost) dari output neural network yang dihasilkan dan memperbarui bobot jaringan dengan algoritma pelatihan yang sesuai seperti backpropagation dan stochastic gradient descent.

7. Validasi dan evaluasi
Setelah pelatihan, neural network perlu diuji pada data validasi yang belum pernah dilihat sebelumnya. Evaluasi dilakukan dengan menggunakan metrik seperti akurasi, presisi, recall, atau F1-score.

Dalam setiap aplikasi, bagian-bagian neural network dapat berbeda-beda tergantung pada arsitektur dan kompleksitas tugas yang ingin diselesaikan. Namun, dasar-dasar tersebut tetap ada dan perlu dipahami untuk merancang dan mengoptimalkan neural network yang sesuai dengan tugas yang ingin diselesaikan.

## Perceptron

![alternative text](images/perceptron.png)

Perceptron adalah salah satu jenis model neural network yang sangat sederhana dan awalnya dikembangkan oleh Frank Rosenblatt pada tahun 1957. Perceptron terdiri dari satu layer input dan satu layer output yang berfungsi sebagai klasifikasi biner (binary classifier), yaitu mengelompokkan input ke dalam dua kelas yang berbeda. Perceptron digunakan untuk mempelajari hubungan linier antara input dan output, dengan menggunakan prinsip pembelajaran berupa "melatih" model dengan memberikan contoh input dan output yang telah diketahui. Kemudian, model tersebut dapat digunakan untuk melakukan prediksi pada data yang belum pernah dilihat sebelumnya.

Perceptron bekerja dengan cara mengalikan setiap nilai input dengan bobotnya, kemudian menjumlahkan hasil perkalian tersebut dan menambahkan bias. Hasil akhir dari operasi tersebut kemudian dijadikan input untuk fungsi aktivasi, seperti fungsi step atau sigmoid. Output yang dihasilkan dari fungsi aktivasi akan digunakan untuk menentukan kelas output yang sesuai dengan input yang diberikan.

Pada awalnya, perceptron hanya dapat digunakan untuk menyelesaikan masalah yang linearly separable, yaitu masalah di mana kelas input dapat dipisahkan dengan garis lurus pada ruang input. Namun, kemudian perceptron dikembangkan lebih lanjut dengan menggunakan beberapa layer yang lebih kompleks, sehingga dapat menyelesaikan masalah yang lebih kompleks seperti masalah non-linear. Perceptron multilayer yang lebih kompleks disebut sebagai neural network feedforward dengan banyak hidden layer, atau sering disebut sebagai deep learning.

Bias dalam neural network merupakan parameter tambahan yang berfungsi untuk menambah fleksibilitas dan kemampuan model untuk belajar dari data yang diberikan. Bias diperlukan agar model dapat menangkap pola-pola yang kompleks dan tidak linier dari data yang ada. Bias dihitung dengan cara menambahkan konstanta ke dalam output neuron, sehingga memungkinkan neuron tersebut untuk mengaktifkan atau tidak mengaktifkan dirinya sendiri tergantung pada bobot inputannya. Dalam neural network, bias merupakan suatu nilai yang ditambahkan ke dalam jumlah produk titik antara input dan bobot, sebelum hasilnya diolah oleh fungsi aktivasi.

## Contoh perhitungan sederhana Neural Network

Berikut adalah contoh perhitungan neural network yang sangat sederhana dengan hanya satu input layer dan satu output layer:

Kita akan membuat neural network yang dapat memprediksi apakah seseorang diterima atau tidak diterima di suatu universitas berdasarkan nilai tes masuk yang dimilikinya. Nilai tes masuk yang dimiliki seseorang akan menjadi input untuk neural network, dan outputnya akan menunjukkan apakah orang tersebut diterima atau tidak.

Kita akan menggunakan fungsi aktivasi sigmoid untuk menghitung output dari setiap node pada output layer. Bobot yang akan digunakan pada output layer adalah 0.5 dan bias adalah -0.3. Kita juga asumsikan bahwa nilai tes masuk seseorang adalah 0.8.

Pertama, kita hitung nilai net input pada node pada output layer:
net input = (input nilai tes masuk * bobot) + bias
= (0.8 * 0.5) - 0.3
= 0.1

Selanjutnya, kita gunakan fungsi aktivasi sigmoid pada nilai net input:
output = 1 / (1 + exp(-net input))
= 1 / (1 + exp(-0.1))
= 0.525

Output 0.525 menunjukkan bahwa kemungkinan seseorang diterima di universitas tersebut adalah sekitar 52,5%.

Dalam kasus ini, neural network hanya memiliki satu input dan satu output, namun dalam praktiknya neural network dapat memiliki banyak input dan output, serta beberapa hidden layer untuk melakukan ekstraksi fitur dari input sebelum diteruskan ke output layer. Perhitungan yang dilakukan pada setiap node pada neural network dapat menjadi sangat rumit, tergantung pada arsitektur jaringan dan jumlah node yang terlibat.

In [1]:
import math

# nilai tes masuk seseorang
x = 0.8

# bobot pada output layer
w = 0.5

# bias pada output layer
b = -0.3

# hitung net input pada output layer
out = x * w + b
print(out)

0.10000000000000003


In [2]:
# hitung output pada output layer menggunakan fungsi aktivasi sigmoid
output = 1 / (1 + math.exp(-out))

# tampilkan hasil output
print("Output: ", output)

Output:  0.52497918747894


## Multilayer Perceptron

![alternative text](images/multilayer-perceptron.png)

Multi-layer perceptron (MLP) adalah jenis arsitektur neural network feedforward yang terdiri dari lebih dari satu layer tersembunyi (hidden layer) antara input layer dan output layer. MLP merupakan pengembangan dari perceptron yang sederhana, yang hanya memiliki satu layer input dan satu layer output, sehingga mampu mempelajari pola yang lebih kompleks.

Setiap layer pada MLP terdiri dari sejumlah neuron yang terhubung satu sama lain dengan bobot tertentu. Proses pelatihan MLP dilakukan dengan memperbarui bobot antar neuron berdasarkan perbedaan antara output yang dihasilkan dengan output yang diharapkan. Pelatihan MLP biasanya dilakukan dengan algoritma backpropagation, yang menghitung kesalahan (error) antara output yang dihasilkan dengan output yang diharapkan, lalu memperbarui bobot pada masing-masing neuron berdasarkan besarnya kesalahan tersebut.

Keunggulan dari MLP adalah kemampuannya untuk mempelajari pola yang kompleks pada data input yang rumit dan tidak linear. Oleh karena itu, MLP sering digunakan untuk memecahkan masalah klasifikasi atau regresi dalam berbagai bidang, seperti pengenalan citra, analisis sentimen, prediksi harga saham, dan sebagainya. Namun, karena kecenderungan overfitting dan kompleksitas yang tinggi, pemilihan arsitektur dan parameter yang tepat sangat penting dalam pembuatan MLP.

## Contoh MLP Feedforward

![alternative text](images/mlp-example.png)

Misalkan kita memiliki input data berupa dua bilangan x1 dan x2, dan kita ingin membangun sebuah multilayer perceptron dengan satu hidden layer yang terdiri dari tiga neuron dan satu output layer yang mengeluarkan output klasifikasi biner (1 atau 0). Kita asumsikan bahwa data input sudah melalui proses normalisasi sehingga memiliki rentang nilai antara 0 dan 1.

Input data: x1 = 0.2, x2 = 0.8

Bobot dan bias pada hidden layer:

W1 = [[0.1, 0.4, -0.3],
      [0.3, -0.2, 0.5]]

b1 = [0.2, 0.4, -0.5]


Bobot dan bias pada output layer:

W2 = [[0.2, 0.1, -0.5]]

b2 = [-0.1]


Output kelas yang diharapkan: 1

Hidden layer

Neuron 1:

z1_1 = W1[0,0]*x1 + W1[1,0]*x2 + b1[0]
     = 0.1*0.2 + 0.3*0.8 + 0.2
     = 0.44


a1_1 = sigmoid(z1_1)
     = sigmoid(0.44)
     = 0.607

Neuron 2:

z1_2 = W1[0,1]*x1 + W1[1,1]*x2 + b1[1]
     = 0.4*0.2 + (-0.2)*0.8 + 0.4
     = 0.24

a1_2 = sigmoid(z1_2)
     = sigmoid(0.24)
     = 0.559


Neuron 3:

z1_3 = W1[0,2]*x1 + W1[1,2]*x2 + b1[2]
     = (-0.3)*0.2 + 0.5*0.8 - 0.5
     = 0.1

a1_3 = sigmoid(z1_3)
     = sigmoid(0.1)
     = 0.525


Output layer

z2 = W2[0,0]*a1_1 + W2[0,1]*a1_2 + W2[0,2]*a1_3 + b2
   = 0.2*0.607 + 0.1*0.559 + (-0.5)*0.525 + (-0.1)
   = 0.0044

a2 = sigmoid(z2)
   = sigmoid(0.0044)
   = 0.501


Output dari multilayer perceptron adalah 0.501. Kita dapat membulatkan nilai tersebut ke nilai biner 1 atau 0, tergantung dari ambang batas (threshold) yang kita tentukan. Dalam contoh ini, karena output kelas yang diharapkan adalah 1, maka kita dapat memutuskan bahwa input [0.2, 0.8] akan diklasifikasikan sebagai kelas 1.

In [3]:
import numpy as np

# input data
X = np.array([[0.2], [0.8]])

# bobot dan bias pada hidden layer
W1 = np.array([[0.1, 0.4, -0.3], [0.3, -0.2, 0.5]])
b1 = np.array([[0.2], [0.4], [-0.5]])

# bobot dan bias pada output layer
W2 = np.array([[0.2], [0.1], [-0.5]])
b2 = np.array([-0.1])

# feedforward
hidden_layer = np.dot(W1.T, X) + b1
hidden_layer_activation = 1 / (1 + np.exp(-hidden_layer))
output_layer = np.dot(W2.T, hidden_layer_activation) + b2
output_layer_activation = 1 / (1 + np.exp(-output_layer))

print(output_layer_activation)

[[0.46269264]]


## Backpropagation

Backpropagation Neural Network atau jaringan saraf balik-propagasi adalah jenis jaringan saraf buatan yang menggunakan algoritma backpropagation untuk melakukan pelatihan atau training pada modelnya. Algoritma backpropagation digunakan untuk menentukan bagaimana setiap bobot dan bias pada setiap neuron dalam jaringan saraf perlu diperbarui selama pelatihan.

Dalam algoritma backpropagation, input diteruskan ke jaringan saraf dan menghasilkan output. Selanjutnya, output dibandingkan dengan nilai target, dan kesalahan antara output dan target dihitung. Kemudian, kesalahan tersebut dikembalikan ke seluruh jaringan dengan cara dihitung mundur (backpropagation) melalui setiap lapisan, sehingga setiap neuron dapat memperbarui bobot dan biasnya sesuai dengan kontribusinya terhadap kesalahan.

Dalam proses pelatihan jaringan, algoritma backpropagation akan menyesuaikan bobot dan bias pada setiap neuron dalam jaringan untuk meminimalkan kesalahan antara output yang dihasilkan oleh jaringan dan target yang diinginkan. Proses ini dilakukan secara iteratif, di mana pada setiap iterasi, input diteruskan melalui jaringan, kesalahan dihitung, dan bobot dan bias diperbarui untuk meningkatkan akurasi jaringan.

Learning rate atau tingkat pembelajaran adalah salah satu parameter penting dalam algoritma pembelajaran mesin yang menggunakan optimasi gradien. Learning rate adalah sebuah angka yang menentukan seberapa besar langkah pembelajaran yang diambil dalam menemukan nilai optimum dari fungsi objektif yang sedang dioptimasi.

Secara umum, learning rate mengontrol seberapa besar perubahan pada bobot dan bias yang diterapkan pada setiap iterasi saat menyesuaikan model agar lebih cocok dengan data latih. Jika learning rate terlalu kecil, maka model akan konvergen lebih lambat dan membutuhkan lebih banyak iterasi untuk mencapai hasil yang optimal. Sebaliknya, jika learning rate terlalu besar, model dapat "melompati" atau melewati titik optimal dan tidak dapat mencapai hasil yang baik. Oleh karena itu, pemilihan learning rate yang tepat adalah penting untuk memastikan model dapat dikonvergen secara efektif.

## Contoh Backpropagation

https://www.javatpoint.com/pytorch-backpropagation-process-in-deep-neural-network

https://hmkcode.com/ai/backpropagation-step-by-step/

In [7]:
import numpy as np

# Activation function and its derivative
def sigmoid(x):
    return 1/(1+np.exp(-x))

def sigmoid_derivative(x):
    return x*(1-x)

# Input dataset
X = np.array([[0.2, 0.8]])

# Output dataset
y = np.array([[0.9]])

# Seed random numbers to make calculation deterministic
np.random.seed(1)

# Initialize weights randomly with mean 0
W1 = np.random.random((2,2)) - 0.5
W2 = np.random.random((2,1)) - 0.5

# Initialize biases randomly with mean 0
b1 = np.random.random((1,2)) - 0.5
b2 = np.random.random((1,1)) - 0.5

print("awal\n", W1, W2, b1, b2)

# Set learning rate and number of iterations
learning_rate = 0.1
num_iterations = 10000

# Training algorithm
for i in range(num_iterations):
    # Feedforward
    hidden_layer_activation = sigmoid(np.dot(X, W1) + b1)
    output_activation = sigmoid(np.dot(hidden_layer_activation, W2) + b2)

    # Calculate error
    error = y - output_activation

    # Backpropagation
    d_predicted_output = error * sigmoid_derivative(output_activation)
    error_hidden_layer = d_predicted_output.dot(W2.T)
    d_hidden_layer = error_hidden_layer * sigmoid_derivative(hidden_layer_activation)

    # Update weights and biases
    W2 += hidden_layer_activation.T.dot(d_predicted_output) * learning_rate
    b2 += np.sum(d_predicted_output, axis=0, keepdims=True) * learning_rate
    W1 += X.T.dot(d_hidden_layer) * learning_rate
    b1 += np.sum(d_hidden_layer, axis=0, keepdims=True) * learning_rate

# Print final output
print("\n")
print("Output setelah training:")
print(output_activation, "\n")
print("akhir\n", W1, W2, b1, b2)

awal
 [[-0.082978    0.22032449]
 [-0.49988563 -0.19766743]] [[-0.35324411]
 [-0.40766141]] [[-0.31373979 -0.15443927]] [[-0.10323253]]


Output setelah training:
[[0.8999989]] 

akhir
 [[-0.08617661  0.22184212]
 [-0.51268008 -0.19159693]] [[0.28023948]
 [0.44125492]] [[-0.32973286 -0.14685115]] [[1.91517294]]
