# Pengantar Neural Network

![Meme2](./images/meme2.jpg)

Sumber: https://www.meme-arsenal.com/en/create/meme/410387

Neural Network adalah salah satu model machine learning yang meniru cara kerja neuron pada otak manusia, didesain untuk mengenali pola. 

Mengapa perlu mempelajari metode yang terinspirasi dari alam atau makhluk hidup?

- Karena makhluk hidup/alam adalah salah satu *problem-solver* terbaik.
- Proses evolusi
- Kecerdasan alamiah dan beberapa penerapannya seperti: 
    - Celular automata
    - Komputasi evolusioner
    - *Particle Swarm Optimization*
    - Artificial Immune Systems
    - Artificial Neural Network

![Neuron](./images/neuron.jpg)

Sumber: https://simple.wikipedia.org/wiki/Neuron

Cara kerja neuron adalah sebagai berikut:

- **Dendrit** berfungsi sebagai penerima reseptor, dimana sel dapat menerima signal berukuran sangat besar dari neuron sekitarnya. 
- **Soma** berfungsi untuk mengumpulkan/mengagregasi semua signal yang diterima dari dendrit.
- **Axon** meneruskan signal hasil dari agregasi yang dilakukan soma. Signal ini memiliki semacam potensial listrik yang ketika mencapai ukuran tertentu, axon akan meneruskan signal ini melaluinya. Axon juga bertindak sebagai penghubung antar neuron lainnya.

## Struktur Neural Network

Struktur paling sederhana dari neural network adalah perceptron seperti pada gambar dibawah ini.

![Perceptron](./images/perceptron.png)

Sumber: https://www.researchgate.net/figure/Single-Layer-Perceptron-Network-Multilayer-Perceptron-Network-These-type-of-feed-forward_fig2_283339701


Secara sederhana, neural network bekerja berdasarkan beberapa bagian, diantaranya:

- *input*, bagian dimana kita dapat memasukkan beberapa variabel yang dipakai untuk pemodelan.
- *weight* atau bobot, bagian yang mengatur bagaimana tiap input dihitung
- *activation function*, bagian dimana tiap bobot tadi dihitung sehingga menghasilkan *output* yang diinginkan

Dalam bahasa matematika formal:

Input $\vec{x} \in \mathbb{R}$ dikali dengan nilai bobot $\vec{w}$ ditambah dengan nilai bias $b$ untuk menghasilkan nilai agregasi $z$. Nilai $z$ ini akan dibawa ke fungsi aktivasi $f(z)$ untuk memperoleh nilai output $\hat{y}$.

$$\hat{y} = f(z) = f(\vec{w} \bullet \vec{x} + b) = f(\sum_{i=1}^{n} w_{i} x_{i} + b)$$

## Fungsi Aktivasi

Fungsi aktivasi memberikan nilai output dari suatu neuron berdasarkan kombinasi dari nilai tiap input dan *weight*. Beberapa fungsi aktivasi yang biasa digunakan diantaranya adalah:

**Sigmoid Function**

![Sigmoid](./images/Activation_logistic.svg.png)

Sumber: https://en.wikipedia.org/wiki/Activation_function

Sigmoid function secara matematis didefinisikan sebagai berikut:

$$f(z) = \frac{1}{1+\exp{(-z)}}$$

Kelebihan:

- Menghindari nilai output yang melompat secara ekstrim
- Output berada di antara 0 dan 1

Kekurangan:

- Vanishing gradient, untuk nilai-nilai ekstrim, tidak ada perubahan signifikan pada hasil prediksi. Hal ini dapat menyebabkan model terlalu lama dalam membuat hasil prediksi
- Hanya untuk nilai biner
- Computational cost sangat besar

**Tanh Function**

![Tanh](./images/640px-Activation_tanh.svg.png)

Sumber: https://en.wikipedia.org/wiki/Activation_function

Tanh function secara matematis didefinisikan sebagai berikut:

$$f(z) = \tanh(z) = \frac{e^{z}-e^{-z}}{e^{z} + e^{-z}}$$

Kelebihan:

- Dapat digunakan untuk klasifikasi non-biner

Kekurangan:

- Mirip dengan sigmoid function

**Rectified Linear Unit (ReLU)**

![ReLU](./images/640px-Activation_rectified_linear.svg.png)

Sumber: https://en.wikipedia.org/wiki/Activation_function

ReLU secara matematis didefinisikan sebagai berikut:

$$
f(z)=
\begin{cases}
0, \text{jika } x \leq 0\\
z, \text{jika } x \gt 0
\end{cases}
$$

Kelebihan:

- Computational cost lebih rendah
- Non-linear

Kekurangan:

- Jika input bernilai negatif atau 0, maka neural network tidak dapat melakukan proses learning. Hal ini disebut sebagai *dying ReLU problem*.

**Leaky ReLU**

![Leaky](./images/640px-Activation_prelu.svg.png)

Sumber: https://en.wikipedia.org/wiki/Activation_function

Leaky ReLU merupakan pengembangan yang dibuat untuk mengatasi *dying ReLU problem*. Secara matematis dirumuskan sebagai berikut:

$$
f(z)=
\begin{cases}
0.01z, \text{jika } x \lt 0\\
z, \text{jika } x \geq 0
\end{cases}
$$

Kelebihan:

- Mirip seperti ReLU, namun tanpa *dying ReLU problem* 

Kekurangan:

- Hasil dari leaky ReLU tidak konsisten untuk input bernilai negatif

**Parametric ReLU**

Parametric ReLU pengembangan selanjutnya dari leaky ReLU. Secara matematis didefinisikan sebagai berikut:

$$
f(\alpha, z)=
\begin{cases}
\alpha z, \text{jika } x \lt 0\\
z, \text{jika } x \geq 0
\end{cases}
$$


Kelebihan:

- Tidak seperti leaky ReLU, fungsi ini dapat menerima input bernilai negatif

Kekurangan:

- Hasilnya tidak konsisten, tergantung dari masalah yang diselesaikan

**Softmax**

Softmax secara matematis didefinisikan sebagai berikut:

$$f(\vec{z}) = \frac{\exp{z_{i}}}{\Sigma^{J}_{i=j}{\exp{z_{j}}}}$$

Untuk $j = 1, ..., J$

Kelebihan: 

- Dapat digunakan untuk output yang lebih dari 2 atau multi-class

## Arsitektur Neural Network


Berikut merupakan beberapa arsitektur dari model neural network.

**Perceptron**

Perceptron adalah bentuk paling sederhana dari neural network, hanya terdiri dari penerima input dan fungsi aktivasi. Perceptron dapat dikatakan sebagai *building block* dari neural network.

![Perceptron](./images/perceptron.png)

Sumber: Sumber: https://www.researchgate.net/figure/Single-Layer-Perceptron-Network-Multilayer-Perceptron-Network-These-type-of-feed-forward_fig2_283339701

Secara matematis, perceptron bekerja sebagai berikut:

$\vec{x}$ dan $\vec{w}$ dipakai untuk mencari nilai dari $\hat{y}$:

$$\hat{y} = f(\vec{w} \bullet \vec{x} + b) = f(w_{1} x_{1} + ... + w_{n} x_{n} + b)$$

Dimana nilai $\hat{y} = f(\vec{x})$ didefinisikan sebagai berikut:

$$
f(\vec{x}) = \begin{cases}
        1, & \text{jika } \vec{w} \bullet \vec{x} + b > 0 \\
        0, & \text{lainnya }\\
\end{cases}
$$

Selanjutnya nilai bias dan bobot diperbaharui dengan cara seperti berikut:

$$w_{i} = w_{i} + \alpha(y - \hat{y}x_{i}), i=1,...,n$$

$$b = b+\alpha(y-\hat{y})$$

dengan $\alpha \in (0,1]$ disebut sebagai *learning rate*.

**Multi-Layered Perceptron**

Multi-layered perceptron, atau yang biasa disingkat sebagai MLP, adalah gabungan dari beberapa perceptron sehingga membentuk beberapa lapisan (*layer*). Biasanya MLP terdiri dari 3 lapis, yaitu input layer, hidden layer dan output layer.

![MLP](./images/Typical-structure-of-a-feed-forward-multilayer-neural-network.png)

Sumber: https://www.researchgate.net/figure/Typical-structure-of-a-feed-forward-multilayer-neural-network_fig1_291339457

Secara matematis MLP dirumuskan sebagai berikut:

$$y^{l}_{j} = f^{l}(z^{l}_{j})$$

dimana:

- $y^{l}_{j}$ adalah output ke-$j$ pada layer ke-$l$
- $x^{l}_{i}$ adalah input ke-$i$ pada layer ke-$l$
- $w^{l}_{ji}$ adalah bobot untuk neuron ke-$j$ yang terkoneksi dengan input ke-$i$ pada layer ke-$l$
- $z^{l}_{j}$ adalah hasil dot product antara $x^{l}_{j}$ dengan $w^{l}_{ji}$
- $f^{l}(z)$ adalah fungsi aktivasi pada layer ke-$l$

**Recurent Neural Network (RNN)**

Recurent neural network adalah neural network yang mempunyai *feedback loop*.

![RNN](./images/rnn.png)

Sumber: https://austingwalters.com/classify-sentences-via-a-recurrent-neural-network-lstm/

Terdapat beberapa arsitektur turunan dari RNN, diantaranya:

- Long-Short Term Memory (LSTM)

- Gated Recurent Unit (GRU)

![LSTM - GRU](./images/lstm-gru.png)

Sumber: https://towardsdatascience.com/illustrated-guide-to-lstms-and-gru-s-a-step-by-step-explanation-44e9eb85bf21

**Convolutional Neural Network**

Convolutional neural network pada dasarnya sama dengan MLP, hanya saja memiliki layer lain yang digunakan sebagai ekstraksi fitur pada data (biasanya gambar).

![CNN](./images/cnn.jpeg)

Sumber: https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53

![Contoh CNN](./images/Architecture-of-the-Residual-Network-for-Object-Photo-Classification.png)

Sumber: https://machinelearningmastery.com/review-of-architectural-innovations-for-convolutional-neural-networks-for-image-classification/

Pembahasan tentang CNN dan RNN serta penerapannya akan dibahas di bab khusus.

## Deep Learning Frameworks

![DL Frameworks](./images/dlframework.jpg)

Sumber: https://sisyphus.gitbook.io/project/deep-learning-basics/deep-learning-frameworks