<a href="https://colab.research.google.com/github/Bagito999/Deep-Learning/blob/main/Chapter_15_Teori.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#  Chapter 15 - Processing Sequences Using RNNs and CNNs

##  Tujuan Bab

Bab ini menjelaskan cara memproses data sekuensial seperti:
- Teks (NLP)
- Time series (data cuaca, harga saham)
- Audio (suara, ucapan)

Model yang dibahas:
- Recurrent Neural Networks (RNN)
- LSTM dan GRU
- 1D Convolutional Neural Networks (CNN)

---

##  Data Sekuensial

Karakteristik:
- Urutan penting (tidak bisa diacak)
- Panjang bisa bervariasi
- Korelasi temporal antar elemen

Contoh: “saya makan nasi” ≠ “nasi makan saya”

---

##  Recurrent Neural Networks (RNN)

###  Arsitektur

Setiap langkah waktu menggunakan:
- Input saat ini \($ x_t $\)
- State dari waktu sebelumnya \($ h_{t-1} $\)

Output dan state dihitung:

\[
$h_t = \phi(W_{xh} x_t + W_{hh} h_{t-1} + b_h)$
\]
\[
$y_t = W_{hy} h_t + b_y$
\]

- \($ \phi $\): fungsi aktivasi (biasanya tanh atau ReLU)

---

##  Masalah RNN Dasar

1. **Vanishing Gradients**: gradien menghilang saat backpropagation jangka panjang
2. **Exploding Gradients**: gradien membesar tak terkendali

Solusi:
- Truncated Backpropagation Through Time (TBPTT)
- Arsitektur canggih seperti **LSTM** dan **GRU**

---

##  LSTM (Long Short-Term Memory)

Memperkenalkan **cell state** \($ C_t $\) untuk membawa informasi jangka panjang.

###  Komponen utama:

- **Forget Gate**:

\[
$f_t = \sigma(W_f [h_{t-1}, x_t] + b_f)$
\]

- **Input Gate**:

\[
$i_t = \sigma(W_i [h_{t-1}, x_t] + b_i)$
\]
\[
$\tilde{C}_t = \tanh(W_C [h_{t-1}, x_t] + b_C)$
\]

- **Cell State Update**:

\[
$C_t = f_t \cdot C_{t-1} + i_t \cdot \tilde{C}_t$
\]

- **Output Gate**:

\[
$o_t = \sigma(W_o [h_{t-1}, x_t] + b_o)$
\]
\[
$h_t = o_t \cdot \tanh(C_t)$
\]

Kelebihan: dapat menyimpan dan membuang informasi sesuai konteks.

---

##  GRU (Gated Recurrent Unit)

Simplifikasi dari LSTM:
- Tidak memiliki cell state terpisah
- Menggabungkan forget dan input gate

###  Rumus GRU:

- **Update Gate**:

\[
$z_t = \sigma(W_z [h_{t-1}, x_t])$
\]

- **Reset Gate**:

\[
$r_t = \sigma(W_r [h_{t-1}, x_t])$
\]

- **Candidate Activation**:

\[
$\tilde{h}_t = \tanh(W_h [r_t \cdot h_{t-1}, x_t])$
\]

- **Final Output**:

\[
$h_t = (1 - z_t) \cdot h_{t-1} + z_t \cdot \tilde{h}_t$
\]

---

##  Bidirectional RNN

Melatih dua RNN:
- Satu membaca maju (left to right)
- Satu membaca mundur (right to left)

Output digabungkan: \($[h_t^{\rightarrow}, h_t^{\leftarrow}]$\)

Kelebihan:
- Dapat melihat konteks dari dua arah

---

##  1D Convolutional Neural Networks

Digunakan untuk data sekuensial dengan sifat lokal (misal: NLP)

- Filter berjalan sepanjang urutan
- Dapat menangkap fitur lokal seperti n-gram

Kelebihan:
- Cepat dilatih (komputasi paralel)
- Stabil
- Dapat dikombinasikan dengan RNN/LSTM

---

##  Pelatihan Model Sekuensial

- Padding untuk menyamakan panjang input
- Masking untuk mengabaikan padding
- Gunakan loss function sequence-aware (misalnya CTC loss untuk speech)

---

##  Aplikasi CNN & RNN dalam NLP

1. **Klasifikasi teks**: emosi, topik, spam
2. **Pemodelan bahasa**: prediksi kata berikutnya
3. **Machine translation**: input-output sekuens
4. **Speech recognition**

---

##  Model Hybrid

CNN + RNN:
- CNN mengekstraksi fitur lokal
- RNN menangani dependensi temporal global

---

##  Regularisasi dan Tuning

- Dropout antara langkah waktu
- Batch normalization (hati-hati untuk RNN)
- Gradient clipping untuk menghindari exploding gradient

---

##  Kesimpulan

- RNN efektif untuk memproses data sekuensial
- LSTM dan GRU mengatasi masalah jangka panjang
- CNN 1D cepat dan efektif untuk banyak tugas
- Bidirectional dan hybrid model memperkuat konteks
- Masking, padding, dan training khusus diperlukan

---

##  Referensi

Géron, A. (2019). *Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow*. O'Reilly Media.
