# Chapter 7: Improving CNNs and Making Them Confess

Bab ini berfokus pada teknik lanjutan untuk meningkatkan performa model (mencegah overfitting) serta teknik interpretabilitas model agar kita memahami alasan di balik prediksi sebuah AI.

---

## 7.1 Image Data Augmentation
Augmentasi data adalah teknik kunci untuk mengurangi **overfitting** dengan cara memperbanyak variasi data tanpa harus mengambil gambar baru.
* **Metode**: Mengubah kontras (*contrast*), kecerahan (*brightness*), melakukan zoom, rotasi, pergeseran (*width/height shift*), hingga membalik gambar (*horizontal flip*).
* **Implementasi**: Sangat mudah dilakukan melalui `tf.keras.preprocessing.image.ImageDataGenerator` yang melakukan transformasi secara acak dan *on-the-fly* selama proses training.

---

## 7.2 Teknik Regularisasi: Dropout
Dropout membantu menciptakan jaringan yang lebih tangguh (*well-behaved*) dengan mencegah ketergantungan antar neuron.
* **Cara Kerja**: Mematikan (mengabaikan) neuron secara acak pada setiap iterasi selama fase *training*.
* **Manfaat**: Memaksa setiap neuron untuk mempelajari fitur yang berguna secara mandiri, sehingga model lebih tergeneralisasi dan tidak hanya menghafal data latihan.

---

## 7.3 Early Stopping
Metode optimasi yang menghentikan proses pelatihan secara otomatis sebelum jumlah *epoch* yang ditentukan selesai.
* **Logika**: Jika akurasi pada data validasi berhenti meningkat atau justru menurun (indikasi mulai overfitting), pelatihan akan dihentikan untuk mengambil versi model terbaik sebelumnya.
* **Keras Callback**: Diimplementasikan melalui `tf.keras.callbacks.EarlyStopping`.

---

## 7.4 Arsitektur Minception (Inception-ResNet)
Minception adalah evolusi dari Inception yang mengadopsi konsep **Residual Learning** untuk mempermudah pelatihan jaringan yang sangat dalam.

### 1. Implementasi Stem
Berbeda dengan model tradisional, Stem pada Minception menggunakan gabungan **BatchNorm + ReLU** setelah setiap operasi konvolusi.
* **Batch Normalization (BN)**: Menstabilkan proses latihan dengan menormalisasi input setiap lapisan, memungkinkan penggunaan *learning rate* yang lebih tinggi.

### 2. Inception-ResNet Blocks
* **Type A Block**: Menggunakan koneksi residual (penjumlahan input ke output) setelah penggabungan konvolusi paralel. Ini membantu gradien mengalir lebih baik.
* **Type B Block**: Versi yang lebih sederhana dengan dua jalur paralel, dirancang untuk efisiensi komputasi tanpa kehilangan kekuatan fitur.



---

## 7.5 Strategi Pelatihan: Learning Rate Scheduling
Selain arsitektur, jadwal penurunan *learning rate* sangat menentukan hasil akhir.
* **Konsep**: Saat model mulai mendekati nilai optimal, *learning rate* diperkecil secara bertahap agar model tidak melompati titik minimum global.
* **Hasil**: Meningkatkan generalisasi dan stabilitas model pada tahap akhir pelatihan.

---

## 7.6 Transfer Learning
Teknik "berdiri di atas bahu raksasa". Kita menggunakan model yang sudah dilatih pada dataset masif (seperti ImageNet) dan mengadaptasinya untuk tugas kita.
* **Proses**: Membekukan (*freeze*) lapisan awal model yang sudah pintar mengenali fitur umum, lalu melatih ulang lapisan akhir (*top layers*) untuk mengenali kelas spesifik kita.

---

## 7.7 Grad-CAM: Membuat Model "Mengaku"
**Grad-CAM (Gradient-weighted Class Activation Mapping)** digunakan untuk memvisualisasikan bagian mana dari gambar yang paling mempengaruhi keputusan model.
* **Mekanisme**: Menggunakan magnitudo gradien yang mengalir ke lapisan konvolusi terakhir.
* **Output**: Menghasilkan *heatmap* warna pada gambar asli. Bagian merah menunjukkan area yang menjadi alasan utama model memberikan label tertentu (misal: model mendeteksi "Anjing" karena melihat area telinga dan hidung).



---

## 7.8 Tips Praktis di Colab
Gunakan Callback untuk Early Stopping dan Learning Rate:

```python
from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau

# Berhenti jika val_loss tidak turun selama 5 epoch
early_stop = EarlyStopping(monitor='val_loss', patience=5)

# Kurangi learning rate jika val_loss stagnan
lr_reduction = ReduceLROnPlateau(monitor='val_loss', factor=0.2, patience=3)

# Masukkan ke dalam model.fit
# model.fit(train_data, callbacks=[early_stop, lr_reduction])