# Chapter 6: Image Classification with CNNs

Bab ini membahas alur kerja profesional dalam klasifikasi gambar, mulai dari pembersihan data (EDA), pengelolaan memori melalui generator, hingga implementasi arsitektur Inception Net (GoogLeNet).

---

## 6.1 Analisis Data Berbasis Penjelajahan (EDA)
Sebelum melatih model, kita harus memastikan data berkualitas tinggi. **Exploratory Data Analysis (EDA)** meliputi:
* **Pembersihan**: Menghapus data *corrupt*, *outliers*, dan *noise* yang dapat membingungkan model.
* **Analisis Ketidakseimbangan (Class Imbalance)**: Memastikan jumlah gambar per kelas (kategori) relatif sama agar model tidak hanya condong memprediksi kelas mayoritas.
* **Feature Transformation**: Mengecek apakah gambar perlu diubah ukurannya, diputar, atau dinormalisasi warnanya.

---

## 6.2 Manajemen Dataset & Kelas
Menggunakan dataset besar seperti **Tiny ImageNet** (subset dari WordNet) memerlukan pengorganisasian yang rapi.
* **Struktur Folder**: Biasanya terdiri dari subfolder `train` untuk latihan dan `val` untuk validasi.
* **Mapping**: Gunakan fungsi seperti `get_tiny_imagenet_classes` dan buat `pd.DataFrame` (Pandas) untuk mendata indeks kelas dan jumlah sampel per kategori.

---

## 6.3 Komputasi Statistik & Dimensi Model
CNN memerlukan input dengan proporsi tetap (misal $224 \times 224$).
* Penting untuk mencatat persentil dimensi gambar asli untuk menentukan ukuran input yang paling optimal (tidak terlalu kecil sehingga kehilangan detail, tidak terlalu besar sehingga menghabiskan RAM).

---

## 6.4 Pipeline Menggunakan Keras ImageDataGenerator
Mengambil ribuan gambar langsung ke RAM akan menyebabkan *crash*. Solusinya adalah menggunakan **Generator**.
* **`flow_from_directory()`**: Membaca gambar langsung dari struktur folder.
* **`flow_from_dataframe()`**: Membaca gambar berdasarkan daftar nama file yang ada di tabel Pandas.
* **Efisiensi**: Generator hanya memuat gambar ke memori saat diperlukan per *batch*, jauh lebih efisien daripada memuat seluruh dataset ke dalam variabel `list`.



---

## 6.5 Arsitektur Inception Net (GoogLeNet)
Inception Net adalah terobosan dalam CNN yang menggunakan blok paralel untuk menangkap fitur dengan berbagai skala.

### 1. Struktur Stem
Bagian awal model yang terdiri dari urutan konvolusi dan pooling standar untuk mengecilkan dimensi gambar secara cepat sebelum masuk ke blok yang lebih berat.

### 2. Inception Blocks
Alih-alih memilih satu ukuran kernel (misal $3 \times 3$), Inception Block menjalankan konvolusi $1 \times 1$, $3 \times 3$, dan $5 \times 5$ secara paralel, lalu menggabungkan hasilnya (*concatenate*).
* **Keuntungan**: Sangat efisien dalam penggunaan parameter dan mampu menangkap detail kecil sekaligus pola besar secara bersamaan.



### 3. Auxiliary Classifiers
Pada versi awal (v1), terdapat cabang *output* tambahan di tengah jaringan untuk membantu aliran gradien dan mencegah masalah *vanishing gradient* pada jaringan yang sangat dalam.

---

## 6.6 Pelatihan dan Evaluasi
Proses penggabungan model meliputi `input -> stem -> inception blocks -> output`.
* **Epoch & Iterasi**: Satu *epoch* berarti model telah melihat seluruh dataset satu kali. Di dalam satu *epoch* terdapat ribuan iterasi (proses per *batch*).
* **Overfitting**: Jika akurasi *train* tinggi tapi *validation* rendah.
    * **Solusi**: Tambahkan **Regularization** (Dropout), gunakan **Pretrained Model** (Transfer Learning), atau tambah data augmentasi melalui `ImageDataGenerator`.

---

## 6.7 Tips Teknis Colab
Jika kamu melatih Inception Net yang kompleks, pastikan GPU aktif di Colab:
* *Edit > Notebook settings > Hardware accelerator > T4 GPU*.

```python
# Contoh memanggil InceptionV3 yang sudah jadi di Keras
from tensorflow.keras.applications import InceptionV3

model = InceptionV3(weights='imagenet', include_top=True)
model.summary()