<a href="https://colab.research.google.com/github/Bagito999/Deep-Learning/blob/main/Chapter_19_Teori.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#  Chapter 19 - Training and Deploying TensorFlow Models at Scale

##  Tujuan

Memahami bagaimana cara:
- Menyimpan dan menyajikan model TensorFlow dalam produksi
- Men-deploy model ke cloud, perangkat mobile, dan embedded
- Mempercepat pelatihan dengan GPU atau distribusi
- Menggunakan TensorFlow Serving dan Cloud AI Platform

---

##  Serving a TensorFlow Model

### Konsep
Model dapat disimpan sebagai **SavedModel**, kemudian disajikan melalui:
- TensorFlow Serving (server REST/gRPC performa tinggi)
- Google Cloud AI Platform

Keuntungan:
- Mendukung banyak versi model
- Skalabilitas tinggi
- Dapat otomatis batch permintaan

---

##  Struktur SavedModel

saved_model.pb
variables/
variables.data-00000-of-00001
variables.index
assets/


---

##  Deployment ke Google Cloud AI Platform

### Langkah:
1. Simpan model dalam format SavedModel
2. Upload ke Google Cloud Storage
3. Buat model dan versi di AI Platform
4. Gunakan API prediksi

Keuntungan:
- Autoscaling
- Load balancing otomatis
- Integrasi pipeline data

---

##  Deploy ke Mobile dan Embedded Devices

Gunakan **TensorFlow Lite (TFLite)**:
- Mengonversi model ke format FlatBuffer
- Optimisasi post-training (kuantisasi)
- Mendukung inferensi cepat di Android/iOS/Edge

### 🔹 Post-Training Quantization

Mengubah bobot float32 ke int8:

\[
$w_q = \left\lfloor \frac{w}{m} \times 127 \right\rfloor$
\]

Hasil:
- Ukuran model 4x lebih kecil
- Inferensi lebih cepat

---

##  Mempercepat dengan GPU

Keuntungan GPU:
- Akselerasi pelatihan hingga 10–100x
- Diperlukan untuk model besar dan deep learning

Setup:
- GPU lokal (dengan CUDA & cuDNN)
- Cloud GPU instances (misalnya GCP, AWS)

---

##  Distributed Training

### Strategi:
- **Data Parallelism**: model digandakan, batch dibagi antar GPU
- **Model Parallelism**: layer dibagi ke device berbeda

### Sinkronisasi Gradient (AllReduce):

\[
$\bar{g} = \frac{1}{N} \sum_{i=1}^{N} g_i$
\]

Gunakan strategi:
- `tf.distribute.MirroredStrategy` (1 mesin, multi-GPU)
- `tf.distribute.MultiWorkerMirroredStrategy` (multi-node)
- `tf.distribute.TPUStrategy`

---

##  Training di Google Cloud AI Platform

### Setup Job:
```bash
gcloud ai-platform jobs submit training ...
--module-name trainer.task
--package-path ./trainer
--job-dir gs://your-bucket/model
```
### Fitur:
- Pre-configured environments
- Logging dan monitoring otomatis
- Auto hyperparameter tuning
---

##  Hyperparameter Tuning Otomatis

Google Cloud AI Platform menyediakan fitur **hyperparameter tuning otomatis**, yang memungkinkan pencarian konfigurasi optimal tanpa manual trial & error.

###  Langkah-langkah:

1. Tentukan hyperparameter yang ingin dituning:
   - `learning_rate`, `n_neurons`, `batch_size`, dsb.

2. Definisikan ruang pencarian:
   - Rentang nilai (linear/log scale)
   - Daftar nilai diskret

3. Pilih strategi:
   - **Grid search** (pencarian menyeluruh)
   - **Random search** (acak)
   - **Bayesian optimization** (prediktif & efisien)

4. AI Platform akan:
   - Menjalankan beberapa training job paralel
   - Mengevaluasi performa pada validation metric
   - Melaporkan kombinasi terbaik

---

##  Ringkasan Konsep dan Rumus

### 🔹 SavedModel Struktur:

saved_model.pb
variables/
variables.data-00000-of-00001
variables.index
assets/

### 🔹 Post-Training Quantization:

Transformasi bobot float ke int8:

\[
$w_q = \left\lfloor \frac{w}{m} \times 127 \right\rfloor$
\]

- \($ w $\): bobot asli (float)
- \($ m $\): nilai maksimum absolut dari bobot

### 🔹 Gradient Averaging (AllReduce):

Digunakan dalam training terdistribusi (data parallelism):

\[
$\bar{g} = \frac{1}{N} \sum_{i=1}^{N} g_i$
\]

- \($ g_i $\): gradien dari device ke-i
- \($ N $\): jumlah perangkat (GPU/TPU/VM)

---

##  Kesimpulan

- Model TensorFlow dapat disimpan dalam format **SavedModel** dan disajikan menggunakan **TensorFlow Serving** atau **Google Cloud AI Platform**.
- Untuk inferensi di mobile atau embedded devices, gunakan **TensorFlow Lite** yang ringan dan cepat.
- Untuk pelatihan skala besar, gunakan GPU, strategi pelatihan terdistribusi, dan API `tf.distribute`.
- **Hyperparameter tuning otomatis** mempercepat eksperimen dan meningkatkan performa model.
- Pelatihan dan deployment model membutuhkan **arsitektur produksi yang andal**, bukan hanya algoritma.

---

##  Referensi

- Géron, A. (2019). *Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow*. O'Reilly Media.

