<a href="https://colab.research.google.com/github/KrituneX/Hands-on-Machine-Learning-with-Scikit-Learn-Keras-TensorFlow/blob/main/Chapter_19.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Chapter 19: Deployment with TensorFlow Serving
Ringkasan berdasarkan *Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow* oleh Aurélien Géron.

### 1. Tujuan dan Pentingnya Deployment
- Setelah model dilatih, penting untuk menyediakannya secara efisien agar dapat digunakan dalam aplikasi nyata.
- TensorFlow Serving adalah sistem fleksibel dan berkinerja tinggi untuk menyajikan model TensorFlow dalam produksi.

### 2. Arsitektur TensorFlow Serving
**Komponen Utama:**
- `ModelServer`: server utama yang menangani permintaan prediksi.
- `ModelConfig`: konfigurasi lokasi dan versi model.
- `REST API` atau `gRPC API`: protokol komunikasi antara client dan server.

TensorFlow Serving otomatis mendeteksi model baru jika disimpan dalam format direktori versi: `/models/my_model/1/`

### 3. Menyimpan Model dalam Format SavedModel
TensorFlow menggunakan format SavedModel sebagai standar untuk menyimpan model:
- Berisi arsitektur, bobot, dan informasi untuk serving.

```python
model.save("my_model")  # otomatis disimpan dalam format SavedModel
```

In [None]:
# Contoh penyimpanan model untuk serving
import tensorflow as tf

model = tf.keras.Sequential([
    tf.keras.layers.Dense(10, activation='relu', input_shape=(4,)),
    tf.keras.layers.Dense(3, activation='softmax')
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy')
# Simpan model ke direktori bernama versi (misal: 1)
model.save("/tmp/my_model/1")

### 4. Menjalankan TensorFlow Serving
Jika sudah menginstal TensorFlow Serving, gunakan perintah berikut untuk menjalankan server:

```bash
tensorflow_model_server \
  --rest_api_port=8501 \
  --model_name=my_model \
  --model_base_path="/tmp/my_model"
```
Model dapat diakses melalui REST API pada endpoint seperti:
`http://localhost:8501/v1/models/my_model:predict`

### 5. Format Request JSON (REST API)
```json
{
  "signature_name": "serving_default",
  "instances": [[1.0, 2.0, 5.0, 3.0]]
}
```
Balasan:
```json
{
  "predictions": [[0.01, 0.97, 0.02]]
}
```

### 6. Alternatif Deployment
- **TF Lite** untuk mobile/embedded.
- **TF.js** untuk browser.
- **ONNX** untuk interoperabilitas.
- **Docker** dapat digunakan untuk containerizing model dengan TF Serving.

### 📌 Kesimpulan
Deployment adalah tahap penting untuk membawa model ke lingkungan nyata.
TensorFlow Serving menyediakan metode production-grade untuk menyajikan model ML secara efisien dan scalable.