# Memahami **Decision Boundary** dalam Logistic Regression

Pada video sebelumnya, kita telah belajar tentang **model regresi logistik**. Sekarang, mari kita lihat lebih dalam tentang **decision boundary** untuk mendapatkan gambaran yang lebih baik tentang bagaimana **logistic regression** menghitung prediksi-prediksi ini.

### Pengulangan Proses Prediksi Regresi Logistik

Untuk mengingat kembali, berikut adalah bagaimana output model regresi logistik dihitung dalam dua langkah:
1. **Menghitung nilai $ z $** sebagai hasil dari $ w \cdot x + b $.
2. **Menerapkan fungsi Sigmoid** $ g(z) $ pada nilai $ z $, yang menghasilkan output $ f(x) = g(z) $.

Secara matematis, fungsi Sigmoid dinyatakan sebagai:

$$
f(x) = \frac{1}{1 + e^{-z}}
$$

di mana $ z = w \cdot x + b $.

Output $ f(x) $ akan berupa nilai antara 0 dan 1, yang biasanya diartikan sebagai **probabilitas** bahwa $ y = 1 $, dengan $ y $ adalah label kelas.

### Menentukan Kelas Berdasarkan Threshold

Untuk **memprediksi** apakah nilai $ y $ akan menjadi 0 atau 1, kita dapat menggunakan **threshold** tertentu. Biasanya, threshold ini adalah 0.5, yang berarti:

- Jika $ f(x) \geq 0.5 $, maka prediksi $ y = 1 $
- Jika $ f(x) < 0.5 $, maka prediksi $ y = 0 $

### Analisis Kapan Model Memilih Kelas 1

Fungsi Sigmoid menghasilkan output $ f(x) = g(z) $. Untuk menentukan kapan prediksi adalah 1, kita perlu mengetahui kapan $ g(z) \geq 0.5 $. Dengan melihat bentuk grafik dari fungsi Sigmoid, kita tahu bahwa:

- $ g(z) \geq 0.5 $ terjadi **ketika** $ z \geq 0 $.
- $ z $ sendiri didefinisikan sebagai $ w \cdot x + b $, jadi prediksi 1 terjadi **ketika** $ w \cdot x + b \geq 0 $.

Dengan kata lain, model memprediksi 1 ketika $ w \cdot x + b \geq 0 $, dan memprediksi 0 ketika $ w \cdot x + b < 0 $.

### Visualisasi Decision Boundary

Sekarang, mari kita lihat bagaimana model membuat prediksi dalam konteks **masalah klasifikasi dua fitur**. Misalkan kita memiliki dua fitur, $ x_1 $ dan $ x_2 $. Berikut adalah dataset pelatihan yang menunjukkan titik merah (positif, $ y = 1 $) dan titik biru (negatif, $ y = 0 $).

Model regresi logistik untuk dua fitur ini akan menggunakan rumus berikut:

$$
f(x) = g(w_1 x_1 + w_2 x_2 + b)
$$

Misalkan parameter-parameter model adalah $ w_1 = 1 $, $ w_2 = 1 $, dan $ b = -3 $.

Kita ingin mencari **batas keputusan** atau **decision boundary**. Decision boundary adalah **garis atau kurva** di mana model tidak dapat memutuskan antara kelas 0 dan 1, yakni ketika prediksi $ f(x) = 0.5 $.

- **Garis keputusan** terjadi ketika $ w_1 x_1 + w_2 x_2 + b = 0 $, atau dengan nilai parameter di atas, $ x_1 + x_2 - 3 = 0 $, yang memberikan garis keputusan $ x_1 + x_2 = 3 $.
  
Garis ini akan membagi ruang fitur menjadi dua bagian:
- **Di sebelah kanan garis**: Prediksi model adalah 1 (positif).
- **Di sebelah kiri garis**: Prediksi model adalah 0 (negatif).

#### Visualisasi Decision Boundary untuk Linear

Dengan parameter $ w_1 = 1 $, $ w_2 = 1 $, dan $ b = -3 $, decision boundary adalah garis $ x_1 + x_2 = 3 $. Berikut adalah beberapa contoh plot yang menggambarkan bagaimana garis keputusan membagi dua kelas:

- Titik di sebelah kanan garis (misalnya, $ x_1 = 2 $, $ x_2 = 2 $) akan diprediksi sebagai kelas 1.
- Titik di sebelah kiri garis (misalnya, $ x_1 = 1 $, $ x_2 = 1 $) akan diprediksi sebagai kelas 0.

### Decision Boundary dengan Fitur Polinomial

Sekarang, mari kita lihat bagaimana model regresi logistik berfungsi jika kita menambahkan **fitur polinomial**. Misalnya, kita menggunakan fitur kuadrat $ x_1^2 $ dan $ x_2^2 $, sehingga rumusnya menjadi:

$$
z = w_1 x_1^2 + w_2 x_2^2 + b
$$

Dengan memilih parameter $ w_1 = 1 $, $ w_2 = 1 $, dan $ b = -1 $, rumus menjadi:

$$
f(x) = g(x_1^2 + x_2^2 - 1)
$$

Decision boundary terjadi ketika $ x_1^2 + x_2^2 - 1 = 0 $, yang menghasilkan **lingkaran** dengan radius 1. Ini berarti:

- Titik di luar lingkaran (dimana $ x_1^2 + x_2^2 > 1 $) diprediksi sebagai kelas 1.
- Titik di dalam lingkaran (dimana $ x_1^2 + x_2^2 < 1 $) diprediksi sebagai kelas 0.

### Decision Boundary yang Lebih Kompleks

Dengan **menambahkan lebih banyak fitur polinomial** (misalnya, $ x_1 $, $ x_2 $, $ x_1^2 $, $ x_1x_2 $, $ x_2^2 $), kita bisa mendapatkan **decision boundary yang lebih kompleks**. Contoh bentuk decision boundary yang lebih rumit bisa berbentuk **elips** atau bentuk lainnya yang lebih tidak beraturan.

Model dengan fitur polinomial yang lebih tinggi memungkinkan regresi logistik untuk menangani data yang lebih kompleks, yang tidak bisa dipisahkan hanya dengan garis lurus.

### Kesimpulan

- **Decision boundary** adalah garis atau kurva yang memisahkan dua kelas dalam ruang fitur.
- Jika menggunakan fitur **linear**, decision boundary akan berbentuk **garis lurus**.
- Dengan menggunakan **fitur polinomial**, decision boundary bisa menjadi lebih **kompleks** (misalnya, **lingkaran** atau **elips**).
- **Regresi logistik** memungkinkan kita untuk memodelkan hubungan yang sederhana maupun kompleks, tergantung pada pemilihan fitur dan polinomial yang digunakan.

### Langkah Selanjutnya

Pada video berikutnya, kita akan belajar bagaimana melatih model **logistic regression** menggunakan **cost function** dan **gradient descent**. Dengan memahami decision boundary, kita sudah memiliki dasar untuk memahami cara model belajar dan mengoptimalkan parameter-parameter dalam regresi logistik.

**Tetap semangat dan ikuti video berikutnya!**