# Regresi Logistik: Penyederhanaan Fungsi Kehilangan dan Fungsi Biaya

Dalam video kali ini, kita akan mempelajari cara menulis ulang **fungsi kehilangan** dan **fungsi biaya** untuk regresi logistik dengan cara yang lebih sederhana. Tujuannya adalah untuk membuat implementasi lebih mudah saat kita mulai menggunakan **gradien descent** untuk menyesuaikan parameter model regresi logistik.

---

## 1. **Mengingat Fungsi Kehilangan untuk Regresi Logistik**

Sebagai pengingat, fungsi kehilangan yang kita definisikan sebelumnya untuk regresi logistik adalah sebagai berikut:

$$
L(f(x), y) = -y \cdot \log(f(x)) - (1 - y) \cdot \log(1 - f(x))
$$

Di mana:
- **f(x)** adalah prediksi model.
- **y** adalah label target, yang bisa bernilai 0 atau 1.

Karena **y** hanya dapat bernilai 0 atau 1, kita dapat menyederhanakan rumus ini menjadi bentuk yang lebih ringkas.

### **Fungsi Kehilangan yang Disederhanakan**

Fungsi kehilangan yang lebih sederhana adalah:

$$
L(f(x), y) = -y \cdot \log(f(x)) - (1 - y) \cdot \log(1 - f(x))
$$

Sekarang mari kita lihat mengapa rumus ini ekuivalen dengan rumus yang lebih kompleks yang kita gunakan sebelumnya.

---

## 2. **Mengapa Penyederhanaan Ini Bekerja**

### **Kasus 1: y = 1**
Jika **y = 1**, maka kita memiliki:
- \( y = 1 \) dan \( 1 - y = 0 \).
- Dengan demikian, rumusnya menjadi:
  
  $$
  L(f(x), 1) = -1 \cdot \log(f(x)) - 0 \cdot \log(1 - f(x)) = -\log(f(x))
  $$

Ini adalah **fungsi kehilangan** yang sesuai dengan **y = 1** yang kita definisikan sebelumnya.

### **Kasus 2: y = 0**
Jika **y = 0**, maka kita memiliki:
- \( y = 0 \) dan \( 1 - y = 1 \).
- Dengan demikian, rumusnya menjadi:
  
  $$
  L(f(x), 0) = 0 \cdot \log(f(x)) - 1 \cdot \log(1 - f(x)) = -\log(1 - f(x))
  $$

Ini adalah **fungsi kehilangan** yang sesuai dengan **y = 0** yang kita definisikan sebelumnya.

### **Kesimpulan**
Dengan demikian, fungsi kehilangan yang lebih sederhana ini:

$$
L(f(x), y) = -y \cdot \log(f(x)) - (1 - y) \cdot \log(1 - f(x))
$$

adalah ekuivalen dengan rumus yang lebih kompleks yang kita gunakan sebelumnya, tetapi lebih sederhana dan lebih efisien untuk implementasi.

---

## 3. **Fungsi Biaya untuk Regresi Logistik**

Sekarang kita akan menulis **fungsi biaya** untuk regresi logistik menggunakan fungsi kehilangan yang telah disederhanakan.

### **Fungsi Biaya**

Fungsi biaya untuk regresi logistik adalah rata-rata dari fungsi kehilangan untuk seluruh set pelatihan yang terdiri dari **m** contoh. Secara matematis, ini dapat dituliskan sebagai:

$$
J(w, b) = \frac{1}{m} \sum_{i=1}^{m} L(f(x^{(i)}), y^{(i)})
$$

Di mana:
- **m** adalah jumlah total contoh pelatihan.
- **L(f(x^{(i)}), y^{(i)})** adalah fungsi kehilangan untuk contoh pelatihan ke-i.

Jika kita menggantikan fungsi kehilangan yang disederhanakan ke dalam rumus ini, kita mendapatkan:

$$
J(w, b) = \frac{1}{m} \sum_{i=1}^{m} \left( -y^{(i)} \cdot \log(f(x^{(i)})) - (1 - y^{(i)}) \cdot \log(1 - f(x^{(i)})) \right)
$$

Jika kita menyatukan konstanta negatif di luar, kita dapat menulisnya sebagai:

$$
J(w, b) = -\frac{1}{m} \sum_{i=1}^{m} \left( y^{(i)} \cdot \log(f(x^{(i)})) + (1 - y^{(i)}) \cdot \log(1 - f(x^{(i)})) \right)
$$

Inilah **fungsi biaya** yang paling umum digunakan untuk melatih model regresi logistik. Fungsi biaya ini **konveks**, yang berarti kita dapat menggunakan **gradien descent** untuk menemukan parameter optimal **w** dan **b**.

---

## 4. **Mengapa Memilih Fungsi Biaya Ini?**

Mungkin Anda bertanya-tanya, mengapa kita memilih fungsi biaya ini ketika ada banyak fungsi biaya lain yang bisa digunakan? Meskipun kita tidak akan membahasnya secara mendalam dalam kursus ini, fungsi biaya ini sebenarnya berasal dari **maximum likelihood estimation (MLE)**, yaitu pendekatan statistik yang digunakan untuk mengestimasi parameter model.

Fungsi biaya ini memiliki sifat penting, yaitu **konveks**, yang memungkinkan kita menggunakan gradien descent untuk dengan aman menemukan **minimum global** tanpa terjebak di **minimum lokal**.

---

## 5. **Lab Opsional dan Implementasi Kode**

Di lab opsional yang akan datang, Anda akan melihat bagaimana **fungsi biaya regresi logistik** diimplementasikan dalam kode. Saya sangat menyarankan Anda untuk memeriksanya, karena ini akan membantu Anda memahami penerapan konsep ini secara praktis.

Lab ini juga akan menunjukkan bagaimana **dua pilihan parameter yang berbeda** akan menghasilkan perhitungan biaya yang berbeda. Anda akan dapat melihat bahwa **batas keputusan biru** yang lebih baik memiliki biaya lebih rendah dibandingkan dengan **batas keputusan magenta** yang lebih buruk.

---

## 6. **Persiapan untuk Gradient Descent**

Dengan fungsi biaya yang telah disederhanakan ini, kita siap untuk melanjutkan dan mengaplikasikan **gradien descent** pada **regresi logistik**. Pada video selanjutnya, kita akan melihat bagaimana cara menggunakan **gradien descent** untuk melatih model regresi logistik secara efektif.