# **Regresi Logistik: Penjelasan Lengkap**

## **Pendahuluan**

Regresi logistik adalah salah satu algoritma klasifikasi yang paling banyak digunakan dalam machine learning. Algoritma ini digunakan untuk masalah klasifikasi biner, di mana outputnya hanya bisa **0** atau **1**, seperti menentukan apakah tumor bersifat **malignan** atau **jinak** berdasarkan beberapa fitur.

Artikel ini akan membahas secara mendalam mengenai **matematika**, **fungsi**, dan **aplikasi** dari regresi logistik dengan contoh kasus klasifikasi tumor.

## **Persiapan Masalah**

Bayangkan kita mencoba untuk mengklasifikasikan apakah sebuah tumor bersifat **malignan** atau **jinak**.

- Tumor **malignan** akan diwakili dengan **1** (kelas positif).
- Tumor **jinak** akan diwakili dengan **0** (kelas negatif).

Fitur **input** bisa berupa **ukuran tumor**, dan tujuan kita adalah untuk memprediksi apakah tumor tersebut bersifat **malignan** (**1**) atau **jinak** (**0**).

### **Visualisasi**

Data dapat divisualisasikan sebagai berikut:

- **Sumbu horizontal** menunjukkan **ukuran tumor** (fitur).
- **Sumbu vertikal** menunjukkan **label** tumor: **0** (jinak) atau **1** (malignan).

### **Regresi Linier vs. Regresi Logistik**

Pada umumnya, **regresi linier** tidak cocok untuk masalah klasifikasi biner seperti ini. Regresi linier menghasilkan output berupa nilai kontinu, yang bisa berada di antara nilai-nilai yang sangat besar atau sangat kecil. Namun, dalam klasifikasi biner, kita memerlukan nilai output yang terbatas antara **0** dan **1**. Di sinilah **regresi logistik** memainkan peranannya.

### **Model Regresi Logistik**

Alih-alih menghasilkan garis lurus seperti pada regresi linier, **regresi logistik** mencoba untuk memodelkan hubungan antara fitur input dengan probabilitas kelas. Hasil yang didapatkan bukan nilai kontinu, tetapi **probabilitas** bahwa sebuah contoh milik kelas positif (malignan). Dengan kata lain, output dari regresi logistik adalah sebuah angka antara **0 dan 1**, yang menunjukkan kemungkinan bahwa kelas tersebut adalah 1 (malignan).

### **Fungsi Sigmoid**

Untuk memodelkan probabilitas ini, regresi logistik menggunakan **fungsi sigmoid**, yang juga dikenal dengan **fungsi logistik**. Fungsi ini memetakan input dari domain yang tidak terbatas (nilai negatif hingga positif) ke rentang antara **0** dan **1**.

Fungsi sigmoid didefinisikan sebagai:

$$
g(z) = \frac{1}{1 + e^{-z}}
$$

Di sini:
- **$ e $** adalah konstanta matematika yang sekitar 2.7 (dikenal sebagai bilangan Euler),
- **$ z $** adalah nilai yang dihitung berdasarkan fitur input.

Fungsi sigmoid memiliki bentuk **S-shaped curve** (kurva berbentuk S) yang akan menjadikan outputnya mendekati **0** jika $ z $ sangat negatif, dan mendekati **1** jika $ z $ sangat positif.

#### **Karakteristik Fungsi Sigmoid:**
- Jika **z** sangat besar, outputnya akan mendekati **1**.
- Jika **z** sangat kecil atau negatif besar, outputnya akan mendekati **0**.
- Jika **z = 0**, maka output dari fungsi sigmoid adalah **0.5**.

### **Rumus Regresi Logistik**

Untuk membangun model regresi logistik, kita memulai dengan fungsi linear biasa, seperti dalam regresi linier:

$$
z = w \cdot x + b
$$

Di mana:
- **$ w $** adalah bobot (weights),
- **$ x $** adalah fitur input,
- **$ b $** adalah bias.

Kemudian, nilai **$ z $** ini diproses melalui fungsi sigmoid untuk menghasilkan probabilitas kelas:

$$
P(y = 1 | x) = g(w \cdot x + b) = \frac{1}{1 + e^{-(w \cdot x + b)}}
$$

Output ini memberikan probabilitas bahwa suatu input **x** termasuk dalam kelas positif (misalnya, tumor malignan).

## **Menginterpretasikan Output Regresi Logistik**

Mari kita kembali ke contoh klasifikasi tumor. Output dari model regresi logistik adalah probabilitas bahwa label **y** akan bernilai **1** (malignan) diberikan fitur input **x** (ukuran tumor).

Misalnya, jika model memberikan output **0.7**, itu berarti ada **70% kemungkinan** bahwa tumor tersebut **malignan**. Sebaliknya, jika outputnya **0.3**, maka ada **30% kemungkinan** tumor tersebut **malignan**, dan **70% kemungkinan** tumor tersebut **jinak**.

Jika Anda melihat notasi **$ P(y = 1 | x) $**, itu berarti **probabilitas** bahwa label **y** adalah **1** (malignan), diberikan fitur **x** dan parameter **w** serta **b**.

### **Probabilitas Kelas Negatif**

Karena **y** hanya bisa bernilai **0** atau **1**, maka jika probabilitas **y = 1** adalah 0.7, maka probabilitas **y = 0** adalah **0.3**. Kedua probabilitas ini selalu jumlahnya menjadi **1**.

### **Notasi dalam Penelitian dan Blog**

Dalam beberapa publikasi atau artikel, Anda mungkin menemukan notasi:

$$
f(x) = P(y = 1 | x; w, b)
$$

Notasi semacam ini menyatakan bahwa **f(x)** adalah fungsi yang menghasilkan probabilitas bahwa **y** = 1, dengan fitur input **x** dan parameter **w** serta **b**. Semicolon **( ; )** digunakan untuk menunjukkan bahwa **w** dan **b** adalah parameter model.

Untuk tujuan kelas ini, Anda tidak perlu terlalu khawatir dengan notasi tersebut. Cukup memahami konsep dasar di balik probabilitas yang dihasilkan oleh regresi logistik sudah cukup.

## **Aplikasi dan Implementasi**

Regresi logistik telah digunakan dalam berbagai aplikasi, seperti:

- **Iklan Internet**: Banyak sistem periklanan menggunakan variasi regresi logistik untuk memprediksi apakah seseorang akan mengklik iklan atau tidak.
- **Klasifikasi Medis**: Dalam diagnosis medis, seperti mengidentifikasi apakah tumor bersifat malignan atau jinak.
- **Sistem Rekomendasi**: Digunakan untuk memprediksi apakah pengguna akan menyukai produk atau tidak.

Pada video opsional berikutnya, Anda akan melihat implementasi fungsi sigmoid dalam kode dan bagaimana penggunaannya untuk menyelesaikan tugas klasifikasi.

## **Kesimpulan**

Sekarang Anda telah memahami apa itu **model regresi logistik**, bagaimana **fungsi sigmoid** digunakan untuk memetakan output ke rentang 0 hingga 1, serta cara **menginterpretasikan probabilitas** yang dihasilkan. Ini adalah fondasi dari banyak sistem klasifikasi yang digunakan dalam berbagai industri, mulai dari kesehatan hingga iklan digital.

Pada video selanjutnya, kita akan mempelajari lebih lanjut mengenai **decision boundary** dalam regresi logistik dan bagaimana kita bisa memetakan output seperti **0.3**, **0.7**, atau **0.65** ke dalam keputusan klasifikasi akhir (0 atau 1).

---

Sekian penjelasan tentang **regresi logistik**. Semoga membantu Anda dalam memahami dasar-dasar dari algoritma ini dan bagaimana ia diterapkan dalam dunia nyata.