# Gradient Descent untuk Logistic Regression

Dalam **logistic regression**, kita menggunakan **gradient descent** untuk menemukan parameter-model yang optimal (bobot dan bias) dengan cara meminimalkan fungsi biaya. Berikut adalah penjelasan tentang bagaimana **gradient descent** bekerja pada **logistic regression**.

### 1. Fungsi Prediksi (Hypothesis) pada Logistic Regression

Pada **logistic regression**, kita menggunakan fungsi **sigmoid** sebagai fungsi aktivasi untuk memetakan nilai input menjadi probabilitas antara 0 dan 1. Fungsi ini mengubah hasil dari persamaan linear menjadi probabilitas.

Fungsi **sigmoid** ($ \sigma $) adalah sebagai berikut:
$$
h_{\theta}(x) = \frac{1}{1 + e^{-z}}
$$
di mana $ z $ adalah hasil dari persamaan linear:
$$
z = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \dots + \theta_n x_n
$$
atau lebih ringkasnya:
$$
z = \theta^T x
$$
Di sini:
- $ \theta $ adalah parameter (bobot dan bias) model.
- $ x $ adalah fitur atau input.

### 2. Fungsi Biaya (Cost Function) untuk Logistic Regression

Untuk mengukur seberapa baik model kita memprediksi probabilitas (yaitu seberapa akurat prediksi terhadap label yang sebenarnya), kita menggunakan **binary cross-entropy loss** atau **log loss** sebagai fungsi biaya.

Fungsi biaya untuk **logistic regression** adalah sebagai berikut:

$$
J(\theta) = - \frac{1}{m} \sum_{i=1}^{m} \left[ y^{(i)} \log(h_{\theta}(x^{(i)})) + (1 - y^{(i)}) \log(1 - h_{\theta}(x^{(i)})) \right]
$$

di mana:
- $ m $ adalah jumlah total data.
- $ y^{(i)} $ adalah label aktual (0 atau 1) untuk data ke-i.
- $ h_{\theta}(x^{(i)}) $ adalah prediksi probabilitas untuk data ke-i.

Tujuan kita adalah meminimalkan fungsi biaya ini dengan menyesuaikan parameter $ \theta $.

### 3. Gradient Descent untuk Logistic Regression

Gradient descent adalah metode yang digunakan untuk meminimalkan fungsi biaya dengan cara mengupdate parameter model ($ \theta $) secara iteratif.

Langkah-langkah untuk menerapkan gradient descent pada logistic regression adalah sebagai berikut:

#### 3.1. Perhitungan Gradien (Turunan dari Fungsi Biaya)
Untuk mengupdate parameter $ \theta $, kita perlu menghitung turunan dari fungsi biaya $ J(\theta) $ terhadap setiap parameter $ \theta_j $. Gradien atau turunan ini memberi tahu kita arah perubahan yang perlu dilakukan pada parameter untuk mengurangi nilai fungsi biaya.

Gradien dari fungsi biaya terhadap $ \theta_j $ adalah:

$$
\frac{\partial J(\theta)}{\partial \theta_j} = \frac{1}{m} \sum_{i=1}^{m} \left( h_{\theta}(x^{(i)}) - y^{(i)} \right) x_j^{(i)}
$$

di mana:
- $ h_{\theta}(x^{(i)}) $ adalah prediksi model pada data ke-i.
- $ y^{(i)} $ adalah label yang sebenarnya.
- $ x_j^{(i)} $ adalah fitur ke-j untuk data ke-i.

#### 3.2. Update Parameter dengan Gradient Descent

Dengan gradien yang telah dihitung, kita dapat mengupdate parameter $ \theta_j $ dengan rumus:

$$
\theta_j := \theta_j - \alpha \frac{\partial J(\theta)}{\partial \theta_j}
$$

di mana:
- $ \alpha $ adalah **learning rate**, yaitu seberapa besar langkah perubahan yang kita ambil pada setiap iterasi.
- $ \theta_j $ adalah parameter model yang sedang diupdate.

#### 3.3. Proses Iteratif

Proses ini akan diulang hingga kita mencapai konvergensi, yaitu ketika perubahan dalam fungsi biaya sangat kecil atau tidak signifikan lagi. Di setiap iterasi, parameter $ \theta $ diperbarui untuk meminimalkan fungsi biaya.

### 4. Contoh Pseudocode untuk Gradient Descent pada Logistic Regression

Berikut adalah langkah-langkah dasar pseudocode untuk menerapkan gradient descent pada logistic regression:

```python
# Pseudocode untuk Gradient Descent Logistic Regression

# Inisialisasi parameter
theta = np.zeros(n+1)  # n adalah jumlah fitur, ditambah 1 untuk bias

# Set learning rate dan jumlah iterasi
alpha = 0.01
iterations = 1000

# Fungsi untuk menghitung prediksi menggunakan sigmoid
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# Fungsi biaya (cost function)
def cost_function(X, y, theta):
    m = len(y)
    h = sigmoid(np.dot(X, theta))
    return (-1/m) * np.sum(y * np.log(h) + (1 - y) * np.log(1 - h))

# Fungsi untuk menghitung gradien
def gradient_descent(X, y, theta, alpha, iterations):
    m = len(y)
    for i in range(iterations):
        h = sigmoid(np.dot(X, theta))  # Prediksi
        gradient = np.dot(X.T, (h - y)) / m  # Gradien
        theta -= alpha * gradient  # Update parameter
    return theta

# Jalankan gradient descent
theta = gradient_descent(X, y, theta, alpha, iterations)

# Output parameter optimal theta
print("Parameter optimal:", theta)
```

### 5. Kesimpulan

- **Logistic Regression** adalah model yang digunakan untuk klasifikasi biner (dua kelas), yang mengoutputkan probabilitas yang dipetakan antara 0 dan 1 dengan menggunakan fungsi sigmoid.
- **Gradient Descent** digunakan untuk menyesuaikan parameter model logistic regression ($ \theta $) dengan cara meminimalkan fungsi biaya (loss function).
- Proses gradient descent melibatkan perhitungan **gradien** dari fungsi biaya terhadap parameter $ \theta $ dan memperbarui parameter tersebut dengan langkah-langkah kecil, bergantung pada **learning rate**.

Dengan menggunakan gradient descent, kita dapat menemukan parameter optimal untuk model logistic regression yang memberikan prediksi terbaik berdasarkan data latih.