# Implementasi Gradient Descent untuk Multiple Linear Regression dengan Vektorisasi

### Ringkasan
Pada video ini, kita mempelajari cara mengimplementasikan **gradient descent** untuk **multiple linear regression** menggunakan vektorisasi. Kita akan menggunakan notasi vektor untuk menyederhanakan model dan fungsinya.

---

## 1. **Multiple Linear Regression dalam Notasi Vektor**

- **Model**: Sebelumnya, kita mendefinisikan model regresi linear sebagai:

  $$
  f_w, b(x) = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b
  $$

  - Dalam notasi vektor, model ini disederhanakan menjadi:

  $$
  f_w, b(x) = w \cdot x + b
  $$

  - **w**: Vektor parameter \([w_1, w_2, \dots, w_n]\)
  - **x**: Vektor fitur \([x_1, x_2, \dots, x_n]\)
  - **b**: Parameter bias yang tetap

---

## 2. **Fungsi Biaya (Cost Function)**

- Fungsi biaya **J(w, b)** digunakan untuk mengukur seberapa baik model memprediksi data:
  
  $$
  J(w, b) = \text{fungsi biaya terhadap vektor } w \text{ dan nilai bias } b
  $$

---

## 3. **Gradient Descent untuk Multiple Linear Regression**

- **Update Parameter**: Proses gradient descent akan mengupdate parameter **w** dan **b** secara berulang:

  $$
  w_j \leftarrow w_j - \alpha \frac{\partial J}{\partial w_j}
  $$
  $$
  b \leftarrow b - \alpha \frac{\partial J}{\partial b}
  $$

  Di mana:
  - \( \alpha \) adalah learning rate.
  - \( J \) adalah fungsi biaya.

  - **Derivatif**: Dalam kasus multiple linear regression, update parameter **w_j** mengikuti pola yang mirip dengan satu fitur, tetapi dengan vektor dan banyak fitur.

---

## 4. **Notasi dan Update untuk Banyak Fitur**

- **Notasi Baru**: Untuk multiple linear regression dengan **n fitur**:

  $$
  w_j \leftarrow w_j - \alpha \sum_{i=1}^{m} (h_{\theta}(x^{(i)}) - y^{(i)}) x_j^{(i)}
  $$
  
  Di mana:
  - \( h_{\theta}(x^{(i)}) = w \cdot x^{(i)} + b \) adalah prediksi untuk data ke-i.
  - \( x_j^{(i)} \) adalah fitur ke-j dari data ke-i.

---

## 5. **Alternative: Normal Equation**

- Selain gradient descent, kita bisa menggunakan **normal equation** untuk menemukan parameter **w** dan **b**:

  $$
  \theta = (X^T X)^{-1} X^T y
  $$

- **Kelebihan**:
  - Tidak memerlukan iterasi.
  
- **Kekurangan**:
  - Tidak umum digunakan untuk algoritma selain linear regression.
  - Lebih lambat jika jumlah fitur sangat besar.

- **Kesimpulan**: Gradient descent lebih umum dan lebih cepat untuk banyak algoritma selain regresi linear.

---

## 6. **Lab dan Implementasi**

- Dalam lab opsional, Anda akan:
  - Mengimplementasikan **multiple linear regression** menggunakan Python dan NumPy.
  - Menghitung prediksi \( f(x) \), biaya, dan mengimplementasikan gradient descent untuk model regresi linear.
  
  - Jika kode NumPy terlihat baru, Anda bisa merujuk ke lab sebelumnya yang membahas **NumPy** dan **vektorisasi**.

---

## 7. **Kesimpulan**

- **Multiple Linear Regression** adalah algoritma pembelajaran yang paling banyak digunakan saat ini.
- Beberapa trik seperti memilih dan menskalakan fitur serta memilih learning rate yang tepat dapat meningkatkan kinerja model secara signifikan.

---

**Selanjutnya**: Mari lanjutkan ke video berikutnya untuk mempelajari trik yang akan membuat regresi linear bekerja lebih baik lagi.

