# Regresi Linear dengan Banyak Fitur

### **1. Pengantar**
- **Regresi Linear** adalah teknik yang digunakan untuk memprediksi nilai keluaran (y) berdasarkan satu atau lebih fitur input (x).
- Pada minggu ini, kita akan belajar cara mempercepat dan memperkuat model regresi linear.
- **Tujuan:** Memahami regresi linear dengan lebih dari satu fitur (disebut **multiple linear regression**).

---

### **2. Regresi Linear Sederhana (Univariate Regression)**
- **Univariate regression**: hanya menggunakan satu fitur untuk memprediksi nilai.
- Modelnya: `fwb(x) = wx + b`
  - **x:** ukuran rumah (fitur tunggal).
  - **y:** harga rumah (prediksi).
  - **w:** bobot (weight) yang mengukur pengaruh dari fitur x terhadap y.
  - **b:** bias, yaitu nilai dasar ketika tidak ada fitur.
  
**Contoh:**
- Misalkan kita ingin memprediksi harga rumah hanya berdasarkan **ukuran rumah** (fitur tunggal). Dalam hal ini, kita hanya memiliki satu fitur x, yaitu ukuran dalam kaki persegi.
  
---

### **3. Regresi Linear dengan Banyak Fitur (Multiple Linear Regression)**
- **Kasus baru:** kita tidak hanya menggunakan ukuran rumah, tetapi juga fitur-fitur lain seperti:
  - **X1:** ukuran rumah.
  - **X2:** jumlah kamar tidur.
  - **X3:** jumlah lantai.
  - **X4:** usia rumah.

#### **Mengapa Menggunakan Lebih Banyak Fitur?**
- Dengan lebih banyak fitur, kita memiliki informasi yang lebih lengkap untuk memprediksi harga rumah.
- Misalnya, **harga rumah** tidak hanya bergantung pada ukurannya, tetapi juga pada **jumlah kamar tidur**, **jumlah lantai**, dan **usia rumah**.

#### **Notasi untuk Fitur-Fitur:**
- **X_j:** menyatakan fitur ke-j. Misalnya, X1 adalah ukuran rumah, X2 adalah jumlah kamar tidur, dan seterusnya.
- **n:** menyatakan jumlah total fitur. Dalam contoh ini, `n = 4` (ada 4 fitur).
- **X^i:** menyatakan fitur-fitur untuk contoh data ke-i. Ini disebut sebagai **vektor** (daftar angka).
  
**Contoh:**
- Jika kita memiliki data contoh ke-2, maka `X^2 = [1416, 3, 2, 40]`, yang berarti:
  - Ukuran rumah: 1416 kaki persegi.
  - Jumlah kamar tidur: 3.
  - Jumlah lantai: 2.
  - Usia rumah: 40 tahun.

---

### **4. Model Regresi Linear dengan Banyak Fitur**
- Ketika kita memiliki banyak fitur, modelnya berubah menjadi:
  - **Model baru:** `fwb(X) = w1x1 + w2x2 + w3x3 + w4x4 + b`
  
**Penjelasan:**
- **w1, w2, w3, w4:** adalah bobot (weights) yang menyatakan pengaruh masing-masing fitur terhadap harga rumah.
- **b:** adalah bias (intercept) yang menyatakan harga dasar rumah tanpa mempertimbangkan fitur-fitur lainnya.

#### **Contoh Model:**
Misalkan kita ingin memprediksi harga rumah berdasarkan:
  - **X1:** ukuran rumah (dalam kaki persegi).
  - **X2:** jumlah kamar tidur.
  - **X3:** jumlah lantai.
  - **X4:** usia rumah (dalam tahun).

Model prediksinya bisa seperti ini:
  - `fwb(X) = 0.1 * X1 + 4 * X2 + 10 * X3 - 2 * X4 + 80`

#### **Interpretasi Model:**
- **b = 80**: harga dasar rumah adalah $80,000.
- **0.1 * X1:** setiap tambahan satu kaki persegi, harga rumah naik $100.
- **4 * X2:** setiap tambahan satu kamar tidur, harga rumah naik $4,000.
- **10 * X3:** setiap tambahan satu lantai, harga rumah naik $10,000.
- **-2 * X4:** setiap tambahan satu tahun usia rumah, harga rumah turun $2,000.

---

### **5. Notasi Vektor**
- Dalam regresi linear dengan banyak fitur, kita bisa menulis modelnya dengan lebih ringkas menggunakan **vektor**.
- **W:** vektor yang berisi semua bobot (weights) `w1, w2, ..., wn`.
- **X:** vektor yang berisi semua fitur `x1, x2, ..., xn`.

**Model yang Lebih Ringkas:**
  - **Model baru:** `fwb(X) = W · X + b`
  - **Dot product:** mengalikan setiap elemen yang sesuai dari dua vektor (W dan X), kemudian menjumlahkan hasilnya.

#### **Dot Product:**
  - Dot product dari dua vektor W dan X dihitung dengan mengalikan elemen yang sesuai dari kedua vektor, lalu menjumlahkan hasilnya:
    - `W · X = w1*x1 + w2*x2 + w3*x3 + ... + wn*xn`

---

### **6. Nama Model**
- Model ini disebut sebagai **Regresi Linear Berganda** (Multiple Linear Regression), karena kita menggunakan lebih dari satu fitur.
- Ini berbeda dengan **Regresi Linear Univariate** yang hanya menggunakan satu fitur.

---

### **7. Langkah Selanjutnya**
- Dalam implementasi model ini, kita akan menggunakan trik **vectorization** untuk mempercepat perhitungan dan menyederhanakan kode.
