## 📘 I. Linear Regression là gì?

**Linear Regression** là một thuật toán học có giám sát (supervised learning) dùng để **dự đoán biến liên tục** dựa trên một hoặc nhiều đặc trưng đầu vào (feature).

Mô hình giả định rằng **mối quan hệ giữa các biến là tuyến tính** – tức đầu ra là tổ hợp tuyến tính của các đầu vào.


## 🧮 II. Công thức toán học

### 1. **Simple Linear Regression** (1 biến đầu vào):

$$
\hat{y} = w x + b
$$

* $x$: đặc trưng đầu vào
* $\hat{y}$: giá trị dự đoán
* $w$: hệ số góc (trọng số)
* $b$: intercept (bias)

### 2. **Multiple Linear Regression** (n biến):

$$
\hat{y} = w_1 x_1 + w_2 x_2 + \cdots + w_n x_n + b = \mathbf{Xw} + b
$$

* $\mathbf{X} \in \mathbb{R}^{m \times n}$: ma trận đặc trưng
* $\mathbf{w} \in \mathbb{R}^n$: vector trọng số


## 🎯 III. Mục tiêu học

Tìm $\mathbf{w}, b$ sao cho mô hình dự đoán gần đúng **giá trị thật** nhất, tức là **giảm thiểu sai số**.


## 📉 IV. Hàm mất mát (Loss Function)

Sử dụng **Mean Squared Error (MSE)**:

$$
\mathcal{L}(\mathbf{w}, b) = \frac{1}{m} \sum_{i=1}^m (\hat{y}_i - y_i)^2 = \frac{1}{m} \sum_{i=1}^m (\mathbf{w}^\top \mathbf{x}_i + b - y_i)^2
$$

* Mục tiêu là **tối ưu (minimize)** hàm mất mát này


## ⚙️ V. Cách tìm tham số

Có 2 cách phổ biến:

### 1. **Closed-form solution** (Normal Equation)

$$
\mathbf{w} = (\mathbf{X}^\top \mathbf{X})^{-1} \mathbf{X}^\top \mathbf{y}
$$

✅ Chính xác, nhanh với tập dữ liệu nhỏ
❌ Tính nghịch đảo ma trận tốn thời gian với tập lớn

### 2. **Gradient Descent**

Cập nhật theo đạo hàm của hàm mất mát:

$$
\mathbf{w} := \mathbf{w} - \alpha \cdot \nabla_\mathbf{w} \mathcal{L}
$$

Trong đó:

* $\alpha$: learning rate
* Gradient:

$$
\nabla_\mathbf{w} = \frac{2}{m} \mathbf{X}^\top (\mathbf{Xw} + b - \mathbf{y})
$$

✅ Dùng được cho dữ liệu lớn
❌ Cần chọn learning rate hợp lý


## 🧠 VI. Giả định của Linear Regression

Linear Regression có một số **giả định quan trọng**:

| Giả định                           | Mô tả                                 |
| ---------------------------------- | ------------------------------------- |
| Tuyến tính                         | Quan hệ giữa X và y là tuyến tính     |
| Không tự tương quan                | Các lỗi không phụ thuộc nhau          |
| Đồng phương sai (Homoscedasticity) | Độ lệch chuẩn của lỗi không thay đổi  |
| Không đa cộng tuyến                | Các biến đầu vào không quá tương quan |
| Phân phối chuẩn                    | Lỗi có phân phối chuẩn (Gaussian)     |


## 🛡️ VII. Regularization (Ridge/Lasso)

Để tránh **overfitting**, ta thêm các điều kiện phạt (penalty term):

* **Ridge Regression** (L2):

$$
\mathcal{L}_{\text{ridge}} = \mathcal{L} + \lambda \|\mathbf{w}\|_2^2
$$

* **Lasso Regression** (L1):

$$
\mathcal{L}_{\text{lasso}} = \mathcal{L} + \lambda \|\mathbf{w}\|_1
$$

| Regularization | Ưu điểm                                                    |
| -------------- | ---------------------------------------------------------- |
| L1 (Lasso)     | Làm nhỏ hoặc triệt tiêu bớt trọng số – giúp chọn đặc trưng |
| L2 (Ridge)     | Làm nhỏ các trọng số – giảm overfitting                    |


## 📊 VIII. Đánh giá mô hình

| Chỉ số                    | Ý nghĩa                                         |
| ------------------------- | ----------------------------------------------- |
| MAE (Mean Absolute Error) | Sai số trung bình                               |
| MSE / RMSE                | Phạt sai số lớn nặng hơn                        |
| R² (R-squared)            | Đo mức độ giải thích của mô hình (gần 1 là tốt) |


## 🧪 IX. Thực hành với Scikit-learn (ví dụ nhanh)

```python
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

model = LinearRegression()
model.fit(X_train, y_train)

y_pred = model.predict(X_test)

print("MSE:", mean_squared_error(y_test, y_pred))
print("R²:", r2_score(y_test, y_pred))
```


## ✅ Tổng kết

| Mục        | Tóm tắt                               |
| ---------- | ------------------------------------- |
| Công thức  | $\hat{y} = \mathbf{Xw} + b$           |
| Mục tiêu   | Tối thiểu hóa sai số (MSE)            |
| Cách giải  | Normal Equation hoặc Gradient Descent |
| Vấn đề     | Overfitting, multicollinearity        |
| Giải pháp  | Lasso, Ridge (Regularization)         |
| Ưu điểm    | Dễ hiểu, nhanh, diễn giải tốt         |
| Nhược điểm | Chỉ học được quan hệ tuyến tính       |
