# Support Vector Machine (SVM) - Máy vector hỗ trợ

## 1. Giới thiệu
Support Vector Machine (SVM) là một thuật toán học có giám sát được sử dụng cho các bài toán **phân loại (Classification)** và **hồi quy (Regression)**.
Nó hoạt động bằng cách tìm ra một siêu phẳng (hyperplane) tối ưu để phân tách các lớp dữ liệu với khoảng cách lớn nhất (Margin).

## 2. Cách hoạt động của SVM
Quá trình xây dựng mô hình SVM gồm các bước chính:

1. **Xác định siêu phẳng tối ưu**
   - Tìm một đường/hyperplane có khoảng cách lớn nhất đến các điểm dữ liệu gần nhất của mỗi lớp.
2. **Xử lý trường hợp dữ liệu không tách biệt tuyến tính**
   - Sử dụng **Kernel Trick** để ánh xạ dữ liệu sang không gian cao hơn.
3. **Tối ưu hóa hàm mục tiêu**
   - Dùng phương pháp lập trình bậc hai để tìm cực tiểu của hàm mất mát.

## 3. Các công thức toán học quan trọng

### 3.1 Hàm quyết định của SVM
Hàm quyết định của SVM có dạng:

$$
f(x) = w^T x + b
$$

Trong đó:
- \( w \) là vector trọng số.
- \( x \) là vector đầu vào.
- \( b \) là hệ số điều chỉnh.

### 3.2 Hàm mục tiêu của SVM
Mục tiêu là tìm **siêu phẳng tối ưu** bằng cách cực tiểu hóa hàm mục tiêu:

$$
\min_{w, b} \frac{1}{2} ||w||^2
$$

Với ràng buộc:

$$
y_i (w^T x_i + b) \geq 1, \quad \forall i
$$

Trong đó:
- \( y_i \) là nhãn của mẫu dữ liệu (±1).
- \( x_i \) là vector dữ liệu.

👉 **Khoảng cách giữa hai lớp (Margin) được tính là**:

$$
\text{Margin} = \frac{2}{||w||}
$$

### 3.3 Soft Margin SVM (Dùng khi dữ liệu không hoàn toàn tách biệt)
Khi dữ liệu bị nhiễu hoặc không thể tách tuyến tính hoàn toàn, ta dùng **biến trượt** \( \xi_i \) và điều chỉnh với hệ số phạt \( C \):

$$
\min_{w, b} \frac{1}{2} ||w||^2 + C \sum_{i=1}^{n} \xi_i
$$

Với ràng buộc:

$$
y_i (w^T x_i + b) \geq 1 - \xi_i, \quad \forall i
$$

👉 **Giá trị \( C \) càng lớn, mô hình càng nhạy với nhiễu (overfitting).**

### 3.4 Kernel Trick (Xử lý dữ liệu không tuyến tính)
Khi dữ liệu không thể phân tách bằng một siêu phẳng, ta sử dụng **hàm Kernel** để ánh xạ dữ liệu sang không gian cao hơn:

- **Linear Kernel:**
  $$ K(x, x') = x^T x' $$
  
- **Polynomial Kernel:**
  $$ K(x, x') = (x^T x' + c)^d $$
  
- **Radial Basis Function (RBF) Kernel:**
  $$ K(x, x') = e^{-\gamma ||x - x'||^2} $$
  
- **Sigmoid Kernel:**
  $$ K(x, x') = \tanh(\alpha x^T x' + c) $$

👉 **Hàm Kernel giúp SVM xử lý các bài toán phức tạp mà không cần trực tiếp tăng số chiều dữ liệu.**

## 4. Ứng dụng thực tế của SVM
- Phân loại email spam.
- Nhận diện chữ viết tay (OCR).
- Phát hiện gian lận trong giao dịch tài chính.
- Nhận diện khuôn mặt trong hình ảnh.
- Dự đoán bệnh dựa trên dữ liệu y tế.