# **GIẢI THUẬT 2: SUPPORT VECTOR MACHINE (SVM)**

## 1. Giải thuật Support Vector Machine (SVM) hoạt động như thế nào?

SVM là một thuật toán phân loại, tìm ra một ranh giới phân tách (hyperplane) tối ưu để chia các điểm dữ liệu thành các lớp khác nhau. Mục tiêu là tối đa hóa khoảng cách (margin) giữa ranh giới này và các điểm dữ liệu gần nhất của mỗi lớp.

## 2. Khái niệm về ranh giới phân tách (hyperplane) và lề (margin)

- Hyperplane: Là một mặt phẳng (trong không gian nhiều chiều) dùng để phân chia các lớp dữ liệu.  
- Margin: Là khoảng cách từ hyperplane đến các điểm dữ liệu gần nhất của mỗi lớp. SVM cố gắng tối đa hóa margin này để tăng khả năng tổng quát hóa.

## 3. Vai trò của các vector hỗ trợ (support vectors)

Support vectors là các điểm dữ liệu nằm gần nhất với hyperplane. Chúng quyết định vị trí và hướng của hyperplane. Nếu loại bỏ các điểm này, ranh giới phân tách sẽ thay đổi. Do đó, chúng rất quan trọng trong việc xác định mô hình SVM.

## 4. Sự khác biệt giữa SVM với lề cứng (hard margin) và lề mềm (soft margin)

- Hard margin: Không cho phép bất kỳ điểm dữ liệu nào bị phân loại sai. Chỉ dùng khi dữ liệu hoàn toàn tuyến tính và không có nhiễu.  
- Soft margin: Cho phép một số điểm bị phân loại sai, giúp mô hình linh hoạt hơn với dữ liệu thực tế có nhiễu. Nên dùng soft margin khi dữ liệu không hoàn toàn phân tách tuyến tính hoặc có outlier.

## 5. Hàm nhân (kernel) trong SVM là gì?

- Kernel là hàm dùng để biến đổi dữ liệu sang không gian mới, giúp SVM phân loại được dữ liệu phi tuyến.  
- Các loại kernel phổ biến:  
    + Linear kernel: Dùng cho dữ liệu tuyến tính.  
    + Polynomial kernel: Dùng cho dữ liệu có quan hệ phi tuyến, có thể điều chỉnh bậc đa thức.  
    + RBF (Radial Basis Function): Dùng cho dữ liệu phi tuyến, phổ biến nhất, phù hợp khi không biết rõ dạng phân tách.  

## 6. Tham số C trong SVM có ý nghĩa gì?



C là tham số điều chỉnh giữa việc tối đa hóa margin và giảm lỗi phân loại. C lớn → ưu tiên phân loại đúng, có thể giảm margin; C nhỏ → ưu tiên margin lớn, chấp nhận một số lỗi.

## 7. Code mẫu xây dựng mô hình SVM với Scikit-learn

In [1]:
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

# 1. Load dữ liệu
X, y = datasets.load_iris(return_X_y=True)

# 2. Chia tập train/test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. Chuẩn hóa dữ liệu
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# 4. Khởi tạo và huấn luyện mô hình SVM
model = SVC(kernel='rbf', C=1.0)
model.fit(X_train_scaled, y_train)

# 5. Đánh giá mô hình
accuracy = model.score(X_test_scaled, y_test)
print(f'Accuracy: {accuracy:.2f}')

Accuracy: 1.00


Các bước thực hiện:

1. Load dữ liệu.
2. Chia dữ liệu thành tập huấn luyện và kiểm tra.
3. Chuẩn hóa dữ liệu (scaling).
4. Khởi tạo và huấn luyện mô hình SVM.
5. Đánh giá mô hình.

## 8. Hàm chuẩn hóa dữ liệu trong Scikit-learn:



- Dùng StandardScaler hoặc MinMaxScaler trong sklearn.preprocessing.  
- Chuẩn hóa giúp SVM hoạt động hiệu quả hơn vì SVM nhạy cảm với độ lớn của các đặc trưng.