***notebook này tập trung vào việc tìm hiểu phân tích độ nhảy trên bộ dữ liệu và cách áp dụng***

Phân tích độ nhạy (sensitivity analysis) là một kỹ thuật quan trọng trong machine learning và các lĩnh vực khác của khoa học dữ liệu, nhằm hiểu rõ mức độ ảnh hưởng của các biến đầu vào đến kết quả của mô hình. Dưới đây là một cái nhìn chi tiết về kỹ thuật phân tích độ nhạy trong machine learning:

## 1. Khái niệm Phân tích Độ nhạy

Phân tích độ nhạy là quá trình thay đổi giá trị của các biến đầu vào và quan sát sự thay đổi tương ứng trong kết quả đầu ra của mô hình. Kỹ thuật này giúp xác định những biến nào có ảnh hưởng lớn nhất đến dự đoán của mô hình và những biến nào ít quan trọng hơn.

## 2. Mục tiêu của Phân tích Độ nhạy

- **Xác định biến quan trọng**: Giúp xác định những biến đầu vào quan trọng nhất ảnh hưởng đến kết quả đầu ra.
- **Hiểu mô hình**: Cung cấp cái nhìn sâu sắc hơn về cách mô hình hoạt động và cách nó phản ứng với sự thay đổi của các biến đầu vào.
- **Giảm số chiều**: Giúp giảm số lượng biến đầu vào cần thiết, từ đó làm đơn giản hóa mô hình và giảm chi phí tính toán.
- **Xác thực mô hình**: Đảm bảo rằng mô hình có phản ứng hợp lý với sự thay đổi của các biến đầu vào.

## 3. Các phương pháp Phân tích Độ nhạy

### 3.1. Phương pháp Một Biến tại Một Thời điểm (One-at-a-Time, OAT)

Phương pháp OAT thay đổi một biến đầu vào trong khi giữ các biến khác cố định. Điều này giúp xác định ảnh hưởng của từng biến riêng lẻ đến kết quả đầu ra.

**Ưu điểm**:
- Đơn giản và dễ hiểu.
- Dễ thực hiện.

**Nhược điểm**:
- Không xét đến tương tác giữa các biến.
- Có thể bỏ qua các tác động phức tạp của nhiều biến kết hợp.

### 3.2. Phân tích Độ nhạy Cục bộ (Local Sensitivity Analysis)

Phương pháp này xem xét sự thay đổi trong kết quả đầu ra khi các biến đầu vào thay đổi một lượng nhỏ xung quanh giá trị mặc định của chúng.

**Ưu điểm**:
- Tốt cho các mô hình tuyến tính hoặc gần tuyến tính.
- Đơn giản trong tính toán.

**Nhược điểm**:
- Không hiệu quả với các mô hình phi tuyến mạnh.
- Chỉ cung cấp thông tin về vùng lân cận của điểm đánh giá.

### 3.3. Phân tích Độ nhạy Toàn cục (Global Sensitivity Analysis)

Phương pháp này xem xét toàn bộ không gian đầu vào và đánh giá ảnh hưởng của các biến đầu vào trên toàn bộ miền giá trị của chúng. Phân tích độ nhạy toàn cục bao gồm các phương pháp như:

- **Phương pháp Phân rã phương sai (Variance-based methods)**: Phân rã tổng phương sai của đầu ra thành các thành phần do từng biến đầu vào và sự tương tác giữa chúng gây ra.
- **Phân tích Monte Carlo**: Sử dụng các mẫu ngẫu nhiên để ước lượng ảnh hưởng của các biến đầu vào.

**Ưu điểm**:
- Xét đến toàn bộ không gian đầu vào.
- Đánh giá cả tác động riêng lẻ và tương tác của các biến.

**Nhược điểm**:
- Yêu cầu tính toán phức tạp và tốn kém.
- Khó thực hiện với các mô hình rất phức tạp hoặc có nhiều biến đầu vào.

### 3.4. Phân tích Độ nhạy Cục bộ theo Nhóm (Group Sensitivity Analysis)

Phương pháp này xem xét sự thay đổi trong đầu ra khi một nhóm các biến đầu vào thay đổi đồng thời, giúp xác định ảnh hưởng của các nhóm biến.

**Ưu điểm**:
- Phát hiện các tương tác quan trọng giữa các biến.
- Hiệu quả hơn OAT trong việc nắm bắt tác động của nhiều biến.

**Nhược điểm**:
- Phức tạp hơn OAT.
- Có thể khó khăn trong việc chọn nhóm biến phù hợp.

## 4. Ứng dụng trong Machine Learning

- **Chọn đặc trưng (Feature Selection)**: Phân tích độ nhạy giúp chọn ra các đặc trưng quan trọng nhất để sử dụng trong mô hình, từ đó cải thiện hiệu suất và giảm độ phức tạp.
- **Giải thích mô hình (Model Interpretation)**: Giúp hiểu rõ cách mô hình đưa ra các dự đoán và độ nhạy của dự đoán với các biến đầu vào khác nhau.
- **Tối ưu hóa mô hình (Model Optimization)**: Xác định các biến cần được tối ưu hóa để cải thiện hiệu suất của mô hình.

## 5. Công cụ và Thư viện Phân tích Độ nhạy

- **Python**: Các thư viện như `SALib`, `scikit-learn` cung cấp các công cụ để thực hiện phân tích độ nhạy.
- **R**: Gói `sensitivity` cung cấp các hàm để thực hiện phân tích độ nhạy toàn cục và cục bộ.
- **MATLAB**: Các hàm và công cụ trong MATLAB hỗ trợ thực hiện phân tích độ nhạy cho các mô hình phức tạp.
