Dưới đây là phiên bản **class** tích hợp cả 3 hàm mà bạn yêu cầu:

---

### **Class Tổng Hợp**
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import (
    r2_score,
    mean_squared_error,
    mean_absolute_error,
    mean_absolute_percentage_error,
)

class ModelAnalysis:
    def __init__(self, model, X_test, y_test):
        """
        Initialize the class with the trained model, test features, and target values.
        
        Parameters:
        -----------
        model : trained model
            A trained model with methods like `predict` and optional `coef_` attribute.
        X_test : array-like
            Test feature data.
        y_test : array-like
            Test target values.
        """
        self.model = model
        self.X_test = X_test
        self.y_test = y_test
        self.y_pred_test = self.model.predict(self.X_test)

    def evaluate_metrics(self, y_train, y_pred_train):
        """
        Evaluate the model's performance using various metrics for both training and test sets.
        
        Parameters:
        -----------
        y_train : array-like
            True values for training data.
        y_pred_train : array-like
            Predicted values for training data.
        """
        # Train metrics
        r2_train = r2_score(y_train, y_pred_train)
        mse_train = mean_squared_error(y_train, y_pred_train)
        rmse_train = np.sqrt(mse_train)
        mae_train = mean_absolute_error(y_train, y_pred_train)
        mape_train = mean_absolute_percentage_error(y_train, y_pred_train) * 100

        # Test metrics
        r2_test = r2_score(self.y_test, self.y_pred_test)
        mse_test = mean_squared_error(self.y_test, self.y_pred_test)
        rmse_test = np.sqrt(mse_test)
        mae_test = mean_absolute_error(self.y_test, self.y_pred_test)
        mape_test = mean_absolute_percentage_error(self.y_test, self.y_pred_test) * 100

        print("EVALUATE METRICS ON THE TRAIN SET")
        print(f"R2: {r2_train:.4f}")
        print(f"MSE: {mse_train:.4f}")
        print(f"RMSE: {rmse_train:.4f}")
        print(f"MAE: {mae_train:.4f}")
        print(f"MAPE: {mape_train:.2f}%\n")
        
        print("EVALUATE METRICS ON THE TEST SET")
        print(f"R2: {r2_test:.4f}")
        print(f"MSE: {mse_test:.4f}")
        print(f"RMSE: {rmse_test:.4f}")
        print(f"MAE: {mae_test:.4f}")
        print(f"MAPE: {mape_test:.2f}%\n")

    def visualize_predictions(self, num_samples=50):
        """
        Visualize predictions vs actual values using scatter and line plots.
        
        Parameters:
        -----------
        num_samples : int
            Number of samples to display (default is 50).
        """
        num_samples = min(num_samples, len(self.y_test))

        # Scatter plot
        plt.figure(figsize=(10, 5))
        plt.scatter(self.y_test, self.y_pred_test, alpha=0.5, label="Predictions")
        plt.plot(
            [min(self.y_test), max(self.y_test)],
            [min(self.y_test), max(self.y_test)],
            'r--', label="y = x"
        )
        plt.title("Predictions vs Actual Values")
        plt.xlabel("Actual Values")
        plt.ylabel("Predicted Values")
        plt.legend()
        plt.show()

        # Line plot
        plt.figure(figsize=(10, 5))
        plt.plot(range(num_samples), self.y_test[:num_samples], 'b-', label="Actual")
        plt.plot(range(num_samples), self.y_pred_test[:num_samples], 'orange', linestyle='--', label="Predicted")
        plt.title(f"Predictions for First {num_samples} Samples")
        plt.xlabel("Samples")
        plt.ylabel("Values")
        plt.legend()
        plt.show()

    def visualize_coefficients(self, feature_names, top_n=10):
        """
        Visualize the coefficients of a regression model.
        
        Parameters:
        -----------
        feature_names : list
            List of feature names.
        top_n : int
            Number of top features to display (default is 10).
        """
        if not hasattr(self.model, "coef_"):
            print("The model does not have coefficients to visualize.")
            return
        
        # Create a DataFrame of coefficients
        coefficients = pd.DataFrame({
            'Feature': feature_names,
            'Coefficient': self.model.coef_
        })

        # Sort by absolute value of coefficients
        coefficients = coefficients.sort_values(by='Coefficient', key=abs, ascending=False)

        # Plot top_n coefficients
        plt.figure(figsize=(10, 5))
        plt.bar(coefficients['Feature'][:top_n], coefficients['Coefficient'][:top_n])
        plt.xticks(rotation=45, ha='right')
        plt.title(f"Top {top_n} Features by Coefficients")
        plt.xlabel("Features")
        plt.ylabel("Coefficient")
        plt.tight_layout()
        plt.show()
```

---

### **Cách Sử Dụng Class**

1. **Khởi tạo đối tượng:**
   - Sau khi đã huấn luyện mô hình (vd: Lasso, Ridge), khởi tạo class với mô hình, `X_test`, và `y_test`.
   ```python
   analysis = ModelAnalysis(model=lasso_model, X_test=X_test, y_test=y_test)
   ```

2. **Đánh giá mô hình:**
   - Truyền thêm dữ liệu `y_train` và `y_pred_train` để đánh giá trên cả tập train và test.
   ```python
   analysis.evaluate_metrics(y_train, lasso_train_pred)
   ```

3. **Trực quan hóa dự đoán:**
   - Hiển thị dự đoán so với giá trị thực tế.
   ```python
   analysis.visualize_predictions(num_samples=50)
   ```

4. **Trực quan hóa hệ số:**
   - Hiển thị các hệ số quan trọng nhất của mô hình.
   ```python
   analysis.visualize_coefficients(feature_names=X_train.columns, top_n=10)
   ```

---

### **Ưu điểm**
- **Dễ sử dụng**: Tích hợp 3 chức năng chính trong một class.
- **Tương thích cao**: Có thể sử dụng với các mô hình như Lasso, Ridge, Linear Regression hoặc bất kỳ mô hình nào có `predict` và `coef_`.
- **Tùy chỉnh linh hoạt**: Bạn có thể thay đổi số lượng điểm hiển thị (`num_samples`) hoặc số lượng hệ số hàng đầu (`top_n`).

Hãy thử và cho mình biết nếu cần hỗ trợ thêm! 😊

Dưới đây là một class tổng hợp tất cả các hàm của bạn và có thể hoạt động với file dữ liệu, mô hình và các phương pháp trực quan hóa hoặc đánh giá:

### **Class Tổng Hợp**
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import (
    r2_score,
    mean_squared_error,
    mean_absolute_error,
    mean_absolute_percentage_error,
)

class ModelAnalysis:
    def __init__(self, filepath_dataset, model):
        """
        Initialize the class with the dataset filepath and the trained model.
        
        Parameters:
        -----------
        filepath_dataset : str
            Path to the dataset file (CSV format).
        model : trained model
            A trained model with methods like `predict` and attributes like `coef_` (optional).
        """
        self.filepath = filepath_dataset
        self.model = model
        self.data = None
        self.X = None
        self.y = None
        self._load_data()
    
    def _load_data(self):
        """
        Internal method to load the dataset.
        """
        self.data = pd.read_csv(self.filepath)
        print("Dataset loaded successfully.")
    
    def preprocess_data(self, feature_columns, target_column):
        """
        Preprocess the data to separate features and target.
        
        Parameters:
        -----------
        feature_columns : list
            List of feature column names.
        target_column : str
            Target column name.
        """
        self.X = self.data[feature_columns]
        self.y = self.data[target_column]
        print("Data preprocessed successfully.")
    
    def evaluate_model(self, y_train, y_pred_train, y_test, y_pred_test):
        """
        Evaluate the model performance using various metrics.
        """
        # Metrics for train set
        r2_train = r2_score(y_train, y_pred_train)
        mse_train = mean_squared_error(y_train, y_pred_train)
        rmse_train = np.sqrt(mse_train)
        mae_train = mean_absolute_error(y_train, y_pred_train)
        mape_train = mean_absolute_percentage_error(y_train, y_pred_train) * 100

        # Metrics for test set
        r2_test = r2_score(y_test, y_pred_test)
        mse_test = mean_squared_error(y_test, y_pred_test)
        rmse_test = np.sqrt(mse_test)
        mae_test = mean_absolute_error(y_test, y_pred_test)
        mape_test = mean_absolute_percentage_error(y_test, y_pred_test) * 100

        # Print metrics
        print("EVALUATE METRICS ON THE TRAIN SET")
        print("R2:", r2_train)
        print("MSE:", mse_train)
        print("RMSE:", rmse_train)
        print("MAE:", mae_train)
        print("MAPE%:", f"{mape_train:.2f}%\n")
        
        print("EVALUATE METRICS ON THE TEST SET")
        print("R2:", r2_test)
        print("MSE:", mse_test)
        print("RMSE:", rmse_test)
        print("MAE:", mae_test)
        print("MAPE%:", f"{mape_test:.2f}%\n")

    def plot_predictions(self, y_test, y_pred_test, num_samples=50):
        """
        Plot predictions vs actual values and a line plot for the first few samples.
        """
        # Giới hạn số lượng mẫu
        num_samples = min(num_samples, len(y_test), len(y_pred_test))

        fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 7))

        # Scatter plot
        ax1.scatter(y_test, y_pred_test, alpha=0.5)
        ax1.set_title("Predictions vs Actual")
        ax1.set_xlabel("Actual Values")
        ax1.set_ylabel("Predicted Values")
        
        # Thêm đường y=x
        min_val = min(min(y_test), min(y_pred_test))
        max_val = max(max(y_test), max(y_pred_test))
        ax1.plot([min_val, max_val], [min_val, max_val], 'r--')
        
        # Line plot
        x_points = range(num_samples)
        ax2.plot(x_points, y_test[:num_samples], 'b-', label='Actual')
        ax2.plot(x_points, y_pred_test[:num_samples], 'orange', linestyle='--', label='Predicted')
        
        ax2.set_title("Test Predictions")
        ax2.set_xlabel("Point")
        ax2.set_ylabel("Value")
        ax2.legend()
        
        plt.tight_layout()
        plt.show()
    
    def visualize_coefficients(self, top_n=10):
        """
        Visualize the model coefficients.
        
        Parameters:
        -----------
        top_n : int
            Number of top features to display (default is 10).
        """
        if not hasattr(self.model, "coef_"):
            print("The model does not have coefficients to visualize.")
            return
        
        # Tạo một DataFrame để lưu tên các biến và hệ số tương ứng của chúng
        coefficients = pd.DataFrame({
            'Feature': self.X.columns,  # Tên các biến (features)
            'Coefficient': self.model.coef_  # Lấy hệ số từ mô hình đã được huấn luyện
        })

        # Sắp xếp các hệ số theo giá trị tuyệt đối để tìm các biến có ảnh hưởng lớn nhất
        coefficients = coefficients.sort_values(by='Coefficient', key=abs, ascending=False)

        # Hiển thị các biến quan trọng nhất và hệ số của chúng
        print(f'\n{top_n} biến có ảnh hưởng lớn nhất:')
        print(coefficients.head(top_n))

        # 8. Tạo biểu đồ cột cho các hệ số của các biến
        plt.figure(figsize=(12, 6))
        plt.bar(
            coefficients['Feature'][:top_n],  # Trục X: tên các biến
            coefficients['Coefficient'][:top_n]  # Trục Y: giá trị hệ số
        )
        plt.xticks(rotation=45, ha='right')  # Xoay nhãn biến để dễ đọc hơn
        plt.xlabel('Feature')  # Nhãn trục X
        plt.ylabel('Coefficient')  # Nhãn trục Y
        plt.title(f'Top {top_n} Features by Coefficients')  # Tiêu đề biểu đồ
        plt.tight_layout()
        plt.show()
```

---

### **Cách Sử Dụng Class**

1. **Khởi tạo đối tượng với dataset và mô hình**:
   ```python
   analysis = ModelAnalysis(filepath_dataset="data.csv", model=trained_model)
   ```

2. **Tiền xử lý dữ liệu**:
   ```python
   analysis.preprocess_data(feature_columns=["col1", "col2", "col3"], target_column="target")
   ```

3. **Đánh giá mô hình**:
   ```python
   analysis.evaluate_model(y_train, y_train_pred, y_test, y_test_pred)
   ```

4. **Trực quan hóa dự đoán**:
   ```python
   analysis.plot_predictions(y_test, y_test_pred, num_samples=50)
   ```

5. **Trực quan hóa hệ số của mô hình**:
   ```python
   analysis.visualize_coefficients(top_n=10)
   ```

Hãy thử class này và cho mình biết nếu bạn cần hỗ trợ thêm nhé! 😊

### **Class ModelAnalysis - Summary**

**Mục đích**: Hỗ trợ phân tích và đánh giá các mô hình hồi quy (regression) bằng cách:
1. **Đánh giá hiệu suất** của mô hình trên tập train và test.
2. **Trực quan hóa dự đoán**: So sánh giá trị thực tế và giá trị dự đoán.
3. **Trực quan hóa hệ số (coefficients)**: Hiển thị mức độ ảnh hưởng của các biến đầu vào.

---

### **Các Chức Năng Chính**

1. **`evaluate_metrics(y_train, y_pred_train)`**:
   - Đánh giá hiệu suất mô hình trên tập train và test.
   - Sử dụng các chỉ số phổ biến:
     - **R²**: Mức độ giải thích của mô hình với dữ liệu.
     - **MSE, RMSE**: Đo độ chênh lệch bình phương (và căn bậc 2).
     - **MAE**: Sai số trung bình tuyệt đối.
     - **MAPE**: Sai số phần trăm trung bình.
   - **Đầu ra**: Bảng chỉ số hiệu suất cho cả tập train và test.

2. **`visualize_predictions(num_samples=50)`**:
   - So sánh giá trị dự đoán và thực tế.
   - **Biểu đồ scatter**: Hiển thị mối quan hệ giữa giá trị thực và giá trị dự đoán.
   - **Biểu đồ line**: So sánh trực tiếp từng mẫu (số mẫu được chọn qua `num_samples`).

3. **`visualize_coefficients(feature_names, top_n=10)`**:
   - Trực quan hóa các hệ số của mô hình (áp dụng với các mô hình có thuộc tính `coef_` như Lasso, Ridge, Linear Regression).
   - **Biểu đồ cột**: Hiển thị mức độ ảnh hưởng của các biến đầu vào (sắp xếp theo giá trị tuyệt đối của hệ số).
   - **Đầu vào**: 
     - `feature_names`: Tên các biến đầu vào.
     - `top_n`: Số lượng biến ảnh hưởng lớn nhất.

---

### **Ứng Dụng**
- **Đối tượng**: Các mô hình hồi quy tuyến tính có thể dự đoán và có hệ số (`coef_`), ví dụ:
  - Lasso Regression.
  - Ridge Regression.
  - Linear Regression.
- **Lợi ích**:
  - Đơn giản hóa việc phân tích mô hình.
  - Hỗ trợ phát hiện các yếu tố quan trọng và đánh giá độ chính xác dự đoán.
  - Tăng cường hiểu biết về cách mô hình hoạt động qua trực quan hóa.

---

### **Ví Dụ Kết Quả**
- **Đánh giá hiệu suất**:
  ```
  EVALUATE METRICS ON THE TRAIN SET
  R2: 0.9501
  MSE: 12.3456
  RMSE: 3.5124
  MAE: 2.7894
  MAPE: 5.67%

  EVALUATE METRICS ON THE TEST SET
  R2: 0.9234
  MSE: 14.6789
  RMSE: 3.8322
  MAE: 2.9871
  MAPE: 6.12%
  ```

- **Trực quan hóa dự đoán**:
  - Scatter plot: Điểm gần đường y = x chứng tỏ mô hình dự đoán chính xác.
  - Line plot: Dự đoán sát với giá trị thực qua từng mẫu.

- **Trực quan hóa hệ số**:
  - Hiển thị top 10 biến có ảnh hưởng lớn nhất, giúp xác định biến quan trọng trong dự đoán.

---

**Tóm lại**: Class `ModelAnalysis` là một công cụ tiện lợi và dễ hiểu để đánh giá hiệu suất, trực quan hóa kết quả, và phân tích mức độ ảnh hưởng của các biến trong mô hình hồi quy.