Metrics(hoặc độ đo) là các chỉ số được sử dụng để đo lường và đánh giá hiệu suất mô hình dự đoán, phân loại. hay bất kì thuật toán nào khác.

# $R^2$ score

còn được gọi là hệ số xác định, là một độ đo được sử dụng để đánh giá mức độ phù hợp của mô hình hồi quy tuyến tính.
Giá trị của R-squared nằm trong khoảng (-∞,1], và nó thể hiện **tỷ lệ phương sai** của biến mục tiêu (y) đã được dự đoán bởi biến độc lập.

$R^2$ được tính bằng 1 - tổng bình phương các sai số(giá trị thực tế- giá trị dự đoán) / tổng bình phương sự khác biệt(giá trị thực tế - giá trị trung bình của dữ liệu mục tiêu)

**Công thức**:

 <font size =5> $R^2(y,\hat{y}) = 1 -  \frac{\sum_{i=1}^n (y_i - \hat{y_i})^2}{\sum_{i=1}^n (y_i - \bar{y})^2}$
 


In [1]:
from sklearn.metrics import r2_score

y_true = [3.0, 4.5, 5.0, 6.8, 8.2]
y_pred = [2.8, 4.3, 5.2, 6.5, 7.9]
r2 = r2_score(y_true, y_pred)

print("R2 Score:", r2)


R2 Score: 0.9817961165048544


=> càng gần 1 thì hiệu suất mô hình càng tốt


# Mean Absolute Error (MAE)

là một phép đo độ lỗi trong bài toàn dự đoán và regression.Nó đo lường sai số trung bình giữa các giá trị dự đoán và giá trị thực tế.

**Công thức**:

<font size =5> $ MAE = \frac {1}{n} \sum_{i=1}^n |y_i -\hat{y_i}| $ <font>

trong đó:
* $y_i$ là giá trị thực tế
* $\hat y_i$ là giá trị dự đoán

In [8]:
from sklearn.metrics import mean_absolute_error
mean_absolute_error(y_true, y_pred)
# |y_true-y_pred| = [0.2,0.2,0.2,0.3,0.3]

0.23999999999999985

# Mean Squared Error (MSE)

tính toán sai số trung bình bình phương, là độ đo rủi ro tương ứng với giá trị kỳ vọng của sai số bình phương

**Công thức:**

<font size =5> $ MSE = \frac{1}{n} \sum_{i=1}^n (\hat{y_i}-y_i)^2 $ <font>
    
trong đó:
    
* **n** là số lượng mẫu
* $\hat{y_i}$ là giá trị dự đoán mẫu thứ i
* $y_i$ là giá trị thực tế tương ứng thứ i

**Lưu ý**: MSE có thể rất **nhạy cảm với giá trị ngoại lai** (Outliers) vì nó tính bình phương sai số. Một giá trị ngoại lai lớn có thể làm tăng rất nhiều giá trị MSE và làm cho độ lỗi tổng quát trở nên không đáng tin cậy

In [4]:
from sklearn.metrics import mean_squared_error

mean_squared_error(y_true, y_pred)


0.0599999999999999

# Root Mean Squared Error (RMSE):

tỉnh toán sai số trung bình của sai số giữa giá trị dự đoán và giá trị thực tế

**Công thức:**

<font size =5> $ RMSE =\sqrt{ \frac{1}{n} \sum_{i=1}^n (\hat{y_i}-y_i)^2} $ <font>

In [17]:
from sklearn.metrics import mean_squared_error

np.sqrt(mean_squared_error(y_true, y_pred))


0.2449489742783176

# Mean squared logarithmic error (MSLE)

tương tự như MSE nhưng lấy logarit

**Công thức:**

<font size =5>$ MSLE = \frac {1}{n} \sum_{i=1}^n (ln(1+\hat{y_i}) - ln(1+y_i))^2 $ <font>

In [5]:
from sklearn.metrics import mean_squared_log_error

mean_squared_log_error(y_true, y_pred)

0.00154311270556465

# Mean Absolute Percentage Error (MAPE)

là độ đo đánh giá hiệu suất cho các bài toán hồi quy. Ý tưởng của phép đo này là nhạy cảm đổi với sai số tương đối.

**Công thức**:

<font size =5>$ MAPE = \frac{1}{n} \sum_{i=1}^n |\frac{y_i-\hat{y_i}}{max(ε,y_i)}|$<font>

trong đó: **ε** là một số nhỏ tùy ý tuyệt đối dương nhằm tránh kết quả không xác định khi *$y_i$* bằng 0

In [10]:
from sklearn.metrics import mean_absolute_percentage_error
mean_absolute_percentage_error(y_true, y_pred)

0.046362824804718636

# Median absolute error (MedAE)

lấy giá trị trung vị của tất cả sai số tuyệt đối giữa giá trị thực tế và giá trị dự đoán

<font size=5> $ MedAE = median(|y_1 - \hat{y_1}|,...,|y_n-\hat{y_n}|) $ <font>

In [11]:
from sklearn.metrics import median_absolute_error
median_absolute_error(y_true, y_pred)

0.20000000000000018

# Max error:

là phép đo lường sai số tệ nhất giữa giá trị dự đoán và giá trị thực tế => Cho cái nhìn về mức độ tệ nhất mà mô hình có thể đạt được

<font size=5> $ MaxError = max(|y_1 - \hat{y_1}|,...,|y_n-\hat{y_n}|) $ <font>

In [13]:
from sklearn.metrics import max_error

max_error(y_true, y_pred)

0.2999999999999998

# Explained variance score:

Điểm giải thích biến thiên. Đo lường sự **khác biệt giữa phương sai** của giá trị thực tế và giá trị dự đoán so với phương sai của giá trị thực tế.

**=>** là phép đo hữu ích để đánh giá khả năng mô hình trong việc giải thích sự biến thiên của dữ liệu.Nếu mô hình có khả năng giải thích nhiều phần của biến thiên trong dữ liệu, điểm giải thích biến thiên sẽ gần với 1, mô hình được coi là hiệu quả trong việc **mô phỏng dữ liệu** 

**Công thức**:

<font size =5> explained_variance(y,$\hat{y}$) = 1 - $\frac{Var(y-\hat{y)}}{Var(y)}$ <font>

In [15]:
from sklearn.metrics import explained_variance_score
explained_variance_score(y_true, y_pred)

0.9895631067961165

**=> Giá trị tốt nhất là 1**

# Choosing

- **MAE**: 
 * Sử dụng khi quan tâm đến độ lớn trung bình của sai số tuyệt đối và muốn biết giá trị trung bình của sai số dự đoán
 * Thích hợp trong các tình huống **không có giá trị ngoại lai lớn** ảnh hưởng đến kq
- **MSE**:
 * Sử dụng khi muốn đánh giá mức độ lớn của sai số và **làm nổi bật** các sai số lớn hơn
 * Thường sd trong tình huống mà **giá trị ngoại lai** có thể xuất hiện mà ta muốn **đo lường sự ảnh hưởng** của chúng
- **RMSE**:
 * Sd khi muốn biết độ lớn trung bình của sai số dưới dạng căn bậc hai, hay muốn **đơn vị giống với biến phụ thuộc**
 * Giúp trung bình hóa sai số và có tính **phù hợp để so sánh**

- **MSLE**: 
 * Sử dụng khi muốn đánh giá sai số ở dạng logarit tự nhiên, thường dùng cho dữ liệu dạng logarit hoặc biến đổi logarit.
 * Phù hợp trong các tình huống đo lượng **độ chênh lệch tỷ lệ**
 
- **MAPE**: 
 * Thường được sử dụng trong lĩnh vực tài chính và kinh tế để đo lường sai số tương đối dưới dạng phần trăm
 * Hữu ích khi quan tâm đến mức độ sai số tương đối của dự đoán.

- **MedAE**: Sử dụng khi quan tâm đến tính **ổn định** và không muốn sai số lớn ảnh hưởng nhiều.

- **Max Error**: 
 * Thường được sử dụng khi quan tâm đến **trường hợp xấu nhất** mà mô hình có thể đạt được
 * Nó giúp biết được **sai số tối đa** mà mô hình có thể tạo ra.




## R² Score vs Explained Variance Score

- **R² Score**: 
 * đo lường phần trăm biến thiên trong biến phụ thuộc (target) mà mô hình đã giải thích thành công
 * **Không** phản ánh trực tiếp **sai số giữa giá trị dự đoán và giá trị thực tế**
 * Tập trung vào đo lượng sự giải thích của mô hình **đối với phương sai** của biến phụ thuộc
- **Explained Variance Score**: 
 * đo lường khả năng mô hình giải thích sự biến đổi **tổng cộng** của dữ liệu. Nó cho biết mức độ mà mô hình có thể "hiểu" và "giải thích" sự biến đổi trong dữ liệu.
 * cũng **Không** phản ánh trực tiếp **sai số giữa giá trị dự đoán và giá trị thực tế**
 * **Tuy nhiên** điểm khác biệt đáng chú ý giữa chúng là Explained Variance score không tính đến sự sai lệch có hệ thống trong dự đoán của mô hình.



# uu nhuoc diem

* **$R^2$ Score:**
    * Ưu điểm: dễ hiểu, dễ so sánh do nằm trong khoảng (0,1)
    * Nhược điểm: Không phản ánh trực tiếp sai số
* **MAE**:
    * Ưu điểm: Dễ hiểu, thể hiện trực tiếp sai số
    * Nhược điểm: Khó khăn trong việc tính toán do chứa giá trị tuyệt đối, khó đạo hàm
* **MSE**:
    * Ưu điểm: Dễ hiểu, biểu diễn tốt sai số hơn cả, dễ thực hiện đạo hàm
    * Nhược điểm: Khi có outliers, dẫn đến giá trị vô cùng lớn, khó so sánh, kiểm soát
* **RMSE**:
    * Ưu điểm: Đỡ bị ảnh hưởng bởi outliers hơn, biểu diễn trực tiếp sai số do cùng đơn vị, dễ so sánh
    * Nhược điểm: Đạo hàm hơi khó khăn.