<a href="https://colab.research.google.com/github/yamenetoo/ABC-machine-learning/blob/main/Scikit-Learn/Sklearn_Metrics.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# 1	Introduction

In statistics and machine learning, metrics are quantitative measures or evaluation criteria used to assess the performance of a model. Metrics provide insights into how well a model is performing on a particular task, such as classification, regression, or clustering. The choice of metrics depends on the specific goals and characteristics of the problem at hand. Here are two main types of metrics:

1. **Regression Metrics:** These metrics are used when the problem involves predicting a continuous variable.

2. **Classification Metrics:**  These metrics are used when the problem involves categorizing data into classes or labels.

Metrics help data scientists and machine learning practitioners to:

- Quantify the performance of their models.
- Compare different models or algorithms.
- Identify areas for improvement and optimization.
- Make informed decisions about model deployment.

It's important to choose metrics that align with the goals and requirements of the specific machine learning task. Different metrics emphasize different aspects of model performance, and the selection should be tailored to the nature of the problem being addressed.
2	 Regression Metrics

2.1	 mean absolute error
   - Definition: Mean Absolute Error (MAE) measures the average absolute differences between actual and predicted values.

        $$ MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| $$
     Where \(n\) is the number of samples, $\(y_i\)$ is the actual value, and $\(\hat{y}_i\)$ is the predicted value.

   - Use Case: Commonly used for evaluating the performance of regression models.


2.2	mean squared error
   - Definition: Mean Squared Error (MSE) calculates the average squared differences between actual and predicted values.

        $$ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $$


   - Use Case: Similar to MAE but gives more weight to large errors.


2.3	median absolute error
   - Definition: Median Absolute Error is the median of the absolute differences between actual and predicted values.

       $$ MedAE = \text{median}(|y_1 - \hat{y}_1|, |y_2 - \hat{y}_2|, ..., |y_n - \hat{y}_n|) $$



   - Use Case: Similar to MAE but less sensitive to outliers.













#3	 Classification Metrics:

##3.1	 confusion matrix
   - Definition: Confusion Matrix is a table used to evaluate the performance of a classification algorithm, showing the counts of true positive, true negative, false positive, and false negative predictions.
   - Use Case: Provides insights into the model's performance on different classes.
     The confusion matrix is a table representing counts of true positives (TP), true negatives (TN), false positives (FP), and false negatives (FN). It is not expressed as a single formula.

##3.2	accuracy score
   - Definition: Accuracy Score measures the proportion of correctly classified instances out of the total instances.

   $$ Accuracy = \frac{TP + TN}{TP + TN + FP + FN} $$

   - Use Case: Commonly used for evaluating the overall performance of a classification model.
     

##3.3	f1 score
   - Definition: F1 Score is the harmonic mean of precision and recall, providing a balance between precision and recall.

      $$ F1 = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} $$

   - Use Case: Particularly useful when there is an uneven class distribution.
  

##3.4	recall score
   - Definition: Recall, or Sensitivity, measures the ability of a classifier to capture all relevant instances.

     $$ Recall = \frac{TP}{TP + FN} $$



   - Use Case: Important when minimizing false negatives is crucial.
##3.5	precision score
   - Definition: Precision measures the accuracy of positive predictions, emphasizing the reliability of positive classifications.

       $$ Precision = \frac{TP}{TP + FP} $$


   - Use Case: Important when minimizing false positives is crucial.
     

##3.6	precision recall fscore support
   - Definition: Provides precision, recall, and F1-score for each class in a multi-class classification problem.
   - Use Case: Offers detailed performance metrics for individual classes.

##3.7	precision recall curve
   - Definition: Plots precision and recall values for different probability thresholds.
   - Use Case: Helps visualize the trade-off between precision and recall at different decision thresholds.

##3.8	classification report
   - Definition: Generates a text report with precision, recall, F1-score, and support for each class.
   - Use Case: Summarizes classification metrics for multiple classes.

##3.9	roc curve
   - Definition: Receiver Operating Characteristic (ROC) curve plots the true positive rate against the false positive rate at various decision thresholds.
   - Use Case: Visualizes the trade-off between sensitivity and specificity.

##3.10	auc
   - Definition: Area Under the Curve (AUC) measures the area under the ROC
   curve, providing a single value to summarize classifier performance.

   $$ AUC = \int_{0}^{1} \text{TPR}(fpr) \, \text{d}fpr $$


   - Use Case: Quantifies the overall performance of a classifier.
     

  
##3.11	roc auc score
   - Definition: Computes the AUC from the ROC curve.

       $$ ROC \, AUC = \int_{0}^{1} \text{TPR}(fpr) \, \text{d}fpr $$


   - Use Case: Provides a single value to assess the classifier's discriminative ability.


    

##3.12	zero one loss
   - Definition: Zero-One Loss calculates the fraction of misclassifications.

        $$ Zero-One \, Loss = \frac{FP + FN}{TP + TN + FP + FN} $$


   - Use Case: Similar to accuracy but focuses on misclassifications.


These metrics provide a comprehensive set of tools for evaluating the performance of both regression and classification models, covering various aspects of model quality. Choose the metric(s) that align with the specific goals and requirements of your analysis.




<div dir="rtl">

# 1	مقدمه

در آمار و یادگیری ماشین، معیارها اندازه‌گیری‌های کمی یا معیارهای ارزیابی هستند که برای ارزیابی عملکرد یک مدل استفاده می‌شوند. معیارها به تحلیل عملکرد یک مدل در یک وظیفه خاص مانند طبقه‌بندی، رگرسیون یا خوشه‌بندی کمک می‌کنند. انتخاب معیارها به موارد خاص و ویژگی‌های مسئله وابسته است. دو نوع اصلی معیار وجود دارد:

1. **معیارهای رگرسیون:** این معیارها زمانی مورد استفاده قرار می‌گیرند که مسئله شامل پیش‌بینی یک متغیر پیوسته است.

2. **معیارهای طبقه‌بندی:** این معیارها زمانی استفاده می‌شوند که مسئله شامل دسته‌بندی داده‌ها به کلاس‌ها یا برچسب‌ها است.

معیارها به دیتاساینتیست‌ها و افراد علم داده کمک می‌کنند:

- عملکرد مدل‌های خود را به شکل کمی ارزیابی کنند.
- مدل‌ها یا الگوریتم‌های مختلف را مقایسه کنند.
- نقاط قوت و ضعف مدل را شناسایی و بهینه‌سازی کنند.
- تصمیمات آگاهانه درباره استقرار مدل بگیرند.

مهم است که معیارهایی انتخاب شوند که با اهداف و الزامات وظیفه خاص یادگیری ماشین هماهنگ باشند. معیارهای مختلف نکات مختلفی از عملکرد مدل را تأکید می‌کنند و انتخاب باید با ماهیت مسئله مورد نظر هماهنگ شود.

# 2	معیارهای رگرسیون

## 2.1	میانگین خطای مطلق
   - **تعریف:** میانگین خطای مطلق (MAE) میانگین اختلاف‌های مطلق بین مقادیر واقعی و پیش‌بینی شده است.

        $$ MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i| $$
     که \(n\) تعداد نمونه‌ها، \(y_i\) مقدار واقعی و \(\hat{y} i\) مقدار پیش‌بینی شده است.

   - **مورد استفاده:** معمولاً برای ارزیابی عملکرد مدل‌های رگرسیون استفاده می‌شود.

## 2.2	خطای میانگین مربعها
   - **تعریف:** خطای میانگین مربعها (MSE) میانگین اختلاف‌های مربعی بین مقادیر واقعی و پیش‌بینی شده است.

        $$ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 $$
     که \(n\) تعداد نمونه‌ها، \(y_i\) مقدار واقعی و \(\hat{y} i\) مقدار پیش‌بینی شده است.

   - **مورد استفاده:** مشابه با MAE اما به خطاهای بزرگ وزن بیشتری می‌دهد.

## 2.3	خطای میانهٔ مطلق
   - **تعریف:** خطای میانهٔ مطلق، میانه اختلافات مطلق بین مقادیر واقعی و پیش‌بینی شده است.

       $$ MedAE = \text{median}(|y_1 - \hat{y}_1|, |y_2 - \hat{y}_2|, ..., |y_n - \hat{y}_n|) $$
     که \(n\) تعداد نمونه‌ها، \(y_i\) مقدار واقعی و \(\hat{y}_i\) مقدار پیش‌بینی شده است.

   - **مورد استفاده:** مشابه با MAE اما به نوسانات ناگهانی کمتر حساس است.

# 3	معیارهای طبقه‌بندی

## 3.1	ماتریس گیجن
   - **تعریف:** ماتریس گیجن یک جدول استفاده می‌شود برای ارزیابی عملکرد الگوریتم

 طبقه‌بندی، نمایش تعداد پیش‌بینی‌های واقعی مثبت، واقعی منفی، مثبت غلط و منفی غلط.
   - **مورد استفاده:** برای درک عملکرد مدل در کلاس‌های مختلف.

## 3.2	امتیاز دقت
   - **تعریف:** امتیاز دقت نسبت پیش‌بینی‌های صحیح به کل نمونه‌ها را اندازه‌گیری می‌کند.

   $$ دقت = \frac{TP + TN}{TP + TN + FP + FN} $$

   - **مورد استفاده:** معمولاً برای ارزیابی عملکرد کلی یک مدل طبقه‌بندی استفاده می‌شود.

## 3.3	امتیاز F1
   - **تعریف:** امتیاز F1 میانگین هندسی از دقت و بازخوانی است، تعادلی بین دقت و بازخوانی فراهم می‌کند.

      $$ F1 = \frac{2 \times \text{دقت} \times \text{بازخوانی}}{\text{دقت} + \text{بازخوانی}} $$

   - **مورد استفاده:** به ویژه زمانی که توزیع ناهموار کلاس‌ها وجود دارد، مفید است.

## 3.4	امتیاز بازخوانی
   - **تعریف:** بازخوانی یا حساسیت، توانایی یک طبقه‌بند در گرفتن همه نمونه‌های مربوط را اندازه‌گیری می‌کند.

     $$ بازخوانی = \frac{TP}{TP + FN} $$

   - **مورد استفاده:** زمانی که کاهش تعداد منفی‌های غلط بسیار حیاتی است.

## 3.5	امتیاز دقت
   - **تعریف:** دقت دقت پیش‌بینی‌های مثبت را اندازه‌گیری می‌کند و قابلیت پیش‌بینی مثبت‌ها را تأکید می‌کند.

       $$ دقت = \frac{TP}{TP + FP} $$

   - **مورد استفاده:** زمانی که کاهش مثبت‌های غلط بسیار حیاتی است.

## 3.6	امتیاز دقت-بازخوانی-F1-پشتیبانی
   - **تعریف:** ارائه دقت، بازخوانی و امتیاز F1 برای هر کلاس در یک مسئله طبقه‌بندی چندکلاسه.
   - **مورد استفاده:** معیارهای عملکرد دقیق برای هر کلاس را ارائه می‌دهد.

## 3.7	نمودار دقت-بازخوانی
   - **تعریف:** نمودار دقت و بازخوانی را برای آستانه‌های احتمال مختلف رسم می‌کند.
   - **مورد استفاده:** به تصویر کشیدن تعادل میان دقت و بازخوانی در آستانه‌های تصمیم مختلف کمک می‌کند.

## 3.8	گزارش طبقه‌بندی
   - **تعریف:** یک گزارش متنی با دقت، بازخوانی، امتیاز F1 و پشتیبانی برای هر کلاس تولید می‌کند.
   - **مورد استفاده:** خلاصه‌ای از معیارهای طبقه‌بندی برای چندین کلاس را ارائه می‌دهد.

## 3.9	نمودار ROC
   - **تعریف:** نمودار مشخصه عملکرد گیرنده عملکرد (ROC) نرخ واقعی مثبت را در برابر نرخ مثبت غلط در آستانه‌های تصمیم مختلف رسم می‌کند.
   - **مورد استفاده:** تعادل میان حساسیت و اختصاص در آستانه‌های مختلف را بصری می‌کند.

## 3.10	مساحت زیر نمودار
   - **تعریف:** مساحت زیر نمودار ROC را اندازه‌گیری می‌کند و یک مقدار تکی برای خلاصه عملکرد طبقه‌بندی ارائه می‌دهد.

   $$ مساحت زیر نمودار = \int_{0}^{1} \text{TPR}(fpr) \, \text{d}fpr $$



   - **مورد استفاده:** عملکرد کلی طبقه‌بندی را به صورت یک عدد تومانی مشخص می‌کند.

## 3.11	امتیاز ROC AUC
   - **تعریف:** امتیاز ROC AUC از منحنی ROC محاسبه می‌شود.

       $$ امتیاز ROC AUC = \int_{0}^{1} \text{TPR}(fpr) \, \text{d}fpr $$

   - **مورد استفاده:** یک مقدار تکی برای ارزیابی توانایی تمییزدهی طبقه‌بندی ارائه می‌دهد.

## 3.12	خطای صفر یک
   - **تعریف:** خطای صفر یک نسبت تعداد اشتباهات دسته‌بندی شده به تعداد کل نمونه‌ها را محاسبه می‌کند.

        $$ خطای صفر یک = \frac{FP + FN}{TP + TN + FP + FN} $$

   - **مورد استفاده:** مشابه با دقت اما بر روی اشتباهات تمرکز دارد.

این معیارها مجموعه جامعی از ابزارها برای ارزیابی عملکرد مدل‌های رگرسیون و طبقه‌بندی فراهم می‌کنند و جوانب مختلفی از کیفیت مدل را پوشش می‌دهند. معیار(های) را که با اهداف و الزامات ویژه وظیفه خاص یادگیری ماشین هماهنگ هستند، انتخاب کنید.
</div>

In [1]:
from sklearn.metrics import mean_absolute_error, mean_squared_error, median_absolute_error
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, recall_score, precision_score
from sklearn.metrics import precision_recall_fscore_support, precision_recall_curve, classification_report
from sklearn.metrics import roc_curve, auc, roc_auc_score, zero_one_loss

In [2]:
# Example data
# for regrassion
y_true_regression = [2.5, 1.5, 3.0, 7.0]
y_pred_regression = [3.0, 1.5, 2.5, 6.5]

# for classification
y_true_classification = [1, 0, 1, 1, 0, 1, 0, 0, 1, 1]
y_pred_proba_classification = [0.8, 0.3, 0.9, 0.6, 0.2, 0.7, 0.1, 0.4, 0.85, 0.92]
y_pred_classification = [1, 0, 1, 0, 0, 1, 0, 0, 1, 1]


In [None]:

# Regression Metrics

# 2.1 mean absolute error
mae = mean_absolute_error(y_true_regression, y_pred_regression)
print(f'Mean Absolute Error: {mae}')

# 2.2 mean squared error
mse = mean_squared_error(y_true_regression, y_pred_regression)
print(f'Mean Squared Error: {mse}')

# 2.3 median absolute error
medae = median_absolute_error(y_true_regression, y_pred_regression)
print(f'Median Absolute Error: {medae}')




In [None]:
# Classification Metrics

# 3.1 confusion matrix
conf_matrix = confusion_matrix(y_true_classification, y_pred_classification)
print(f'Confusion Matrix:\n{conf_matrix}')

# 3.2 accuracy score
accuracy = accuracy_score(y_true_classification, y_pred_classification)
print(f'Accuracy Score: {accuracy}')

# 3.3 f1 score
f1 = f1_score(y_true_classification, y_pred_classification)
print(f'F1 Score: {f1}')

# 3.4 recall score
recall = recall_score(y_true_classification, y_pred_classification)
print(f'Recall Score: {recall}')

# 3.5 precision score
precision = precision_score(y_true_classification, y_pred_classification)
print(f'Precision Score: {precision}')

# 3.6 precision recall fscore support
precision_recall_fscore = precision_recall_fscore_support(y_true_classification, y_pred_classification)
print(f'Precision, Recall, F1-Score, Support:\n{precision_recall_fscore}')

# 3.7 precision recall curve
precision, recall, thresholds = precision_recall_curve(y_true_classification, y_pred_proba_classification)

# 3.8 classification report
class_report = classification_report(y_true_classification, y_pred_classification)
print(f'Classification Report:\n{class_report}')

# 3.9 roc curve
fpr, tpr, thresholds = roc_curve(y_true_classification, y_pred_proba_classification)

# 3.10 auc
roc_auc = auc(fpr, tpr)
print(f'AUC (Area Under the Curve): {roc_auc}')

# 3.11 roc auc score
roc_auc_score_value = roc_auc_score(y_true_classification, y_pred_proba_classification)
print(f'ROC AUC Score: {roc_auc_score_value}')

# 3.12 zero one loss
zero_one_loss_value = zero_one_loss(y_true_classification, y_pred_classification)
print(f'Zero-One Loss: {zero_one_loss_value}')