# Pertemuan 11 - Evaluasi Efektivitas Pendekatan Machine Learning

## Capaian Pembelajaran:
> 4.1: Mampu mengukur dan mengevaluasi efektivitas berbagai pendekatan machine learning dengan membandingkan metrik kinerja seperti accuracy, precision, recall, F1-score, dan ROC-AUC.

## Pokok Bahasan
1. Metrik Kinerja Model
2. Accuracy
3. Precision
4. Recall
5. F1-Score
6. ROC-AUC


## 1. Metrik Kinerja Model
Metrik kinerja model adalah alat yang digunakan untuk mengevaluasi seberapa baik sebuah model machine learning dalam melakukan prediksi atau klasifikasi. Metrik ini membantu kita memahami kekuatan dan kelemahan model dan menentukan apakah model siap digunakan dalam produksi. Berikut adalah beberapa metrik kinerja yang umum digunakan, terutama untuk tugas klasifikasi dan regresi.

## 2. Accuracy
Akurasi adalah persentase prediksi yang benar dari keseluruhan prediksi. Akurasi sering digunakan sebagai metrik awal, tetapi mungkin tidak cukup jika dataset tidak seimbang.

![image.png](attachment:image.png)

## 3. Precision
Presisi adalah rasio prediksi positif yang benar terhadap semua prediksi positif. Ini menunjukkan seberapa banyak prediksi positif yang benar-benar relevan.
![image.png](attachment:image.png)

## 4. Recall
Recall adalah rasio prediksi positif yang benar terhadap semua sampel yang sebenarnya positif. Ini menunjukkan seberapa baik model dalam menemukan semua sampel yang relevan.

![image.png](attachment:image.png)

## 5. F1-Score
F1 Score adalah rata-rata harmonis dari presisi dan recall. Ini memberikan keseimbangan antara presisi dan recall.

![image.png](attachment:image.png)

## 6. ROC-AUC
AUC-ROC adalah metrik yang menunjukkan kinerja model klasifikasi pada berbagai threshold. ROC adalah kurva yang menunjukkan trade-off antara true positive rate (recall) dan false positive rate. AUC adalah area di bawah kurva ini, dengan nilai maksimum 1 menunjukkan kinerja sempurna.

### Implementasi Metrik Kinerja dengan Python

In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression, LinearRegression
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score
from sklearn.metrics import mean_absolute_error, mean_squared_error

# Membuat data sampel untuk klasifikasi
X_class = np.random.rand(1000, 10)
y_class = np.random.randint(2, size=1000)

# Split data menjadi train dan test
X_train_class, X_test_class, y_train_class, y_test_class = train_test_split(X_class, y_class, test_size=0.2, random_state=42)

# Melatih model klasifikasi
model_class = LogisticRegression()
model_class.fit(X_train_class, y_train_class)

# Prediksi
y_pred_class = model_class.predict(X_test_class)
y_prob_class = model_class.predict_proba(X_test_class)[:, 1]

# Metrik Klasifikasi
print("Accuracy:", accuracy_score(y_test_class, y_pred_class))
print("Precision:", precision_score(y_test_class, y_pred_class))
print("Recall:", recall_score(y_test_class, y_pred_class))
print("F1 Score:", f1_score(y_test_class, y_pred_class))
print("AUC-ROC:", roc_auc_score(y_test_class, y_prob_class))

# Membuat data sampel untuk regresi
X_reg = np.random.rand(1000, 10)
y_reg = 3 * X_reg[:, 0] + 2 * X_reg[:, 1] + np.random.randn(1000) * 0.1

# Split data menjadi train dan test
X_train_reg, X_test_reg, y_train_reg, y_test_reg = train_test_split(X_reg, y_reg, test_size=0.2, random_state=42)

# Melatih model regresi
model_reg = LinearRegression()
model_reg.fit(X_train_reg, y_train_reg)

# Prediksi
y_pred_reg = model_reg.predict(X_test_reg)

# Metrik Regresi
print("Mean Absolute Error:", mean_absolute_error(y_test_reg, y_pred_reg))
print("Mean Squared Error:", mean_squared_error(y_test_reg, y_pred_reg))
print("Root Mean Squared Error:", np.sqrt(mean_squared_error(y_test_reg, y_pred_reg)))


Accuracy: 0.46
Precision: 0.45
Recall: 0.6702127659574468
F1 Score: 0.5384615384615384
AUC-ROC: 0.49919710959454033
Mean Absolute Error: 0.07897613360058567
Mean Squared Error: 0.010257194100467833
Root Mean Squared Error: 0.10127780655438699


Metrik kinerja model sangat penting untuk mengevaluasi dan memahami performa model machine learning. Metrik-metrik seperti akurasi, presisi, recall, F1 score, AUC-ROC untuk klasifikasi, serta MAE, MSE, dan RMSE untuk regresi, memberikan pandangan yang komprehensif tentang seberapa baik model melakukan tugasnya dan membantu dalam perbaikan dan optimisasi model.