# BayesianSearchCV

1. Apa itu hyperparameter tuning?
teknik mencari performa /model terbaik dengan melihat variasi/kombinasi dari parameter yang ada

2. Jelaskan metode BayesSearchCV!
metode hyperparameter yang menggunakan pendekatan probabilitas untuk memprediksi di mana solusi optimal mungkin berada tanpa harus mencoba setiap kemungkinan kombinasi (seperti dalam pencarian grid). metode ini memanfaatkan data yang ada untuk membuat keputusan yang lebih baik tentang di mana harus menguji titik selanjutnya.

3. Bagaimana cara kerja BayesSearchCV?
BayesSearchCV bekerja dengan dua langkah utama yang diiterasi, yaitu membuat model dari data yang ada, kemudian memutuskan titik mana yang harus diuji selanjutnya berdasarkan model yang telah dibuat. Iterasi ini berulang hingga iterasi maksimum tercapai.

4. Apa kelebihan BayesSearchCV dibandingkan metode hyperparameter tuning lainnya?
Salah satu kelebihannya adalah kemampuan mempertimbangkan ketidakpastian. Ketika mengevaluasi suatu solusi, alih-alih hanya mempertimbangkan nilai fungsi tujuannya, BayesSearchCV mempertimbangkan seberapa yakin kita tentang prediksi tersebut sehingga memungkinkan eksplorasi ruang pencarian solusi dengan lebih efisien.


In [8]:
# import library
#!pip install scikit-optimize # install jika belum pernah install #
!pip install scikit-optimize



In [9]:
# Load Dataset
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

data = load_iris()
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.75, random_state=0)

In [10]:
model = RandomForestClassifier()
print(model.get_params())

{'bootstrap': True, 'ccp_alpha': 0.0, 'class_weight': None, 'criterion': 'gini', 'max_depth': None, 'max_features': 'sqrt', 'max_leaf_nodes': None, 'max_samples': None, 'min_impurity_decrease': 0.0, 'min_samples_leaf': 1, 'min_samples_split': 2, 'min_weight_fraction_leaf': 0.0, 'monotonic_cst': None, 'n_estimators': 100, 'n_jobs': None, 'oob_score': False, 'random_state': None, 'verbose': 0, 'warm_start': False}


In [11]:
# Definisikan Model dan parameter yang akan dioptimasi (Ruang Hyperparameter)
model= RandomForestClassifier(random_state=0)
param_space = {
    "n_estimators": (100, 1000),
    "max_depth": (5, 50),
    "min_samples_split": (2, 20),
    "min_samples_leaf": (1,10),
    "max_features": (None, "sqrt", "log2")
    }


# Fungsi Optimisasi Menggunakan BayesianSearchCV

In [12]:
# Inisialisasi BayesSearchCV
from skopt import BayesSearchCV

In [13]:
# Jalankan optimisasi
opt = BayesSearchCV(model,
                       param_space,
                       n_iter = 32,
                       random_state = 0
)

opt.fit(X_train, y_train)

print(opt.score(X_test, y_test))

0.9736842105263158


In [14]:
import pandas as pd
import numpy as np
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, classification_report

In [25]:
# Evaluasi Model

def evaluate_model(model, X_train, y_train, X_test, y_test, model_name):
    y_pred_train = model.predict(X_train)
    y_pred_test = model.predict(X_test)

    return pd.DataFrame([{
        "Model": model_name,
        "Accuracy_Train": accuracy_score(y_train, y_pred_train),
        "Accuracy_Test": accuracy_score(y_test, y_pred_test),
        "Precision": precision_score(y_test, y_pred_test, average='weighted'),
        "Recall": recall_score(y_test, y_pred_test, average='weighted'),
        "F1": f1_score(y_test, y_pred_test, average='weighted')
    }])

# Hasil Evaluasi Model
results = evaluate_model(opt, X_train, y_train, X_test, y_test, "Random Forest (Bayesian Optimization)")
results

Unnamed: 0,Model,Accuracy_Train,Accuracy_Test,Precision,Recall,F1
0,Random Forest (Bayesian Optimization),0.973214,0.973684,0.976316,0.973684,0.973952
