# BayesianSearchCV

1. Apa itu hyperparameter tuning?

    Hyperparameter tuning (penyetelan hyperparameter) adalah proses mencari nilai optimal untuk hyperparameter suatu model machine learning atau deep learning untuk mencapai kinerja model terbaik pada tugas yang dimaksud.


2. Jelaskan metode BayesSearchCV!

    BayesSearchCV adalah metode hyperparameter tuning yang menggunakan Optimasi Bayesian untuk mencari kombinasi hyperparameter optimal secara lebih efisien dibandingkan dengan metode tradisional seperti Grid Search atau Random Search.
3. Bagaimana cara kerja BayesSearchCV?

    BayesSearchCV bekerja berdasarkan prinsip Optimasi Bayesian, yang menggunakan model probabilitas untuk secara cerdas memilih kombinasi hyperparameter berikutnya yang akan diuji. Tujuannya adalah menemukan nilai optimal dengan evaluasi model yang jauh lebih sedikit dibandingkan Grid Search atau Random Search.

4. Apa kelebihan BayesSearchCV dibandingkan metode hyperparameter tuning lainnya?

    Hyperparameter Tuning adalah proses penting dalam machine learning untuk mencari nilai optimal dari hyperparameter sebuah model yang harus diatur sebelum pelatihan dimulai. Tujuannya adalah memastikan model mencapai kinerja terbaik, yaitu berakurat tinggi tanpa mengalami overfitting atau underfitting—pada data yang belum pernah dilihat. Proses ini pada dasarnya adalah eksperimen berulang, di mana berbagai kombinasi hyperparameter diuji dan dibandingkan menggunakan metrik kinerja, sehingga model yang dihasilkan benar-benar efektif dan efisien.


In [9]:
#!pip install scikit-optimize # install jika belum pernah install
!pip install scikit-optimize

# import library
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from skopt import BayesSearchCV
from skopt.space import Integer, Categorical




In [10]:
# Load Dataset
X, y = loaX, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.75, random_state=0)


In [11]:
# Definisikan Model dan parameter yang akan dioptimasi (Ruang Hyperparameter)
model = RandomForestClassifier(random_state=0)

param_space = {
    'n_estimators': Integer(50, 300),
    'max_depth': Integer(2, 20),
    'min_samples_split': Integer(2, 20),
    'min_samples_leaf': Integer(1, 20),
    'max_features': Categorical(['sqrt', 'log2', None])
}



# Fungsi Optimisasi Menggunakan BayesianSearchCV

In [12]:
# Inisialisasi BayesSearchCV
opt = BayesSearchCV(
    estimator=model,
    search_spaces=param_space,
    n_iter=32,
    cv=5,
    n_jobs=-1,
    random_state=0
)

In [13]:
# Jalankan optimisasi
opt.fit(X_train, y_train)

print("Best Score:", opt.best_score_)
print("Best Parameters:", opt.best_params_)

Best Score: 0.9731225296442687
Best Parameters: OrderedDict({'max_depth': 2, 'max_features': 'log2', 'min_samples_leaf': 11, 'min_samples_split': 9, 'n_estimators': 50})


In [14]:
# Evaluasi Model
from sklearn.metrics import accuracy_score, classification_report

y_pred = opt.predict(X_test)

print("Accuracy:", accuracy_score(y_test, y_pred))
print("\nClassification Report:\n", classification_report(y_test, y_pred))

Accuracy: 0.9736842105263158

Classification Report:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        13
           1       1.00      0.94      0.97        16
           2       0.90      1.00      0.95         9

    accuracy                           0.97        38
   macro avg       0.97      0.98      0.97        38
weighted avg       0.98      0.97      0.97        38

