In [1]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report

In [2]:
# Load the iris dataset
iris = load_iris()
X = iris.data
y = iris.target

In [3]:
# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [4]:
# Initialize the Decision Tree model
model = DecisionTreeClassifier()

In [5]:
# Define the grid of parameters to search
param_grid = {
    'max_depth': [3, 5, 7, 10],
    'min_samples_split': [2, 5, 10],
    'criterion': ['gini', 'entropy']
}

In [6]:
# Initialize GridSearchCV
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5, scoring='accuracy')

In [7]:
# Fit GridSearchCV with training data
grid_search.fit(X_train, y_train)

In [8]:
# Print the best parameters and best score
print("Best parameters found: ", grid_search.best_params_)
print("Best accuracy found: ", grid_search.best_score_)

Best parameters found:  {'criterion': 'gini', 'max_depth': 5, 'min_samples_split': 10}
Best accuracy found:  0.9428571428571428


In [9]:
# Evaluate the model with best parameters on the test data
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)

In [10]:
# Print classification report
print("Classification Report:")
print(classification_report(y_test, y_pred))

Classification Report:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00        19
           1       1.00      1.00      1.00        13
           2       1.00      1.00      1.00        13

    accuracy                           1.00        45
   macro avg       1.00      1.00      1.00        45
weighted avg       1.00      1.00      1.00        45



Penjelasan Kodingan:
Impor Library: Mulai dengan mengimpor semua pustaka yang diperlukan dari scikit-learn.

Muat dan Bagi Dataset: Muat dataset Iris dan bagi data menjadi training dan testing set menggunakan train_test_split.

Inisialisasi Model: Inisialisasi model Decision Tree yang akan dioptimalkan.

Definisi Grid Parameter: Tentukan grid parameter yang ingin dieksplorasi dalam bentuk kamus param_grid. Misalnya, di sini kita menentukan beberapa nilai untuk max_depth, min_samples_split, dan criterion.

Inisialisasi GridSearchCV: Inisialisasi objek GridSearchCV dengan model, parameter grid, jumlah fold cross-validation (cv=5), dan metrik evaluasi (scoring='accuracy').

Fit GridSearchCV: Latih GridSearchCV pada data training untuk menemukan parameter terbaik.

Hasil Grid Search: Print parameter terbaik yang ditemukan (best_params_) dan skor akurasi terbaik (best_score_).

Evaluasi Model Terbaik: Gunakan model terbaik untuk membuat prediksi pada data test, dan evaluasi performa model dengan mencetak laporan klasifikasi (classification_report).

Output yang Diharapkan:
Ketika kode dijalankan, outputnya akan mencakup parameter terbaik yang ditemukan dari grid search dan laporan klasifikasi dari model Decision Tree yang dioptimalkan.

Catatan Tambahan:
Pastikan dataset Iris (load_iris()) tersedia dari scikit-learn atau sesuaikan dengan dataset yang Anda gunakan.
Anda dapat menyesuaikan grid parameter dan metrik evaluasi sesuai kebutuhan Anda.
Grid Search adalah alat yang sangat berguna untuk menemukan parameter terbaik dalam model machine learning, tetapi memerlukan komputasi yang lebih intensif terutama jika grid parameternya besar atau datasetnya besar.