# Random Forest untuk Regresi

In [3]:
# Dataset Boston: berisi data fitur untuk memprediksi harga rumah (target)
from sklearn.datasets import fetch_california_housing
# Fungsi untuk membagi data menjadi set pelatihan dan pengujian
from sklearn.model_selection import train_test_split
# Random Forest Regressor: ensemble tree-based model untuk regresi
from sklearn.ensemble import RandomForestRegressor
# Mean squared error: metrik untuk mengukur kesalahan prediksi
from sklearn.metrics import mean_squared_error
# NumPy: operasi numerik dan array
import numpy as np

In [2]:
# Muat dataset
boston = fetch_california_housing()
# X: fitur, y: target (harga)
X = boston.data
y = boston.target

# Bagi data menjadi set pelatihan dan pengujian (20% untuk pengujian)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Buat model Random Forest untuk regresi dan latih pada data pelatihan
regr = RandomForestRegressor(n_estimators=100, random_state=42)
regr.fit(X_train, y_train)

# Lakukan prediksi pada set pengujian
y_pred = regr.predict(X_test)

# Print Root Mean Squared Error (RMSE) dari prediksi
print(f"RMSE: {np.sqrt(mean_squared_error(y_test, y_pred))}")

RMSE: 0.5053399773665033


# Random Forest untuk Klasifikasi

In [4]:
# Dataset iris: berisi data fitur bunga iris untuk klasifikasi 3 spesies
from sklearn.datasets import load_iris
# Random Forest Classifier: ensemble tree-based model untuk klasifikasi
from sklearn.ensemble import RandomForestClassifier
# Accuracy score: metrik akurasi untuk klasifikasi
from sklearn.metrics import accuracy_score, classification_report

In [5]:
# Muat dataset iris
iris = load_iris()
X_iris = iris.data
y_iris = iris.target

# Bagi data menjadi set pelatihan dan pengujian
X_iris_train, X_iris_test, y_iris_train, y_iris_test = train_test_split(
    X_iris, y_iris, test_size=0.2, random_state=42
)

# Buat model Random Forest untuk klasifikasi dan latih pada data pelatihan
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_iris_train, y_iris_train)

# Lakukan prediksi pada set pengujian
y_iris_pred = clf.predict(X_iris_test)

# Print akurasi dan laporan klasifikasi
print(f"Akurasi: {accuracy_score(y_iris_test, y_iris_pred):.2f}")
print("\nLaporan Klasifikasi:")
print(classification_report(y_iris_test, y_iris_pred, target_names=iris.target_names))

Akurasi: 1.00

Laporan Klasifikasi:
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        10
  versicolor       1.00      1.00      1.00         9
   virginica       1.00      1.00      1.00        11

    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30

