In [3]:
# Import library yang dibutuhkan
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor
from sklearn.metrics import mean_squared_error, r2_score

In [4]:
# Load Dataset
df = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/BostonHousing.csv")

# X = semua kolom fitur, y = target/label yang diprediksi
X = df.drop("medv", axis=1)
y = df["medv"]

# Split data ke dalam data latih dan data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## **Model Bagging - Random Forest**

In [5]:
bagging_model = RandomForestRegressor(random_state=42)
bagging_model.fit(X_train, y_train)
bagging_preds = bagging_model.predict(X_test)

## **Model Boosting - Gradient Boosting**

In [6]:
boosting_model = GradientBoostingRegressor(random_state=42)
boosting_model.fit(X_train, y_train)
boosting_preds = boosting_model.predict(X_test)

## **Evaluasi Model**

In [7]:
def evaluate_model(y_true, y_pred):
    mse = mean_squared_error(y_true, y_pred)  # MSE: Mean Squared Error
    rmse = np.sqrt(mse)                       # RMSE: Root Mean Squared Error
    r2 = r2_score(y_true, y_pred)             # R^2 Score: Koefisien Determinasi
    return mse, rmse, r2

# Evaluasi Bagging
bagging_mse, bagging_rmse, bagging_r2 = evaluate_model(y_test, bagging_preds)

# Evaluasi Boosting
boosting_mse, boosting_rmse, boosting_r2 = evaluate_model(y_test, boosting_preds)


## **Tampilkan Hasil Evaluasi**

In [8]:
print("=== Evaluasi Model ===")
print("\nBagging (Random Forest Regressor):")
print(f"MSE   : {bagging_mse:.4f}")
print(f"RMSE  : {bagging_rmse:.4f}")
print(f"R^2   : {bagging_r2:.4f}")

print("\nBoosting (Gradient Boosting Regressor):")
print(f"MSE   : {boosting_mse:.4f}")
print(f"RMSE  : {boosting_rmse:.4f}")
print(f"R^2   : {boosting_r2:.4f}")

=== Evaluasi Model ===

Bagging (Random Forest Regressor):
MSE   : 7.9015
RMSE  : 2.8110
R^2   : 0.8923

Boosting (Gradient Boosting Regressor):
MSE   : 6.2089
RMSE  : 2.4918
R^2   : 0.9153


# **PERSAMAAN MATEMATIKA**

## **1.Mean Squared Error (MSE)**
MSE mengukur rata-rata kuadrat dari perbedaan antara nilai prediksi dan nilai aktual. Persamaan matematika untuk MSE adalah:

$$
MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

Di mana:
- $(n)$ adalah jumlah data
- $(y_i)$ adalah nilai aktual
- $(\hat{y}_i)$ adalah nilai prediksi

---

## **2.Root Mean Squared Error (RMSE)**
RMSE adalah akar kuadrat dari MSE, yang memberikan informasi tentang kesalahan dalam satuan yang sama dengan target (harga). Persamaan untuk RMSE adalah:

$$
RMSE = \sqrt{MSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}
$$

---

## **3.R-Squared (R²)**
R² adalah ukuran yang menunjukkan seberapa baik model dapat menjelaskan variasi data. R² dihitung dengan menggunakan persamaan berikut:

$$
R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}
$$

Di mana:
- $(y_i)$ adalah nilai aktual
- $(\hat{y}_i)$ adalah nilai prediksi
- $(\bar{y})$ adalah rata-rata nilai aktual $(y)$
