In [None]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Data yang diberikan dalam soal
data = {
    'CPU Clock Speed (GHz)': [2.0, 2.0, 2.3, 2.0, 3.2, 3.4, 3.0, 3.3, 3.6],
    'RAM (GB)': [4, 6, 6, 4, 6, 6, 4, 4, 8],
    'MSRP (IDR)': [230, 260, 160, 330, 380, 430, 400, 450, 500]
}

# Membuat DataFrame
df = pd.DataFrame(data)

# Memisahkan fitur dan target
X = df[['CPU Clock Speed (GHz)', 'RAM (GB)']]  # Fitur
y = df['MSRP (IDR)']  # Target

# Membagi data menjadi training dan testing set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Membuat model regresi linear
model = LinearRegression()
model.fit(X_train, y_train)

# Prediksi dengan data testing
y_pred = model.predict(X_test)

# Menghitung MSE (Mean Squared Error)
mse = mean_squared_error(y_test, y_pred)

# Menampilkan hasil regresi dan MSE
print("Persamaan Regresi Linear:")
print(f"Intercept (b0): {model.intercept_}")
print(f"Koefisien (b1, b2): {model.coef_}")
print(f"Mean Squared Error (MSE): {mse}")

# Prediksi untuk data testing dan hasil aktual
results = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})
print("\nHasil Prediksi dan Nilai Sebenarnya:")
print(results)

# 2. Deteksi Overfitting
# Menghitung MSE untuk data training
y_train_pred = model.predict(X_train)
r2 = r2_score(y_train, y_train_pred)
train_mse = mean_squared_error(y_train, y_train_pred)

# Membandingkan MSE antara data training dan testing
print(f"\nMSE pada data training: {train_mse}")
print(f"MSE pada data testing: {mse}")

print(f"\nR2: {r2}")

# Evaluasi apakah model mengalami overfitting
if train_mse < mse:
    print("\nModel mengalami overfitting, karena kesalahan pada data training lebih rendah dibandingkan pada data testing.")
else:
    print("\nModel tidak mengalami overfitting.")

Persamaan Regresi Linear:
Intercept (b0): -34.06403940886685
Koefisien (b1, b2): [183.49753695 -23.9408867 ]
Mean Squared Error (MSE): 2830.8673469387686

Hasil Prediksi dan Nilai Sebenarnya:
   Actual   Predicted
7     450  475.714286
1     260  189.285714

MSE pada data training: 3080.6826178747356
MSE pada data testing: 2830.8673469387686

R2: 0.740629813959

Model tidak mengalami overfitting.
