<a href="https://colab.research.google.com/github/fidamaisahana/MachineLearning/blob/main/Classification/KNN_Prediksi_Harga_Rumah.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_squared_error, r2_score

In [2]:
# Mount Google Drive
from google.colab import drive
drive.mount('/content/drive')

# Path to your Excel file in Google Drive
file_path = '/content/drive/MyDrive/Colab Notebooks/dataset/DATA RUMAH_TEBET JAKSEL.xlsx'

# Read the Excel file into a pandas DataFrame
df = pd.read_excel(file_path, engine='openpyxl')

# Menghapus kolom "NAMA RUMAH" karena tidak diperlukan untuk prediksi
df = df.drop(columns=['NAMA RUMAH','NO'])

# Now you can work with the DataFrame 'df'
print(df.head())

Mounted at /content/drive
        HARGA     LB     LT   KT   KM  GRS
0  3800000000  220.0  220.0  3.0  3.0  0.0
1  4600000000  180.0  137.0  4.0  3.0  2.0
2  3000000000  267.0  250.0  4.0  4.0  4.0
3   430000000   40.0   25.0  2.0  2.0  0.0
4  9000000000  400.0  355.0  6.0  5.0  3.0


In [3]:
# Memastikan tidak ada nilai yang hilang
df = df.dropna()

In [4]:
# Memisahkan fitur dan target
y = df['HARGA']  # Target adalah kolom 'HARGA'

In [5]:
# Select the 5 features you want to use
features = ['LB', 'LT', 'KT', 'KM', 'GRS']
X = df[features]

# Standarisasi fitur with 5 features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Membagi data menjadi set pelatihan dan pengujian
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Inisialisasi model KNN
knn = KNeighborsRegressor(n_neighbors=3)

# Melatih model KNN dengan data pelatihan
knn.fit(X_train, y_train) # Added this line to fit the model


In [6]:
# Prediksi dan evaluasi
y_pred = knn.predict(X_test)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
r2 = r2_score(y_test, y_pred)

print(f'Root Mean Squared Error (RMSE): {rmse}')
print(f'R-squared (R²): {r2}')

Root Mean Squared Error (RMSE): 6000777842.995057
R-squared (R²): 0.5250814229966578


In [None]:
# Fungsi untuk memprediksi harga rumah berdasarkan input pengguna
def recommend_price(input_features):
    # Skala input features
    input_scaled = scaler.transform([input_features])
    # Prediksi harga
    predicted_price = knn.predict(input_scaled)
    return predicted_price[0]

# Meminta input pengguna untuk memasukkan fitur rumah yang ingin diprediksi harganya
print("Masukkan detail rumah yang ingin diprediksi harganya:")

# Input dari pengguna (dalam urutan yang sama dengan urutan kolom fitur yang digunakan)
luas_bangunan = float(input("Masukkan luas bangunan (LB) dalam m2: "))
luas_tanah = float(input("Masukkan luas tanah (LT) dalam m2: "))
jumlah_kamar_tidur = int(input("Masukkan jumlah kamar tidur (KT): "))
jumlah_kamar_mandi = int(input("Masukkan jumlah kamar mandi (KM): "))
jumlah_garasi = int(input("Masukkan jumlah garasi (GRS): "))

# Menggabungkan input pengguna ke dalam sebuah list
input_features = [3, luas_tanah, jumlah_kamar_tidur, jumlah_kamar_mandi, jumlah_garasi]

# Memanggil fungsi prediksi harga
predicted_price = recommend_price(input_features)

# Menampilkan hasil prediksi harga rumah
print(f"Prediksi harga rumah adalah: Rp {predicted_price:,.0f}")


Masukkan detail rumah yang ingin diprediksi harganya:
Masukkan luas bangunan (LB) dalam m2: 200
Masukkan luas tanah (LT) dalam m2: 150
Masukkan jumlah kamar tidur (KT): 3
Masukkan jumlah kamar mandi (KM): 2
Masukkan jumlah garasi (GRS): 1
Prediksi harga rumah adalah: Rp 2,533,333,333


