In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import warnings

# Nonaktifkan peringatan untuk kode ini
warnings.filterwarnings('ignore')

# 1. Load Data
df = pd.read_csv('real_estate_dataset.csv')

# 2. Pre-processing: Membuat kolom target untuk Klasifikasi
# Kita akan membuat kategori harga rumah berdasarkan quantile
# Harga rendah (0), harga sedang (1), harga tinggi (2)
df['Price_Category'] = pd.qcut(df['Price'], q=3, labels=[0, 1, 2])

# 3. Definisikan Fitur (X) dan Target (y)
# Pilih beberapa fitur penting dari dataset real estate
X = df[['Square_Feet', 'Num_Bedrooms', 'Num_Bathrooms', 'Location_Score', 'Distance_to_Center']]
y = df['Price_Category']

# 4. Bagi data menjadi data latih dan data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 5. Scaling fitur (Penting untuk K-NN)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 6. Membangun model K-Nearest Neighbor
k = 5  # Jumlah tetangga terdekat
model = KNeighborsClassifier(n_neighbors=k)
model.fit(X_train, y_train)

# 7. Prediksi pada data uji
y_pred = model.predict(X_test)

# 8. Evaluasi Model
accuracy = accuracy_score(y_test, y_pred)
print("Akurasi model: ", accuracy)

print("\nLaporan Klasifikasi:")
print(classification_report(y_test, y_pred))

print('\nMatriks Konfusi:')
print(confusion_matrix(y_test, y_pred))

# 9. Simulasi prediksi rumah baru
# Data rumah baru: Square_Feet=200, Num_Bedrooms=3, Num_Bathrooms=2, Location_Score=7.5, Distance_to_Center=5.0
new_house_data = [[200, 3, 2, 7.5, 5.0]]
# Skala data rumah baru
new_house_data_scaled = scaler.transform(new_house_data)
# Prediksi
prediction = model.predict(new_house_data_scaled)

print("\nHasil Prediksi Kategori Harga Rumah Baru:")
if prediction[0] == 0:
    print("Rumah termasuk kategori harga: RENDAH")
elif prediction[0] == 1:
    print("Rumah termasuk kategori harga: SEDANG")
else:
    print("Rumah termasuk kategori harga: TINGGI")

# Aktifkan kembali peringatan setelah kode selesai
warnings.filterwarnings('default')

Akurasi model:  0.6

Laporan Klasifikasi:
              precision    recall  f1-score   support

           0       0.68      0.67      0.67        42
           1       0.41      0.40      0.41        30
           2       0.67      0.71      0.69        28

    accuracy                           0.60       100
   macro avg       0.59      0.59      0.59       100
weighted avg       0.60      0.60      0.60       100


Matriks Konfusi:
[[28 11  3]
 [11 12  7]
 [ 2  6 20]]

Hasil Prediksi Kategori Harga Rumah Baru:
Rumah termasuk kategori harga: TINGGI
