In [8]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier # Kembali ke Classifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import warnings

# Nonaktifkan peringatan untuk kode ini
warnings.filterwarnings('ignore')

# 1. Load Data
df = pd.read_csv('real_estate_dataset.csv')

# 2. Pre-processing: Membuat kolom target untuk Klasifikasi (Diperlukan untuk output yang diminta)
# Kita akan membuat kategori harga rumah berdasarkan quantile (Harga rendah (0), harga sedang (1), harga tinggi (2))
df['Price_Category'] = pd.qcut(df['Price'], q=3, labels=[0, 1, 2])

# 3. Definisikan Fitur (X) dan Target (y)
# X: Fitur lengkap yang diminta
X = df[['Square_Feet', 'Num_Bedrooms', 'Num_Bathrooms', 'Num_Floors', 'Year_Built',
        'Has_Garden', 'Has_Pool', 'Garage_Size', 'Location_Score', 'Distance_to_Center']]
# y: Target Kategori Harga (Diperlukan untuk output yang diminta)
y = df['Price_Category']

# 4. Bagi data menjadi data latih dan data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 5. Scaling fitur (Penting untuk K-NN)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 6. Membangun model K-Nearest Neighbor Classifier
k = 5
model = KNeighborsClassifier(n_neighbors=k)
model.fit(X_train, y_train)

# 7. Prediksi pada data uji
y_pred = model.predict(X_test)

# 8. Evaluasi Model (Menggunakan metrik Klasifikasi seperti permintaan)
accuracy = accuracy_score(y_test, y_pred)
print("Akurasi model: ", accuracy)

print("\nLaporan Klasifikasi:")
print(classification_report(y_test, y_pred))

print('\nMatriks Konfusi:')
print(confusion_matrix(y_test, y_pred))

# 9. Simulasi prediksi rumah baru
# Data rumah baru: Square_Feet=200, Num_Bedrooms=3, Num_Bathrooms=2, Num_Floors=2, Year_Built=2010,
# Has_Garden=1, Has_Pool=0, Garage_Size=25, Location_Score=7.5, Distance_to_Center=5.0
new_house_data = [[200, 3, 2, 2, 2010, 1, 0, 25, 7.5, 5.0]]
# Skala data rumah baru
new_house_data_scaled = scaler.transform(new_house_data)
# Prediksi Kategori Harga
prediction = model.predict(new_house_data_scaled)

print("\nHasil Prediksi Kategori Harga Rumah Baru:")
if prediction[0] == 0:
    print("Rumah termasuk kategori harga: RENDAH")
elif prediction[0] == 1:
    print("Rumah termasuk kategori harga: SEDANG")
else:
    print("Rumah termasuk kategori harga: TINGGI")

# Aktifkan kembali peringatan setelah kode selesai
warnings.filterwarnings('default')# 3. Siapkan data
X = df[['Square_Feet', 'Num_Bedrooms', 'Num_Bathrooms', 'Num_Floors', 'Year_Built',
        'Has_Garden', 'Has_Pool', 'Garage_Size', 'Location_Score', 'Distance_to_Center']]
y = df['Price_Category']

# 4. Bagi data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 5. Scaling
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 6. Model KNN
model_knn = KNeighborsClassifier(n_neighbors=5)
model_knn.fit(X_train, y_train)

# 7. Prediksi dan evaluasi
y_pred = model_knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Akurasi model: ", accuracy)
print("\nLaporan Klasifikasi:")
print(classification_report(y_test, y_pred))
print('\nMatriks Konfusi:')
print(confusion_matrix(y_test, y_pred))

# 8. Prediksi rumah baru
new_house_data = [[200, 3, 2, 2, 2010, 1, 0, 25, 7.5, 5.0]]
new_house_data_scaled = scaler.transform(new_house_data)
prediction = model_knn.predict(new_house_data_scaled)

print("\nHasil Prediksi Kategori Harga Rumah Baru:")
if prediction[0] == 0:
    print("Rumah termasuk kategori harga: RENDAH")
elif prediction[0] == 1:
    print("Rumah termasuk kategori harga: SEDANG")
else:
    print("Rumah termasuk kategori harga: TINGGI")

Akurasi model:  0.67

Laporan Klasifikasi:
              precision    recall  f1-score   support

           0       0.72      0.67      0.69        42
           1       0.50      0.60      0.55        30
           2       0.84      0.75      0.79        28

    accuracy                           0.67       100
   macro avg       0.69      0.67      0.68       100
weighted avg       0.69      0.67      0.68       100


Matriks Konfusi:
[[28 13  1]
 [ 9 18  3]
 [ 2  5 21]]

Hasil Prediksi Kategori Harga Rumah Baru:
Rumah termasuk kategori harga: SEDANG
Akurasi model:  0.67

Laporan Klasifikasi:
              precision    recall  f1-score   support

           0       0.72      0.67      0.69        42
           1       0.50      0.60      0.55        30
           2       0.84      0.75      0.79        28

    accuracy                           0.67       100
   macro avg       0.69      0.67      0.68       100
weighted avg       0.69      0.67      0.68       100


Matriks Konfusi

