<a href="https://colab.research.google.com/github/anisfreelancer71/anisfreelancer71/blob/main/Model_Machine_Learning_Regression_Data_Harga_Rumah.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

1. Mengumpulkan Data
Cari dataset harga rumah. Dataset yang populer adalah Ames Housing Dataset atau Boston Housing Dataset.
Dataset ini bisa diperoleh dari berbagai sumber seperti Kaggle, UCI Machine Learning Repository, atau sklearn.datasets.

2. Mengimpor Library yang Diperlukan
Pastikan Anda mengimpor library Python yang dibutuhkan:

In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt
import seaborn as sns


3. Memuat Data
Load dataset menggunakan Pandas.

In [None]:
from google.colab import drive
drive.mount('/content/drive')


In [None]:
!ls "/content/drive/My Drive/filecsv"

In [None]:
data_rumah = pd.read_csv("/content/drive/My Drive/filecsv/data_harga_rumah.csv")
data_rumah.head()

In [None]:
data_rumah.drop(['NAMA RUMAH'], axis=1, inplace=True)
kolom_hapus = [f'Unnamed: {i}' for i in range(8, 1001)]
data_rumah.drop(columns=kolom_hapus, inplace=True)

data_rumah.head()

4. Eksplorasi Data
Lakukan analisis eksplorasi data (EDA) untuk memahami struktur data dan mengidentifikasi fitur penting.

Lihat informasi dataset:

In [None]:
data_rumah.info()
data_rumah.describe()
data_rumah.isnull().sum()  # Cek missing data


In [None]:
data_rumah.drop(['NO'], axis=1, inplace=True)


In [None]:
sns.histplot(data_rumah['HARGA'], kde=True)
plt.show()


5. Membersihkan Data
Bersihkan data dari missing values atau outliers.

Tangani missing values:

In [None]:
data_rumah = data_rumah.fillna(data_rumah.median())  # Atau metode lain tergantung pada karakteristik data


6. Memilih Fitur (Feature Selection)
Pilih fitur yang akan digunakan dalam model.

Misalnya, Anda mungkin ingin menggunakan variabel seperti ukuran rumah, jumlah kamar tidur, dan lokasi.

In [None]:
X = data_rumah[['LB', 'LT', 'KT', 'KM','GRS']]  # Contoh fitur
y = data_rumah['HARGA']  # Target variable


7. Membagi Data: Training dan Testing
Bagi dataset menjadi set pelatihan dan pengujian.

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


8. Membangun Model Machine Learning (Linear Regression)
Gunakan regresi linear sebagai model dasar:

In [None]:
model = LinearRegression()
model.fit(X_train, y_train)


In [None]:
from sklearn.ensemble import GradientBoostingRegressor

# Inisialisasi model
gb_model = GradientBoostingRegressor(n_estimators=100, random_state=42)

# Latih model
gb_model.fit(X_train, y_train)

# Prediksi
y_pred_gb = gb_model.predict(X_test)

# Evaluasi
mse_gb = mean_squared_error(y_test, y_pred_gb)
r2_gb = r2_score(y_test, y_pred_gb)

print(f'Gradient Boosting MSE: {mse_gb}')
print(f'Gradient Boosting R-squared: {r2_gb}')


9. Evaluasi Model
Setelah model dilatih, evaluasi model menggunakan data pengujian.

10. Visualisasi Hasil
Plot hasil prediksi untuk membandingkan prediksi model dengan nilai aktual:

In [None]:
plt.scatter(y_test, y_pred)
plt.xlabel('Actual HARGA')
plt.ylabel('Predicted HARGA')
plt.title('Actual vs Predicted HARGA')
plt.show()


11. Menyempurnakan Model
Jika model belum optimal, Anda dapat mencoba berbagai langkah berikut:

Feature Engineering: Buat fitur baru berdasarkan domain knowledge.
Normalisasi Data: Standarisasi atau normalisasi fitur untuk meningkatkan performa model.
Coba Model Lain: Coba model lain seperti Random Forest, Gradient Boosting, atau SVR.

12. Deploy Model (Opsional)
Setelah model memuaskan, Anda bisa deploy model menggunakan framework seperti Flask atau Streamlit untuk aplikasi web prediksi harga rumah.

Contoh Kode Lengkap:

In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt
import seaborn as sns

# Load dataset
data_rumah = pd.read_csv("/content/drive/My Drive/filecsv/data_harga_rumah.csv")

# Periksa kolom dataset
print(data_rumah.columns)  # Pastikan nama kolom cocok dengan kode

# Eksplorasi data
print(data_rumah.info())
print(data_rumah.describe())

# Cek missing values
print(data_rumah.isnull().sum())

# Membersihkan data (contoh: isi missing value)
# Untuk kolom numerik
data_rumah.drop(['NAMA RUMAH'], axis=1, inplace=True)
kolom_hapus = [f'Unnamed: {i}' for i in range(8, 1001)]
data_rumah.drop(columns=kolom_hapus, inplace=True)

data_rumah.head()
data_rumah = data_rumah.fillna(data_rumah.median())
data_rumah.drop(['NO'], axis=1, inplace=True)

# Untuk kolom kategorikal, jika ada
# data_rumah['GRS'] = data_rumah['GRS'].fillna(data_rumah['GRS'].mode()[0])

# Pilih fitur dan target
X = data_rumah[['LB', 'LT', 'KT', 'KM', 'GRS']]  # Pastikan nama kolom sesuai
y = data_rumah['HARGA']  # Target variable

# Bagi data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inisialisasi dan latih model
model = LinearRegression()
model.fit(X_train, y_train)

# Prediksi
y_pred = model.predict(X_test)

# Evaluasi
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'MSE: {mse}')
print(f'R-squared: {r2}')

# Plot hasil prediksi vs aktual
plt.scatter(y_test, y_pred)
plt.xlabel('Actual HARGA')
plt.ylabel('Predicted HARGA')
plt.title('Actual vs Predicted HARGA')
plt.show()



In [None]:
from sklearn.preprocessing import StandardScaler

# Inisialisasi scaler
scaler = StandardScaler()

# Normalisasi fitur
X_scaled = scaler.fit_transform(X)

# Bagi data lagi setelah normalisasi
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)



1. Menyimpan Model
Setelah model dilatih, Anda dapat menyimpannya menggunakan joblib atau pickle untuk digunakan nanti.

In [None]:
import joblib

# Simpan model
joblib.dump(gb_model, 'gradient_boosting_model.pkl')

# Untuk memuat model di tempat lain
loaded_model = joblib.load('gradient_boosting_model.pkl')


2. Membuat API untuk Model
Anda bisa membuat API menggunakan Flask (untuk Python) agar model dapat diakses secara online. Berikut adalah contoh kode sederhana untuk membuat API dengan Flask.

Install Flask:

In [None]:
pip install Flask


In [None]:
pip install gunicorn


Kode API Flask:

Cara Menggunakan API:

Kirim permintaan POST ke http://localhost:8888/predict dengan payload JSON berisi fitur:

3. Menyiapkan Lingkungan Produksi
Hosting: Untuk deployment di cloud, Anda dapat menggunakan platform seperti Heroku, AWS, Google Cloud Platform, atau Azure.
Docker: Untuk membuat lingkungan yang konsisten, Anda bisa menggunakan Docker untuk mengemas aplikasi dan model.
Contoh Dockerfile:

Menggunakan Model dalam Aplikasi
Setelah API aktif, Anda bisa mengakses model dari aplikasi lain (web atau mobile) dengan melakukan permintaan HTTP ke endpoint yang sudah disediakan.

Contoh Permintaan HTTP dari Python:

Ringkasan
Menyimpan Model: Gunakan joblib atau pickle untuk menyimpan model.
API dengan Flask: Buat API untuk mengakses model.
Lingkungan Produksi: Gunakan platform cloud atau Docker untuk deploy aplikasi.
Menggunakan API: Integrasikan API ke aplikasi untuk mendapatkan prediksi.
Dengan langkah-langkah ini, Anda dapat mempermudah akses model dan integrasi ke aplikasi produksi. Jika ada pertanyaan lebih lanjut atau membutuhkan bantuan khusus, beri tahu saya!