In [3]:
import pandas as pd
import numpy as np
import joblib
import os

In [4]:
# Load bundle
bundle_path = '../models/segmentasi_bundle.pkl'

if not os.path.exists(bundle_path):
    raise FileNotFoundError(f"Bundle tidak ditemukan di: {bundle_path}")

bundle = joblib.load(bundle_path)
model = bundle["model"]
scaler = bundle["scaler"]

# Data baru
data_baru = pd.DataFrame([{
    'poorpeople_percentage': 12.5,
    'reg_gdp': 15000000,
    'life_exp': 71.3,
    'avg_schooltime': 8.7,
    'exp_percap': 3200000
}])

# Standardisasi dan prediksi
data_baru_scaled = scaler.transform(data_baru)
prediksi = model.predict(data_baru_scaled)
cluster_id = prediksi[0]

# Mapping label
cluster_labels = {
    0: "Wilayah Berkembang dengan Tingkat Kemiskinan Moderat",
    1: "Pusat Ekonomi dengan Daya Beli Tinggi"
}
predicted_label = cluster_labels.get(cluster_id, "Cluster tidak dikenal")

# Output
print(f"Wilayah ini diprediksi masuk ke dalam **{predicted_label}**.")
print(f"Detail karakteristik wilayah:")
print(f"- Persentase orang miskin: **{data_baru['poorpeople_percentage'].iloc[0]}%**")
print(f"- Produk Domestik Regional Bruto (PDRB): **Rp {data_baru['reg_gdp'].iloc[0]:,.0f}**")
print(f"- Angka Harapan Hidup: **{data_baru['life_exp'].iloc[0]} tahun**")
print(f"- Rata-rata Lama Sekolah: **{data_baru['avg_schooltime'].iloc[0]} tahun**")
print(f"- Pengeluaran per Kapita: **Rp {data_baru['exp_percap'].iloc[0]:,.0f}**")

Wilayah ini diprediksi masuk ke dalam **Pusat Ekonomi dengan Daya Beli Tinggi**.
Detail karakteristik wilayah:
- Persentase orang miskin: **12.5%**
- Produk Domestik Regional Bruto (PDRB): **Rp 15,000,000**
- Angka Harapan Hidup: **71.3 tahun**
- Rata-rata Lama Sekolah: **8.7 tahun**
- Pengeluaran per Kapita: **Rp 3,200,000**
