In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

In [None]:
# Load file CSV
file_path = "Jumlah Korban Manusia yang Diakibatkan Bencana Alam Menurut Provinsi, 2016.csv"
df = pd.read_csv(file_path)

# Tampilkan 10 baris pertama untuk melihat struktur
df.head(10)

In [None]:
# Ambil nama provinsi dari kolom ke-1 mulai baris ke-4
df_clean = df.iloc[3:].copy()
df_clean.columns = ["Provinsi", "Meninggal", "Luka_Sakit", "Hilang"]
df_clean.reset_index(drop=True, inplace=True)

# Konversi data ke numerik
df_clean["Meninggal"] = pd.to_numeric(df_clean["Meninggal"], errors="coerce")
df_clean["Luka_Sakit"] = pd.to_numeric(df_clean["Luka_Sakit"], errors="coerce")
df_clean["Hilang"] = pd.to_numeric(df_clean["Hilang"], errors="coerce")

# Drop baris yang mengandung NaN
df_clean.dropna(inplace=True)
df_clean.head()


In [None]:
# Ambil fitur numerik untuk clustering
X = df_clean[["Meninggal", "Luka_Sakit", "Hilang"]]

# Normalisasi
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)


In [None]:
wcss = []
for i in range(1, 11):
    kmeans = KMeans(n_clusters=i, random_state=42)
    kmeans.fit(X_scaled)
    wcss.append(kmeans.inertia_)

# Visualisasi metode elbow
plt.plot(range(1, 11), wcss, marker='o')
plt.title('Metode Elbow untuk Menentukan Jumlah Cluster')
plt.xlabel('Jumlah Cluster')
plt.ylabel('WCSS')
plt.grid(True)
plt.show()


In [None]:
# Misalnya pilih 3 cluster
kmeans = KMeans(n_clusters=3, random_state=42)
df_clean["Cluster"] = kmeans.fit_predict(X_scaled)

# Lihat hasil cluster
df_clean


In [None]:
plt.figure(figsize=(8,6))
colors = ['red', 'green', 'blue']

for cluster in range(3):
    clustered = df_clean[df_clean["Cluster"] == cluster]
    plt.scatter(clustered["Luka_Sakit"], clustered["Meninggal"],
                color=colors[cluster], label=f'Cluster {cluster}')

plt.xlabel("Luka/Sakit")
plt.ylabel("Meninggal Dunia")
plt.title("Visualisasi Cluster Provinsi berdasarkan Jumlah Korban")
plt.legend()
plt.grid(True)
plt.show()
