In [2]:
%pip install xgboost

Collecting xgboost
  Obtaining dependency information for xgboost from https://files.pythonhosted.org/packages/24/ec/ad387100fa3cc2b9b81af0829b5ecfe75ec5bb19dd7c19d4fea06fb81802/xgboost-2.0.3-py3-none-win_amd64.whl.metadata
  Downloading xgboost-2.0.3-py3-none-win_amd64.whl.metadata (2.0 kB)
Downloading xgboost-2.0.3-py3-none-win_amd64.whl (99.8 MB)
   ---------------------------------------- 0.0/99.8 MB ? eta -:--:--
   ---------------------------------------- 0.0/99.8 MB ? eta -:--:--
   ---------------------------------------- 0.1/99.8 MB 1.5 MB/s eta 0:01:06
   ---------------------------------------- 0.2/99.8 MB 2.4 MB/s eta 0:00:43
   ---------------------------------------- 0.4/99.8 MB 2.8 MB/s eta 0:00:36
   ---------------------------------------- 0.4/99.8 MB 2.6 MB/s eta 0:00:38
   ---------------------------------------- 0.7/99.8 MB 3.2 MB/s eta 0:00:32
   ---------------------------------------- 0.7/99.8 MB 2.9 MB/s eta 0:00:35
   ---------------------------------------- 1.

In [5]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from xgboost import XGBClassifier
from sklearn.metrics import classification_report, confusion_matrix
import numpy as np

# Memuat data banjir (contoh data dari file CSV yang dibuat sebelumnya)
data = pd.read_csv('data_banjir_jakarta_2018_2023.csv')

# Contoh data tambahan (misalnya data bulanan dari tahun 2018 hingga pertengahan 2023)
years = [2018, 2019, 2020, 2021, 2022, 2023]
months = list(range(1, 13)) * 5 + list(range(1, 7))  # 12 bulan untuk 5 tahun penuh dan 6 bulan untuk tahun 2023

additional_data = {
    'Tahun': np.repeat(years, 12)[:-6],  # Menghapus 6 bulan terakhir karena hanya ada data hingga pertengahan 2023
    'Bulan': months,
    'Curah_Hujan_mm': np.random.randint(50, 400, size=66),  # 5 tahun penuh + 6 bulan tahun 2023 = 66 bulan
    'Ketinggian_Sungai_m': np.random.uniform(3.0, 10.0, size=66),
    'Jumlah_RW_Terdampak': np.random.randint(0, 50, size=66)
}

# Membuat DataFrame tambahan
monthly_flood_data = pd.DataFrame(additional_data)

# Menampilkan ukuran dataframe untuk memastikan panjangnya sama
print("Data tahunan: ", data.shape)
print("Data bulanan: ", monthly_flood_data.shape)



Data tahunan:  (6, 4)
Data bulanan:  (66, 5)


In [6]:
# Memisahkan fitur (X) dan target (y)
X = monthly_flood_data[['Curah_Hujan_mm', 'Ketinggian_Sungai_m']]
y = (monthly_flood_data['Jumlah_RW_Terdampak'] > 10).astype(int)  # Binary classification: 1 if affected RW > 10, else 0

# Membagi data menjadi set pelatihan dan pengujian
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Normalisasi fitur
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)



In [7]:
# Membangun model menggunakan XGBoost
model = XGBClassifier(use_label_encoder=False, eval_metric='logloss')
model.fit(X_train, y_train)

# Memprediksi hasil pada set pengujian
y_pred = model.predict(X_test)

# Mengevaluasi model
print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred))
print("Classification Report:\n", classification_report(y_test, y_pred))



Confusion Matrix:
 [[ 0  3]
 [ 0 11]]
Classification Report:
               precision    recall  f1-score   support

           0       0.00      0.00      0.00         3
           1       0.79      1.00      0.88        11

    accuracy                           0.79        14
   macro avg       0.39      0.50      0.44        14
weighted avg       0.62      0.79      0.69        14



  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))


In [8]:
# Fungsi sistem peringatan dini
def early_warning_system(new_data):
    new_data_scaled = scaler.transform(new_data)
    prediction = model.predict(new_data_scaled)
    return prediction

# Contoh penggunaan sistem peringatan dini
new_data = pd.DataFrame({
    'Curah_Hujan_mm': [350],
    'Ketinggian_Sungai_m': [8.5]
})

print("Early Warning Prediction (1 for flood, 0 for no flood):", early_warning_system(new_data))

