## Viii. Model Inference

Tahap ini bertujuan untuk menggunakan model terbaik yang telah disimpan guna melakukan prediksi terhadap data baru.
Model yang sebelumnya disimpan menggunakan pickle akan diload kembali ke dalam notebook.
Selanjutnya, dilakukan uji coba prediksi dengan memberikan input data baru untuk memprediksi apakah akan terjadi hujan besok (RainTomorrow).

Proses ini mensimulasikan bagaimana model akan digunakan di dunia nyata untuk melakukan prediksi terhadap data baru yang belum pernah dilihat sebelumnya.

In [3]:
# === 1. Import Library ===
import pickle
import json
import pandas as pd
from sklearn.compose import ColumnTransformer
from xgboost import XGBClassifier

# === 2. Mount Google Drive ===
from google.colab import drive
drive.mount('/content/drive')

# === 3. Tentukan path file yang sudah disimpan ===
model_dir = '/content/drive/MyDrive/'

model_path = model_dir + 'xgboost_best_model.pkl'
preprocessor_path = model_dir + 'preprocessor.pkl'
num_cols_path = model_dir + 'list_num_cols.txt'
cat_cols_path = model_dir + 'list_cat_cols.txt'

# === 4. Load semua file ===
with open(model_path, 'rb') as f:
    model = pickle.load(f)

with open(preprocessor_path, 'rb') as f:
    preprocessor = pickle.load(f)

with open(num_cols_path, 'r') as f:
    num_cols = json.load(f)

with open(cat_cols_path, 'r') as f:
    cat_cols = json.load(f)

print("Model dan preprocessor berhasil di-load:")
print(f"- Total numerical columns : {len(num_cols)}")
print(f"- Total categorical columns: {len(cat_cols)}")

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Model dan preprocessor berhasil di-load:
- Total numerical columns : 16
- Total categorical columns: 5


### Prediksi Data Baru (Model Inference)

Setelah model terbaik dimuat, langkah berikutnya adalah melakukan prediksi pada data baru.  
Pastikan kolom yang digunakan **sama persis dengan fitur input pada model training**,  
tanpa menyertakan kolom target (`RainTomorrow`) maupun kolom waktu (`Date`).

Hasil prediksi akan menunjukkan apakah model memperkirakan akan terjadi hujan **besok (Yes)** atau **tidak (No)**.


In [8]:
# === Contoh Data Baru untuk Prediksi ===
import pandas as pd

# Pastikan kolom sesuai dengan dataset yang digunakan pada model training
new_data = pd.DataFrame([{
    'MinTemp': 18.2,
    'MaxTemp': 29.5,
    'Rainfall': 2.4,
    'Evaporation': 5.8,
    'Sunshine': 8.0,
    'WindGustSpeed': 35.0,
    'WindSpeed9am': 17.0,
    'WindSpeed3pm': 20.0,
    'Humidity9am': 68.0,
    'Humidity3pm': 52.0,
    'Pressure9am': 1015.3,
    'Pressure3pm': 1012.8,
    'Cloud9am': 4.0,
    'Cloud3pm': 5.0,
    'Temp9am': 21.4,
    'Temp3pm': 28.1,
    'RainToday': 'No',
    'WindGustDir': 'NW',
    'WindDir9am': 'N',
    'WindDir3pm': 'WNW',
    'Location': 'Sydney'
}])

# === Prediksi dengan Model ===
prediction = model.predict(new_data)

# === Interpretasi Hasil ===
pred_label = 'Rain Tomorrow: Yes' if prediction[0] == 1 else 'Rain Tomorrow: No'

pred_label

'Rain Tomorrow: No'

## Didapatkan hasil prediksi bahwa besok `tidak hujan`

### Kolom yang tidak digunakan untuk inference :

`Date` → kolom waktu yang hanya bersifat identifikasi, tidak digunakan sebagai fitur prediktor.

`RainTomorrow` → target variabel (label yang ingin diprediksi), jadi tidak boleh dimasukkan ke data baru.