## The Story
Pada materi sebelumnya teman - teman sudah menonton video - video Intro to Domain, salah satunya adalah **[Video Intro to domain Data Science](https://drive.google.com/file/d/16zY-QwIsq0YTlGIC-xARTlPTSx5MpazV/view?usp=sharing)** di mana teman - teman mengikuti proses pembuatan model yang dapat memprediksi apakah karyawan akan resign dari suatu perusahaan atau tidak.

Pada materi kali ini kita akan mencoba **menggunakan model yang sudah di-train tersebut untuk digunakan pada proses prediksi** menggunakan data baru yang akan diinput oleh user.


👩‍💻: "Mantap, model udah selesai dibuat nih. Tinggal kasih ke tim deployment untuk deploy modelnya jadi aplikasi siap pakai", ujar tim Model Developer.

Model developer pun mengirimkan file - file yang dibutuhkan kepada tim deployment. File - file tersebut diantaranya yaitu file model itu sendiri (`model_ds.pkl`) dan file preprocessing datanya (`scaler_ds.pkl`).


👨‍💻: "Oke. File model udah ada, file preprocessing juga udah. Tapi gimana cara pakenya? Datanya apa aja? Apa aja module python yang dipake saat development dan versinya berapa?" Tim deployment pun bertanya kepada tim Model Developer dan meminta notebook proses develop model yang di-train menggunakan Google Colab.



👩‍💻: "**[Ini file notebooknya](https://colab.research.google.com/drive/1y_53BuBKKBRz3udt2MCVUO2b_yBVkT9f?usp=sharing)**, Mas. Kalau ada yang mau ditanyain jangan sungkan - sungkan yaa".


Tim Deployment pun mencoba menggunakan file `model_ds.pkl` dan `scaler_ds.pkl` untuk proses prediksi. Tim deployment me-load file - file tersebut menggunakan Jupyter Notebook pada komputer / laptopnya untuk proses deployment.


In [77]:
# Import sklearn karena di notebook menggunakan sklearn untuk pembuatan model. 
import sklearn

# Import pickle untuk load file model_ds.pkl dan scaler_ds.pkl
import pickle

In [76]:
# Import semua deh
model = pickle.load(open("model_ds.pkl", "rb"))
scaler = pickle.load(open("scaler_ds.pkl", "rb"))

https://scikit-learn.org/stable/model_persistence.html#security-maintainability-limitations
https://scikit-learn.org/stable/model_persistence.html#security-maintainability-limitations


👨‍💻: "Waduh, ada warning nih, versi `sklearn` pas develop model sama versi `sklearn` lokal yang ada di laptop kita ternyata beda. Lanjut dulu deh asal cuma warning, bukan error."

In [75]:
# Nge-list versi module yang ada di komputer untuk ngecek versi sklearn dan pickle yang dipakai untuk prediksi
!pip list

Package                 Version
----------------------- ---------------------
absl-py                 1.1.0
argon2-cffi             21.3.0
argon2-cffi-bindings    21.2.0
asttokens               2.0.5
attrs                   21.4.0
backcall                0.2.0
bleach                  4.1.0
brotlipy                0.7.0
cachetools              5.2.0
certifi                 2022.6.15
cffi                    1.15.0
charset-normalizer      2.0.4
click                   8.0.4
colorama                0.4.4
conda                   4.13.0
conda-package-handling  1.8.0
cryptography            36.0.0
cycler                  0.11.0
debugpy                 1.5.1
decorator               5.1.1
defusedxml              0.7.1
docopt                  0.6.2
entrypoints             0.3
executing               0.8.3
Flask                   2.1.3
fonttools               4.33.3
google-auth             2.7.0
google-auth-oauthlib    0.4.6
grpcio                  1.46.3
idna                    3.3
importlib-met

👨‍💻: "scikit-learn versi 1.1.1, pickleshare versi 0.7.5 kalo yang di local, Cek versi module python yang ada **[di google colab](https://colab.research.google.com/drive/1y_53BuBKKBRz3udt2MCVUO2b_yBVkT9f?usp=sharing)** dulu deh."

👨‍💻: "Wah ternyata scikit-learn versi 1.0.2, pickleshare versi 0.7.5 kalo yang di Google Colab"

In [43]:
# Cek model
model

In [79]:
# Cek scaler
scaler

👨‍💻: "Mantab, `model` dan `scaler` udah berhasil di load. Saatnya coba _predict_"

In [81]:
# Cobain pakai data prediksi. Data ini nantinya akan didapatkan 
# dari form aplikasi flask. Nanti akan dipelajari lebih lanjut
# di domain Technical Skills

# Data prediksi ini disamakan dengan data contoh prediksi di google colab
tingkat_kepuasan = 37
lama_bekerja = 3
kecelakaan_kerja = 0
gaji = 0
jam_kerja_per_bulan = 157

# Data dibuat 2 dimensi untuk proses prediksi
data = [[tingkat_kepuasan, lama_bekerja, kecelakaan_kerja, gaji, jam_kerja_per_bulan]]

# Print data
data

[[37, 3, 0, 0, 157]]

👨‍💻: "Ok, datanya udah siap di-scaling"

In [80]:
# Karena data pada saat training dilakukan preprocessing
# yaitu proses scaling, data input pun harus di-scaling
scaled_data = scaler.transform(data)

# Cek hasil scaling
scaled_data

array([[150.87635991,  -0.28169781,  -0.4291824 ,  -0.94877465,
         -0.90035548]])

👨‍💻: "Ok, datanya udah siap dipakai untuk prediksi"

In [89]:
print(model.predict(scaled_data)) # Resign / Tidak resign
model.predict_proba(scaled_data) # Nilai probalitas, ambil yang maksimalnya.

[0]


array([[0.99059911, 0.00940089]])

In [97]:
is_resign = model.predict(scaled_data).flatten()
nilai_kepercayaan = max(model.predict_proba(scaled_data).flatten()) * 100 # dikali 100 persen

result = ""
if is_resign == 1:
    result = "Resign"
else:
    result = "Tidak Resign"
    

print(f"Diprediksi {nilai_kepercayaan:.2f}% {result}")

Diprediksi 99.06% Tidak Resign


- 0: Tidak Resign
- 1: Resign

👨‍💻: "Wait, kok prediksinya `Tidak Resign` sih? kan harusnya `88% Resign` kalo diliat dari hasil prediksi di **[di google colab](https://colab.research.google.com/drive/1y_53BuBKKBRz3udt2MCVUO2b_yBVkT9f?usp=sharing)**. Hmmm 🤔, kayanya ini versi `sklearn` ngaruh deh. Coba samain aja deh versinya sama yang di google colab."

Tim deployment pun menginstall library / module `sklearn` di environment yang baru dengan menggunakan perintah berikut pada terminal

```bash
conda create -n prediksi-karyawan-resign python=3.8 scikit-learn=1.0.2 nb_conda_kernels
```

👨‍💻: "Mantap, environment udah jadi, tinggal jalanin ulang notebook ini pakai environment `prediksi-karyawan-resign`".

```bash
conda activate prediksi-karyawan-resign
jupyter notebook
```