## The Story
Pada materi sebelumnya teman - teman sudah menonton video - video Intro to Domain, salah satunya adalah **[Video Intro to domain Data Science](https://drive.google.com/file/d/16zY-QwIsq0YTlGIC-xARTlPTSx5MpazV/view?usp=sharing)** di mana teman - teman mengikuti proses pembuatan model yang dapat memprediksi apakah karyawan akan resign dari suatu perusahaan atau tidak.

Pada materi kali ini kita akan mencoba **menggunakan model yang sudah di-train tersebut untuk digunakan pada proses prediksi** menggunakan data baru yang akan diinput oleh user.


👩‍💻: "Mantap, model udah selesai dibuat nih. Tinggal kasih ke tim deployment untuk deploy modelnya jadi aplikasi siap pakai", ujar tim Model Developer.

Model developer pun mengirimkan file - file yang dibutuhkan kepada tim deployment. File - file tersebut diantaranya yaitu file model itu sendiri (`model_ds.pkl`) dan file preprocessing datanya (`scaler_ds.pkl`).


👨‍💻: "Oke. File model udah ada, file preprocessing juga udah. Tapi gimana cara pakenya? Datanya apa aja? Apa aja module python yang dipake saat development dan versinya berapa?" Tim deployment pun bertanya kepada tim Model Developer dan meminta notebook proses develop model yang di-train menggunakan Google Colab.



👩‍💻: "**[Ini file notebooknya](https://colab.research.google.com/drive/1y_53BuBKKBRz3udt2MCVUO2b_yBVkT9f?usp=sharing)**, Mas. Kalau ada yang mau ditanyain jangan sungkan - sungkan yaa".


Tim Deployment pun mencoba menggunakan file `model_ds.pkl` dan `scaler_ds.pkl` untuk proses prediksi. Tim deployment me-load file - file tersebut menggunakan Jupyter Notebook pada komputer / laptopnya untuk proses deployment.


In [1]:
# Import sklearn karena di notebook menggunakan sklearn untuk pembuatan model. 
import sklearn

# Import pickle untuk load file model_ds.pkl dan scaler_ds.pkl
import pickle

In [2]:
# Import semua deh
model = pickle.load(open("model_ds.pkl", "rb"))
scaler = pickle.load(open("scaler_ds.pkl", "rb"))

👨‍💻: "Waduh, ada warning nih, versi `sklearn` pas develop model sama versi `sklearn` lokal yang ada di laptop kita ternyata beda. Lanjut dulu deh asal cuma warning, bukan error."

In [3]:
# Nge-list versi module yang ada di komputer untuk ngecek versi sklearn dan pickle yang dipakai untuk prediksi
!pip list

Package              Version
-------------------- ---------
argon2-cffi          21.3.0
argon2-cffi-bindings 21.2.0
asttokens            2.0.5
attrs                21.4.0
backcall             0.2.0
beautifulsoup4       4.11.1
bleach               4.1.0
certifi              2022.9.14
cffi                 1.15.1
colorama             0.4.5
debugpy              1.5.1
decorator            5.1.1
defusedxml           0.7.1
entrypoints          0.4
executing            0.8.3
fastjsonschema       2.16.2
importlib-resources  5.2.0
ipykernel            6.15.2
ipython              8.4.0
ipython-genutils     0.2.0
jedi                 0.18.1
Jinja2               3.0.3
joblib               1.1.0
jsonschema           4.4.0
jupyter_client       7.3.5
jupyter-core         4.10.0
jupyterlab-pygments  0.1.2
MarkupSafe           2.1.1
matplotlib-inline    0.1.6
mistune              0.8.4
mkl-fft              1.3.1
mkl-random           1.2.2
mkl-service          2.4.0
nb-conda-kernels     2.3.1
nbclient   

👨‍💻: "scikit-learn versi 1.1.1, pickleshare versi 0.7.5 kalo yang di local, Cek versi module python yang ada **[di google colab](https://colab.research.google.com/drive/1y_53BuBKKBRz3udt2MCVUO2b_yBVkT9f?usp=sharing)** dulu deh."

👨‍💻: "Wah ternyata scikit-learn versi 1.0.2, pickleshare versi 0.7.5 kalo yang di Google Colab"

Tim deployment pun menginstall library / module `sklearn` versi 1.0.2 di environment baru yang sesuai dengan versi yang ada di google colab menggunakan perintah berikut pada terminal (CMD atau git bash).

```bash
conda create -n prediksi-karyawan-resign python=3.8 scikit-learn=1.0.2 nb_conda_kernels
conda activate prediksi-karyawan-resign
jupyter notebook
```
perintah di atas dijalankan baris per baris

In [4]:
# Cek model
model

DecisionTreeClassifier(max_depth=5, max_leaf_nodes=9, random_state=42)

In [5]:
# Cek scaler
scaler

StandardScaler()

👨‍💻: "Mantab, `model` dan `scaler` udah berhasil di load. Saatnya coba _predict_"

In [6]:
# Cobain pakai data prediksi. Data ini nantinya akan didapatkan 
# dari form aplikasi flask. Nanti akan dipelajari lebih lanjut
# di domain Technical Skills

# Data prediksi ini disamakan dengan data contoh prediksi di google colab
tingkat_kepuasan = 37 / 100
lama_bekerja = 3
kecelakaan_kerja = 0
gaji = 0
jam_kerja_per_bulan = 157

# Data dibuat 2 dimensi untuk proses prediksi
data = [[tingkat_kepuasan, lama_bekerja, kecelakaan_kerja, gaji, jam_kerja_per_bulan]]

# Print data
data

[[0.37, 3, 0, 0, 157]]

👨‍💻: "Ok, datanya udah siap di-scaling"

In [7]:
# Karena data pada saat training dilakukan preprocessing
# yaitu proses scaling, data input pun harus di-scaling
scaled_data = scaler.transform(data)

# Cek hasil scaling
scaled_data

array([[-1.07789773, -0.28169781, -0.4291824 , -0.94877465, -0.90035548]])

👨‍💻: "Ok, datanya udah siap dipakai untuk prediksi"

In [8]:
print(model.predict(scaled_data)) # Resign / Tidak resign
model.predict_proba(scaled_data) # Nilai probalitas, ambil yang maksimalnya.

[1]


array([[0.11756757, 0.88243243]])

In [9]:
is_resign = model.predict(scaled_data).flatten()
nilai_kepercayaan = max(model.predict_proba(scaled_data).flatten()) * 100 # dikali 100 persen

result = ""
if is_resign == 1:
    result = "Resign"
else:
    result = "Tidak Resign"
    

print(f"Diprediksi {nilai_kepercayaan:.2f}% {result}")

Diprediksi 88.24% Resign


👨‍💻: "Ok, mantap. Udah sama dengan yang ada di colab. Siap diintegrasiin sama pakai Flask deh"

## Let's Practice!
1. Install nb_conda_kernels di environment `base` menggunakan perintah berikut!
    - `conda activate base`
   
    - `conda install nb_conda_kernels`
   
   
2. Buat Environment baru dengan nama `prediksi-karyawan-resign`, install juga `nb_conda_kernels`, `python versi 3.8`, dan `scikit-learn versi 1.0.2`!


3. Jalankan Notebook ini menggunakan environment `prediksi-karyawan-resign`!


4. Pastikan warning karena perbedaan versi module/library sudah tidak ada!