# Load Trained Model

In [2]:
import pickle
import os

model_dir = 'model'
model_name = 'rf_5_feature.pkl'
model_path = os.path.join(model_dir, model_name)

# Load the model using pickle
with open(model_path, 'rb') as file:
    loaded_model = pickle.load(file)


### Deskripsi Feature
PageValues: Nilai yang dihasilkan dari setiap halaman yang dikunjungi.

Administrative_Duration: Durasi waktu yang dihabiskan pada halaman administratif.

ExitRates: Rasio jumlah orang yang keluar dari situs pada halaman tertentu.

BounceRates: Rasio jumlah orang yang meninggalkan situs setelah hanya mengunjungi satu halaman.

ProductRelated_Duration: Durasi waktu yang dihabiskan pada halaman terkait produk.

### Tujuan Simulasi
Meningkatkan PageValues.

Mengurangi ExitRates dan BounceRates.

Meningkatkan durasi waktu pada halaman tertentu (Administrative atau ProductRelated).

### Dataset

In [3]:
# Load Dataset
import pandas as pd
original_dataset = pd.read_csv('dataset/Dataset.csv')
original_dataset.columns = original_dataset.columns.str.lower()
original_dataset = original_dataset[['pagevalues','administrative_duration','exitrates','bouncerates','productrelated_duration','revenue']]

### Preprocessing
1. Handling Missing Values
2. Handling Duplicate Values

In [4]:
# Handling Missing Values
null_feature = ['productrelated_duration', 'administrative_duration', 'bouncerates']
clean_data   = original_dataset
clean_data[null_feature] = clean_data[null_feature].fillna(clean_data[null_feature].median())

In [5]:
# Handing Duplicates
data_length_before = len(clean_data)
clean_data.drop_duplicates(inplace=True)
data_length_after = len(clean_data)
duplicates_sum = data_length_before - data_length_after

print(f'Duplicate :{duplicates_sum}', f'Origin Length :{data_length_before}', f'Droped Duplicate Length :{data_length_after}')

Duplicate :1546 Origin Length :12946 Droped Duplicate Length :11400


### Skenario Simulasi
Skenario 1: Meningkatkan PageValues sebesar 10%.

Skenario 2: Mengurangi ExitRates dan BounceRates sebesar 5%.

Skenario 3: Meningkatkan Administrative_Duration dan ProductRelated_Duration sebesar 15%.


In [17]:
# Membuat Duplikat Dataset Sesuai dengan Skenario

# Skenario 1: Meningkatkan PageValues sebesar 10%
data_scenario1 = clean_data.copy()
data_scenario1['pagevalues'] = data_scenario1['pagevalues'] * 1.10

# Skenario 2: Mengurangi ExitRates dan BounceRates sebesar 5%
data_scenario2 = clean_data.copy()
data_scenario2['exitrates'] = data_scenario2['exitrates'] * 0.95
data_scenario2['bouncerates'] = data_scenario2['bouncerates'] * 0.95

# Skenario 3: Meningkatkan Administrative_Duration dan ProductRelated_Duration sebesar 15%
data_scenario3 = clean_data.copy()
data_scenario3['administrative_duration'] = data_scenario3['administrative_duration'] * 1.15
data_scenario3['productrelated_duration'] = data_scenario3['productrelated_duration'] * 1.15

In [18]:
# Menggunakan model untuk memprediksi hasil
predictions_scenario1 = loaded_model.predict(data_scenario1[['pagevalues','administrative_duration','exitrates','bouncerates','productrelated_duration']])
predictions_scenario2 = loaded_model.predict(data_scenario2[['pagevalues','administrative_duration','exitrates','bouncerates','productrelated_duration']])
predictions_scenario3 = loaded_model.predict(data_scenario3[['pagevalues','administrative_duration','exitrates','bouncerates','productrelated_duration']])

In [19]:
# Menghitung hasil simulasi
revenue_scenario0 = sum(clean_data['revenue']) # Hitungan Original Dari Dataset
revenue_scenario1 = sum(predictions_scenario1)
revenue_scenario2 = sum(predictions_scenario2)
revenue_scenario3 = sum(predictions_scenario3)

print(f"Pendapatan dengan Skenario 0: {revenue_scenario0}")
print(f"Pendapatan dengan Skenario 1: {revenue_scenario1}")
print(f"Pendapatan dengan Skenario 2: {revenue_scenario2}")
print(f"Pendapatan dengan Skenario 3: {revenue_scenario3}")

Pendapatan dengan Skenario 0: 1906
Pendapatan dengan Skenario 1: 10683
Pendapatan dengan Skenario 2: 10757
Pendapatan dengan Skenario 3: 10683


In [25]:
revenue_scenario0 / len(clean_data['revenue']) * 100

16.719298245614034

In [24]:
revenue_scenario1 / len(clean_data['revenue']) * 100

93.71052631578948

In [26]:
revenue_scenario2 / len(clean_data['revenue']) * 100

94.35964912280703

In [27]:
revenue_scenario3 / len(clean_data['revenue']) * 100

93.71052631578948