Import Libraries

In [1]:
import pandas as pd
import numpy as np
import joblib
from sklearn.utils import resample
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score, confusion_matrix, roc_curve
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
import seaborn as sns

Load Model-Ready Data

In [2]:
model_ready_data = pd.read_csv(r"E:\data analysis project\InstacartMarketBasketAnalysisPortflio\data\processed\model_ready_data.csv")

 Prepare Features and Labels

In [3]:
# حذف کلیه ستون‌های غیرضروری
X = model_ready_data.drop(columns=['reordered', 'eval_set', 'product_name']) 
y = model_ready_data['reordered']

Sample 20% of the Data (Stratified Sampling)

In [4]:
# انتخاب ۲۰ درصد نمونه‌ها به‌صورت تصادفی با حفظ ساختار DataFrame
X_sampled, y_sampled = resample(
    X, 
    y, 
    n_samples=int(len(X) * 0.2),  # انتخاب ۲۰ درصد نمونه‌ها
    random_state=42,              # تنظیم seed برای تکرارپذیری
    stratify=y                    # حفظ تعادل کلاس‌ها
)


Split Sampled Data into Train and Test Sets

In [5]:
# تقسیم داده‌های نمونه‌برداری‌شده به مجموعه‌های آموزش و آزمون
X_train, X_test, y_train, y_test = train_test_split(
    X_sampled, 
    y_sampled, 
    test_size=0.2,
    random_state=42
)

Load the Trained Model

In [6]:
model = joblib.load(r"E:\data analysis project\InstacartMarketBasketAnalysisPortflio\models\optimized_model.pkl")

Evaluate the Model

In [13]:
# پیش‌بینی بر روی داده‌های آزمون
model_path = r'E:\data analysis project\InstacartMarketBasketAnalysisPortflio\models\optimized_model.pkl'
trained_model = joblib.load(model_path)
y_pred = trained_model.predict(X_test)

In [14]:
# محاسبه معیارهای ارزیابی
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)

In [15]:
# نمایش نتایج ارزیابی
print(f'Accuracy: {accuracy:.4f}')
print(f'Precision: {precision:.4f}')
print(f'Recall: {recall:.4f}')
print(f'F1 Score: {f1:.4f}')

Accuracy: 0.7360
Precision: 0.7255
Recall: 0.8880
F1 Score: 0.7985
