In [11]:
# کتابخانه‌های مورد نیاز
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.tree import DecisionTreeClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

# بارگذاری داده
file_path = 'D:/Programming/data-set/ab_testing.csv'
data = pd.read_csv(file_path)

# پیش‌پردازش داده‌ها
# تبدیل ویژگی 'Conversion' به عددی
label_encoder = LabelEncoder()
data['Conversion'] = label_encoder.fit_transform(data['Conversion'])

# تبدیل ویژگی‌های دسته‌بندی به عددی (One-Hot Encoding)
data = pd.get_dummies(data, columns=['Group', 'Device', 'Location'], drop_first=True)

# مقیاس‌بندی ویژگی‌ها عددی
scaler = StandardScaler()
data[['Page Views', 'Time Spent']] = scaler.fit_transform(data[['Page Views', 'Time Spent']])

# تقسیم داده‌ها به مجموعه آموزش و آزمایش
X = data.drop('Conversion', axis=1)  # ویژگی‌ها
y = data['Conversion']  # هدف (Conversion)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# مدل‌سازی درخت تصمیم‌گیری
dt_model = DecisionTreeClassifier(random_state=42)
dt_model.fit(X_train, y_train)
y_pred_dt = dt_model.predict(X_test)

# مدل‌سازی بیزین ساده
nb_model = GaussianNB()
nb_model.fit(X_train, y_train)
y_pred_nb = nb_model.predict(X_test)

# ارزیابی مدل درخت تصمیم‌گیری
print("Decision Tree Evaluation:")
print("Accuracy:", accuracy_score(y_test, y_pred_dt))
print("Classification Report:\n", classification_report(y_test, y_pred_dt))
print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred_dt))

# ارزیابی مدل بیزین ساده
print("\nNaive Bayes Evaluation:")
print("Accuracy:", accuracy_score(y_test, y_pred_nb))

# برای جلوگیری از هشدارهای تقسیم صفر
print("Classification Report (Naive Bayes):\n", classification_report(y_test, y_pred_nb, zero_division=1))
print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred_nb))

Decision Tree Evaluation:
Accuracy: 0.8266666666666667
Classification Report:
               precision    recall  f1-score   support

           0       0.90      0.91      0.90      1349
           1       0.13      0.13      0.13       151

    accuracy                           0.83      1500
   macro avg       0.52      0.52      0.52      1500
weighted avg       0.82      0.83      0.83      1500

Confusion Matrix:
 [[1221  128]
 [ 132   19]]

Naive Bayes Evaluation:
Accuracy: 0.8993333333333333
Classification Report (Naive Bayes):
               precision    recall  f1-score   support

           0       0.90      1.00      0.95      1349
           1       1.00      0.00      0.00       151

    accuracy                           0.90      1500
   macro avg       0.95      0.50      0.47      1500
weighted avg       0.91      0.90      0.85      1500

Confusion Matrix:
 [[1349    0]
 [ 151    0]]
