In [1]:
import sys
import os
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

# تنظیم path برای دسترسی به ماژول‌های پروژه
project_root = r"C:\Users\HsH-HsH\weighted_split_criteria"
src_path = os.path.join(project_root, "src")
sys.path.append(src_path)

print("✅ کتابخانه‌های پایه import شدند")
print(f"📁 مسیر پروژه: {project_root}")
print(f"📁 مسیر src: {src_path}")
print(f"🐍 Python path تنظیم شد")
print("=" * 50)


✅ کتابخانه‌های پایه import شدند
📁 مسیر پروژه: C:\Users\HsH-HsH\weighted_split_criteria
📁 مسیر src: C:\Users\HsH-HsH\weighted_split_criteria\src
🐍 Python path تنظیم شد


In [2]:
# بارگذاری dataset
dataset_path = os.path.join(project_root, "sample_dataset_30_numeric.csv")

# بررسی وجود فایل
if os.path.exists(dataset_path):
    print(f"✅ فایل dataset پیدا شد: {dataset_path}")
    
    # خواندن dataset
    df = pd.read_csv(dataset_path)
    
    print(f"📊 شکل dataset: {df.shape}")
    print(f"📋 ستون‌ها: {list(df.columns)}")
    print(f"🎯 نوع داده‌ها:")
    print(df.dtypes)
    print("\n📈 نمونه از داده‌ها:")
    print(df.head())
    print("\n📊 آمار کلی:")
    print(df.describe())
    
else:
    print(f"❌ فایل dataset پیدا نشد: {dataset_path}")
    print("📁 فایل‌های موجود در پوشه اصلی:")
    for file in os.listdir(project_root):
        if file.endswith('.csv'):
            print(f"  - {file}")

print("=" * 50)


✅ فایل dataset پیدا شد: C:\Users\HsH-HsH\weighted_split_criteria\sample_dataset_30_numeric.csv
📊 شکل dataset: (30, 8)
📋 ستون‌ها: ['Age', 'LastTransaction', 'Churn', 'Gender_female', 'Gender_male', 'Payment Method_cash', 'Payment Method_cheque', 'Payment Method_credit card']
🎯 نوع داده‌ها:
Age                           int64
LastTransaction               int64
Churn                         int64
Gender_female                 int64
Gender_male                   int64
Payment Method_cash           int64
Payment Method_cheque         int64
Payment Method_credit card    int64
dtype: object

📈 نمونه از داده‌ها:
   Age  LastTransaction  Churn  Gender_female  Gender_male  \
0   38              171      1              0            1   
1   24              140      1              1            0   
2   82               39      0              0            1   
3   34              217      1              0            1   
4   70              170      0              1            0   

   Payment Met

In [8]:
# جدا کردن features و target
print("🎯 آماده‌سازی داده‌ها...")

# Target variable (Churn)
y = df['Churn'].values
print(f"📊 Target (Churn): {y}")
print(f"📈 توزیع کلاس‌ها: {np.bincount(y)}")

# محاسبه درصد کلاس‌ها
class0_count = (y==0).sum()
class1_count = (y==1).sum()
total = len(y)
class0_percent = class0_count / total * 100
class1_percent = class1_count / total * 100

print(f"📊 درصد هر کلاس: Class 0: {class0_percent:.1f}%, Class 1: {class1_percent:.1f}%")

# Features (همه ستون‌ها به جز Churn)
feature_columns = [col for col in df.columns if col != 'Churn']
X = df.drop('Churn', axis=1).values

print(f"\n🔧 Features: {feature_columns}")
print(f"📊 شکل X: {X.shape}")
print(f"📊 شکل y: {y.shape}")

# نمایش نمونه‌ها بدون indexing
print(f"\n📋 نمونه از X (اولین 3 سطر):")
for i in range(3):
    print(f"سطر {i}: {X[i]}")

print(f"\n📋 نمونه از y (اولین 10 مقدار):")
print(y[:10])

# بررسی اینکه آیا داده‌ها آماده هستند - بدون indexing
n_samples = len(X)
n_features = len(feature_columns)
n_classes = len(np.unique(y))

print(f"\n✅ داده‌ها آماده شدند:")
print(f"   - تعداد نمونه‌ها: {n_samples}")
print(f"   - تعداد ویژگی‌ها: {n_features}")
print(f"   - تعداد کلاس‌ها: {n_classes}")

print("=" * 50)


🎯 آماده‌سازی داده‌ها...
📊 Target (Churn): [1 1 0 1 0 0 1 1 1 0 0 0 1 1 1 1 0 1 1 0 1 0 0 0 1 1 1 1 0 1]
📈 توزیع کلاس‌ها: [12 18]
📊 درصد هر کلاس: Class 0: 40.0%, Class 1: 60.0%

🔧 Features: ['Age', 'LastTransaction', 'Gender_female', 'Gender_male', 'Payment Method_cash', 'Payment Method_cheque', 'Payment Method_credit card']
📊 شکل X: (30, 7)
📊 شکل y: (30,)

📋 نمونه از X (اولین 3 سطر):
سطر 0: [ 38 171   0   1   0   1   0]
سطر 1: [ 24 140   1   0   0   1   0]
سطر 2: [82 39  0  1  1  0  0]

📋 نمونه از y (اولین 10 مقدار):
[1 1 0 1 0 0 1 1 1 0]

✅ داده‌ها آماده شدند:
   - تعداد نمونه‌ها: 30
   - تعداد ویژگی‌ها: 7
   - تعداد کلاس‌ها: 2


In [9]:
# Import ماژول‌های پروژه
print("📦 در حال import ماژول‌های پروژه...")

try:
    # Import کتابخانه اصلی
    from custom_tree_classifier import CustomDecisionTreeClassifier
    from custom_tree_classifier.metrics.metric_base import MetricBase
    print("✅ CustomDecisionTreeClassifier import شد")
    
    # Import utils
    from utils.voting_split_manager import FNWeightedSplitManager
    print("✅ FNWeightedSplitManager import شد")
    
    # Import معیارها
    from criteria.gini import gini_criterion
    from criteria.qg import gain_ratio_criterion  
    from criteria.twoing import twoing_criterion
    from criteria.ng import normalized_gain_criterion
    from criteria.mch import multi_class_hellinger
    from criteria.marsh import marsh_criterion
    from criteria.gs import g_statistic_criterion
    from criteria.dkm import dkm_criterion
    from criteria.cs import chi_squared_criterion
    from criteria.bhy import bhattacharyya_criterion
    from criteria.ks import kolmogorov_smirnov_criterion
    
    print("✅ تمام 11 معیار import شدند")
    
    # لیست معیارها برای بررسی
    criteria_list = [
        "gini_criterion", "gain_ratio_criterion", "twoing_criterion",
        "normalized_gain_criterion", "multi_class_hellinger", "marsh_criterion", 
        "g_statistic_criterion", "dkm_criterion", "chi_squared_criterion",
        "bhattacharyya_criterion", "kolmogorov_smirnov_criterion"
    ]
    
    print(f"📋 معیارهای موجود: {len(criteria_list)} عدد")
    for i, criterion in enumerate(criteria_list, 1):
        print(f"   {i}. {criterion}")
        
    print("✅ تمام ماژول‌ها با موفقیت import شدند!")
    
except ImportError as e:
    print(f"❌ خطا در import: {e}")
    print("🔍 بررسی کنید که path ها درست باشند")

print("=" * 50)


📦 در حال import ماژول‌های پروژه...
✅ CustomDecisionTreeClassifier import شد
✅ FNWeightedSplitManager import شد
✅ تمام 11 معیار import شدند
📋 معیارهای موجود: 11 عدد
   1. gini_criterion
   2. gain_ratio_criterion
   3. twoing_criterion
   4. normalized_gain_criterion
   5. multi_class_hellinger
   6. marsh_criterion
   7. g_statistic_criterion
   8. dkm_criterion
   9. chi_squared_criterion
   10. bhattacharyya_criterion
   11. kolmogorov_smirnov_criterion
✅ تمام ماژول‌ها با موفقیت import شدند!


In [10]:
print("📦 Import کردن مدل از فایل...")

try:
    from model.weighted_decision_tree import WeightedDecisionTreeModel
    print("✅ WeightedDecisionTreeModel از فایل import شد")
    
except ImportError as e:
    print(f"❌ خطا در import مدل: {e}")
    print("🔍 فایل‌های موجود در پوشه model:")
    model_path = os.path.join(src_path, "model")
    if os.path.exists(model_path):
        for file in os.listdir(model_path):
            print(f"   - {file}")
    else:
        print("❌ پوشه model پیدا نشد")

print("=" * 50)


📦 Import کردن مدل از فایل...
✅ WeightedDecisionTreeModel از فایل import شد


In [11]:
print("🚀 در حال ساخت مدل...")

try:
    # ساخت مدل با داده‌های ما
    model = WeightedDecisionTreeModel(X_data=X, max_depth=5)
    print("✅ مدل با موفقیت ساخته شد!")
    print(f"📊 شکل داده‌های مدل: {model.X_data.shape}")
    print(f"🎯 حداکثر عمق: {model.max_depth}")
    print(f"📋 تعداد معیارها: {len(model.criteria)}")
    
except Exception as e:
    print(f"❌ خطا در ساخت مدل: {e}")

print("=" * 50)


🚀 در حال ساخت مدل...
✅ مدل با موفقیت ساخته شد!
📊 شکل داده‌های مدل: (30, 7)
🎯 حداکثر عمق: 5
📋 تعداد معیارها: 11


In [12]:
print("🔥 شروع آموزش مدل...")

try:
    # آموزش مدل
    model.fit(X, y)
    print("🎉 آموزش با موفقیت تکمیل شد!")
    
except Exception as e:
    print(f"❌ خطا در آموزش: {e}")
    import traceback
    traceback.print_exc()

print("=" * 50)


🔥 شروع آموزش مدل...
شروع آموزش مدل - شکل داده: X=(30, 7), y=(30,)
آموزش تکمیل شد!
🎉 آموزش با موفقیت تکمیل شد!


In [15]:
print("🔮 پیش‌بینی و ارزیابی مدل...")

try:
    # پیش‌بینی کلاس‌ها
    predictions = model.predict(X)
    print("✅ پیش‌بینی کلاس‌ها انجام شد")
    
    # پیش‌بینی احتمالات
    probabilities = model.predict_proba(X)
    print("✅ پیش‌بینی احتمالات انجام شد")
    
    # نمایش نتایج
    print(f"\n📊 نتایج:")
    print(f"   پیش‌بینی‌ها: {predictions}")
    print(f"   واقعی:      {y}")
    
    # محاسبه دقت
    accuracy = accuracy_score(y, predictions)
    print(f"\n🎯 دقت مدل: {accuracy:.3f} ({accuracy*100:.1f}%)")
    
    # ماتریس درهم‌ریختگی
    cm = confusion_matrix(y, predictions)
    print(f"\n📋 ماتریس درهم‌ریختگی:")
    print(cm)
    
    # محاسبه False Negative
    tn, fp, fn, tp = cm.ravel()
    print(f"\n📈 جزئیات:")
    print(f"   True Positive (TP): {tp}")
    print(f"   False Positive (FP): {fp}")
    print(f"   True Negative (TN): {tn}")
    print(f"   False Negative (FN): {fn}")
    
except Exception as e:
    print(f"❌ خطا در پیش‌بینی: {e}")
    import traceback
    traceback.print_exc()

print("=" * 50)


🔮 پیش‌بینی و ارزیابی مدل...
✅ پیش‌بینی کلاس‌ها انجام شد
✅ پیش‌بینی احتمالات انجام شد

📊 نتایج:
   پیش‌بینی‌ها: [0 1 0 1 0 0 1 1 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 1 1 1 1 0 1]
   واقعی:      [1 1 0 1 0 0 1 1 1 0 0 0 1 1 1 1 0 1 1 0 1 0 0 0 1 1 1 1 0 1]

🎯 دقت مدل: 0.800 (80.0%)

📋 ماتریس درهم‌ریختگی:
[[12  0]
 [ 6 12]]

📈 جزئیات:
   True Positive (TP): 12
   False Positive (FP): 0
   True Negative (TN): 12
   False Negative (FN): 6
