In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import VotingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report

# بارگذاری فایل دیتاست
file_path = '/content/depression_anxiety_data.csv'
Df = pd.read_csv(file_path)

# حذف ردیف‌هایی که مقدار برچسب severity در آن‌ها موجود نیست
Df = Df.dropna(subset=['depression_severity'])

# حذف فاصله‌های اضافی و نرمال‌سازی برچسب‌ها
Df['depression_severity'] = Df['depression_severity'].astype(str).str.strip()

# تعریف ویژگی‌ها و برچسب (label)
X = Df.drop(columns=['depression_severity'])
Y = Df['depression_severity']

# تبدیل ویژگی‌های غیر عددی به عددی (one-hot encoding)
X = pd.get_dummies(X)

# حذف ستون‌هایی که مقادیر NaN دارند
X = X.dropna(axis=1, how='any')

# جایگزینی مقادیر NaN باقی‌مانده با صفر
X = X.fillna(0)

# نرمال‌سازی داده‌ها با StandardScaler
Scaler = StandardScaler()
X_scaled = Scaler.fit_transform(X)

# تقسیم داده‌ها به داده‌های آموزشی و آزمایشی
X_train, X_test, y_train, y_test = train_test_split(X_scaled, Y, test_size=0.2, random_state=42)

# تعریف مدل‌های مختلف برای طبقه‌بندی
models = {
    'Logistic Regression': LogisticRegression(max_iter=1000),
    'Decision Tree': DecisionTreeClassifier(),
    'KNN': KNeighborsClassifier(),
    'Voting (Hard)': VotingClassifier(estimators=[
        ('lr', LogisticRegression(max_iter=1000)),
        ('dt', DecisionTreeClassifier()),
        ('knn', KNeighborsClassifier())
    ], voting='hard'),
    'Voting (Soft)': VotingClassifier(estimators=[
        ('lr', LogisticRegression(max_iter=1000)),
        ('dt', DecisionTreeClassifier()),
        ('knn', KNeighborsClassifier())
    ], voting='soft')
}

# آموزش هر مدل و نمایش گزارش عملکرد آن‌ها
for name, model in models.items():
    print(f"\n=== {name} ===")
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    print(classification_report(y_test, y_pred, zero_division=0))


FileNotFoundError: [Errno 2] No such file or directory: '/content/depression_anxiety_data.csv'