<a href="https://colab.research.google.com/github/nasibehmohammadi/Thesis/blob/main/1DT_d1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report

file_path = "/content/d1.csv"

df = pd.read_csv(file_path)

print("🔍 بررسی ۵ سطر اول دیتاست:")
print(df.head())

feature_columns = ["B", "C", "D", "E", "F", "G", "H", "I", "J"]
target_column = "A"

X_data = df[feature_columns].values
y_data = df[target_column].values

scaler = MinMaxScaler()
X_data = scaler.fit_transform(X_data)

X_train, X_test, y_train, y_test = train_test_split(X_data, y_data, test_size=0.2, random_state=42)

model = DecisionTreeClassifier(criterion='gini', max_depth=5, random_state=42)

model.fit(X_train, y_train)

y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"✅ دقت مدل روی داده‌های تست: {accuracy * 100:.2f}%")
print("📊 گزارش عملکرد مدل:")
print(classification_report(y_test, y_pred))

test_sample = np.array(X_test[0]).reshape(1, -1)
prediction = model.predict(test_sample)

if prediction[0] == 1:
    print("🚨 ورود مشکوک! نیاز به احراز هویت بیشتر.")
else:
    print("✅ ورود ایمن است.")


🔍 بررسی ۵ سطر اول دیتاست:
   A      B      C       D       E       F       G       H       I       J
0  1  39353  85475  117961  118300  123472  117905  117906  290919  117908
1  1  17183   1540  117961  118343  123125  118536  118536  308574  118539
2  1  36724  14457  118219  118220  117884  117879  267952   19721  117880
3  1  36135   5396  117961  118343  119993  118321  240983  290919  118322
4  1  42680   5905  117929  117930  119569  119323  123932   19793  119325
✅ دقت مدل روی داده‌های تست: 94.28%
📊 گزارش عملکرد مدل:
              precision    recall  f1-score   support

           0       0.25      0.01      0.02       369
           1       0.94      1.00      0.97      6185

    accuracy                           0.94      6554
   macro avg       0.60      0.50      0.49      6554
weighted avg       0.90      0.94      0.92      6554

🚨 ورود مشکوک! نیاز به احراز هویت بیشتر.


In [None]:
from sklearn.metrics import f1_score


# 9️⃣ محاسبه دقت و F1-Score
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, average='weighted')
print(f"✅ دقت مدل: {accuracy * 100:.2f}%")
print(f"📊 F1-Score: {f1:.4f}")



✅ دقت مدل: 94.28%
📊 F1-Score: 0.9168


In [None]:
train_acc = model.score(X_train, y_train)
test_acc = model.score(X_test, y_test)

print(f"Train Accuracy: {train_acc:.2f}")
print(f"Test Accuracy: {test_acc:.2f}")

if train_acc - test_acc > 0.1:
    print("⚠️ احتمال بیش‌برازش وجود دارد!")
else:
    print("✅ مدل احتمالاً بیش‌برازش ندارد.")


Train Accuracy: 0.94
Test Accuracy: 0.94
✅ مدل احتمالاً بیش‌برازش ندارد.


In [None]:
from sklearn.model_selection import GridSearchCV
from sklearn.tree import DecisionTreeClassifier

# تعیین محدوده عمق‌های مختلف برای تست
param_grid = {'max_depth': range(1, 10)}

# اجرای جستجوی شبکه‌ای برای پیدا کردن بهترین مقدار
grid_search = GridSearchCV(DecisionTreeClassifier(), param_grid, cv=5)
grid_search.fit(X_train, y_train)

# نمایش بهترین مقدار `max_depth`
print("بهترین مقدار max_depth:", grid_search.best_params_['max_depth'])


بهترین مقدار max_depth: 6
