In [3]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Perceptron
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
import matplotlib.pyplot as plt
import seaborn as sns

# قراءة مجموعة البيانات
dataset = pd.read_csv('C:\Users\wtaba\OneDrive\Desktop.csv')

# توصيف مجموعة البيانات
print(f"عدد العينات والميزات: {dataset.shape}")
print(dataset['الصنف'].value_counts())

# عرض العينات في فضاء ثنائي البعد (scatter plot)
sns.scatterplot(x='Feature1', y='Feature2', hue='الصنف', data=dataset)
plt.show()

# المعالجة المسبقة للبيانات (قم بتطبيق أي عمليات تناسب المشروع)
# تجهيز مجموعة البيانات
train_data, test_data = train_test_split(dataset, test_size=0.2, random_state=42)

# تدريب نموذج Benchmark
model_benchmark = Perceptron()
model_benchmark.fit(train_data.drop('الصنف', axis=1), train_data['الصنف'])
predictions_benchmark = model_benchmark.predict(test_data.drop('الصنف', axis=1))
accuracy_benchmark = accuracy_score(test_data['الصنف'], predictions_benchmark)
print(f"دقة النموذج Benchmark: {accuracy_benchmark}")

# تدريب شبكة عصبونية
model_neural_network = MLPClassifier(hidden_layer_sizes=(5,), max_iter=5000, random_state=42)
model_neural_network.fit(train_data.drop('الصنف', axis=1), train_data['الصنف'])
predictions_neural_network = model_neural_network.predict(test_data.drop('الصنف', axis=1))
accuracy_neural_network = accuracy_score(test_data['الصنف'], predictions_neural_network)
print(f"دقة الشبكة العصبونية: {accuracy_neural_network}")

# قم بعرض confusion matrix
cm = confusion_matrix(test_data['الصنف'], predictions_neural_network)
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=model_neural_network.classes_, yticklabels=model_neural_network.classes_)
plt.xlabel('التنبؤ')
plt.ylabel('الحقيقي')
plt.show()

# classification report
print(classification_report(test_data['الصنف'], predictions_neural_network))

# بحث عن قيم الباراميترات الأفضل باستخدام GridSearchCV
param_grid = {'hidden_layer_sizes': [(5,), (10,), (20,)]}
grid_search = GridSearchCV(MLPClassifier(max_iter=5000, random_state=42), param_grid, cv=5)
grid_search.fit(train_data.drop('الصنف', axis=1), train_data['الصنف'])

# عرض أفضل قيم للباراميترات
print("أفضل قيم للباراميترات:", grid_search.best_params_)

# إعادة تدريب الشبكة بأفضل قيم للباراميترات
best_model_neural_network = grid_search.best_estimator_
best_model_neural_network.fit(train_data.drop('الصنف', axis=1), train_data['الصنف'])

# تقييم الدقة النهائية
final_predictions = best_model_neural_network.predict(test_data.drop('الصنف', axis=1))
final_accuracy = accuracy_score(test_data['الصنف'], final_predictions)
print(f"الدقة النهائية: {final_accuracy}")


SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape (2647370124.py, line 11)