<a href="https://colab.research.google.com/github/Mohamedelmahdy01/Student_Assistant/blob/main/Student_Assistant_model.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import accuracy_score


data = pd.read_csv("/content/educational_platform_dataset_balanced.csv")

field_counts = data["Recommended Field"].value_counts()
print("Field distribution before balancing:")
print(field_counts)

Field distribution before balancing:
Recommended Field
DevOps                     120
Data Analysis              120
Front-End Development      120
UI/UX Design               120
Embedded Systems           120
Game Development           120
Back-End Development       120
AI and Machine Learning    120
Cybersecurity              120
Name: count, dtype: int64


In [None]:

balanced_data = pd.DataFrame()
for field in field_counts.index:
    field_data = data[data["Recommended Field"] == field]
    balanced_data = pd.concat([
        balanced_data,
        field_data.sample(n=field_counts.max(), replace=True, random_state=42)
    ])



In [None]:

balanced_data = balanced_data.sample(frac=1, random_state=42).reset_index(drop=True)
balanced_data.to_csv("educational_platform_dataset_balanced1.csv", index=False)

print("Field distribution aftar balancing:")
print(field_counts)




Field distribution aftar balancing:
Recommended Field
DevOps                     120
Data Analysis              120
Front-End Development      120
UI/UX Design               120
Embedded Systems           120
Game Development           120
Back-End Development       120
AI and Machine Learning    120
Cybersecurity              120
Name: count, dtype: int64


In [None]:
X = balanced_data.drop("Recommended Field", axis=1)
y = balanced_data["Recommended Field"]


label_encoder = LabelEncoder()
y_encoded = label_encoder.fit_transform(y)


X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.2, random_state=42)
X_train.head()

Unnamed: 0,Q1,Q2,Q3,Q4,Q5,Q6,Q7,Q8,Q9,Q10,Q11,Q12,Q13,Q14,Q15,Q16,Q17,Q18,Q19,Q20
1009,3,5,1,2,2,3,1,1,1,3,4,1,1,3,3,2,4,1,5,4
628,2,3,4,5,5,2,3,5,4,5,4,2,3,5,5,2,1,1,5,2
644,2,4,2,5,1,3,5,5,1,4,4,2,2,1,3,4,5,1,2,4
884,2,3,3,5,5,1,1,4,2,2,2,2,4,1,2,3,4,3,4,5
591,3,3,1,4,4,2,3,1,2,2,2,2,3,2,5,5,4,1,3,4


In [None]:
# Create a Random Forest Model
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

# Model Evaluation
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy of the model: {accuracy:.2f}")

Accuracy of the model: 0.85


In [None]:


questions = {
    "Q1": "ما مدى اهتمامك بتحليل البيانات؟",
    "Q2": "ما مدى ارتياحك للتعامل مع العملاء؟",
    "Q3": "هل تفضل العمل على تطوير واجهات المستخدم في تطبيقات الويب؟",
    "Q4": "هل تفضل العمل على بناء الخوادم وقواعد البيانات؟",
    "Q5": "ما مدى معرفتك بالرياضيات والإحصاء؟",
    "Q6": "ما مدى اهتمامك بالتصميم البصري وتفاعلية التطبيقات؟",
    "Q7": "هل تحب تحسين الأداء البرمجي على مستوى الخادم؟",
    "Q8": "هل تستمتع بحل المشاكل المعقدة؟",
    "Q9": "ما مدى اهتمامك بالتعلم الآلي والذكاء الاصطناعي؟",
    "Q10": "ما مدى إتقانك للغات البرمجة؟",
    "Q11": "هل تستمتع بتصميم واجهات متجاوبة مع مختلف الأجهزة؟",
    "Q12": "ما مدى معرفتك بالتعامل مع قواعد البيانات الكبيرة؟",
    "Q13": "هل تفضل العمل على الخوارزميات وتحسين الكفاءة؟",
    "Q14": "هل لديك اهتمام بتطوير الألعاب؟",
    "Q15": "هل لديك خبرة في تحسين الأداء البرمجي من جهة العميل؟",
    "Q16": "هل تحب التعامل مع أدوات بناء التطبيقات مثل React؟",
    "Q17": "ما مدى معرفتك ببناء REST APIs؟",
    "Q18": "هل تحب العمل على تحسين أمان التطبيقات؟",
    "Q19": "هل تفضل المشاريع الديناميكية قصيرة الأمد؟",
    "Q20": "هل تستمتع بتعلم تقنيات جديدة باستمرار؟",
}

# Function to predict the field
def predict_field(user_answers):
    prediction = model.predict([user_answers])
    field = label_encoder.inverse_transform(prediction)
    return field[0]


user_answers = [1, 3, 2, 2, 2, 2, 4, 4, 1, 4, 2, 1, 1, 1, 4, 2, 0, 2, 2, 5]
recommended_field = predict_field(user_answers)
print(f"Recommended Field for the user: {recommended_field}")


Recommended Field for the user: Front-End Development


