In [1]:
import pandas as pd
import numpy as np
from datetime import datetime

# بيانات الموظفين
employee_data = {
    "EmployeeID": [101, 102, 103, 104, 105],
    "Name": ["Alice Brown", "Bob Smith", "Charlie Jones", "David Wilson", "Emma Johnson"],
    "DepartmentID": [1, 2, 1, 3, 2],
    "Salary": [60000, 55000, 70000, 50000, 60000],
    "HireDate": ["2021-03-15", "2019-07-22", "2022-01-30", "2018-11-05", "2020-05-18"],
    "PerformanceScore": [4.5, 3.8, 4.0, 4.2, 4.7]
}

# بيانات الأقسام
department_data = {
    "DepartmentID": [1, 2, 3],
    "DepartmentName": ["Sales", "Marketing", "HR"]
}

# تحويل البيانات إلى DataFrames
df_employees = pd.DataFrame(employee_data)
df_departments = pd.DataFrame(department_data)

# 1. دمج بيانات الموظفين مع بيانات الأقسام
df_merged = pd.merge(df_employees, df_departments, on="DepartmentID")

# 2. حساب المكافأة السنوية بناءً على أداء الموظفين
df_merged["AnnualBonus"] = df_merged["PerformanceScore"] * 1000  # يمكن تعديل المعادلة حسب الاحتياج

# 3. تطبيع الرواتب إلى نطاق بين 0 و 1
df_merged["NormalizedSalary"] = (df_merged["Salary"] - df_merged["Salary"].min()) / (df_merged["Salary"].max() - df_merged["Salary"].min())

# 4. حساب متوسط الرواتب لكل قسم
avg_salary_by_dept = df_merged.groupby("DepartmentName")["Salary"].mean().reset_index()
avg_salary_by_dept.columns = ["DepartmentName", "AverageSalary"]

# 5. تحديد الموظفين ذوي الأداء العالي
df_merged["HighPerformer"] = df_merged["PerformanceScore"] > 4.5

# 6. حساب عدد سنوات العمل
current_year = datetime.now().year
df_merged["Tenure"] = current_year - pd.to_datetime(df_merged["HireDate"]).dt.year

# 7. ترتيب البيانات حسب أداء الموظفين
df_sorted = df_merged.sort_values(by="PerformanceScore", ascending=False)

# 8. حساب عدد الموظفين في كل قسم
employee_count_by_dept = df_merged["DepartmentName"].value_counts().reset_index()
employee_count_by_dept.columns = ["DepartmentName", "EmployeeCount"]

# 9. حفظ البيانات النهائية إلى ملف CSV
df_sorted.to_csv("final_employee_data.csv", index=False)

# عرض النتائج
print("البيانات المدمجة:")
print(df_merged)
print("\nمتوسط الرواتب لكل قسم:")
print(avg_salary_by_dept)
print("\nعدد الموظفين في كل قسم:")
print(employee_count_by_dept)


البيانات المدمجة:
   EmployeeID           Name  DepartmentID  Salary    HireDate  \
0         101    Alice Brown             1   60000  2021-03-15   
1         102      Bob Smith             2   55000  2019-07-22   
2         103  Charlie Jones             1   70000  2022-01-30   
3         104   David Wilson             3   50000  2018-11-05   
4         105   Emma Johnson             2   60000  2020-05-18   

   PerformanceScore DepartmentName  AnnualBonus  NormalizedSalary  \
0               4.5          Sales       4500.0              0.50   
1               3.8      Marketing       3800.0              0.25   
2               4.0          Sales       4000.0              1.00   
3               4.2             HR       4200.0              0.00   
4               4.7      Marketing       4700.0              0.50   

   HighPerformer  Tenure  
0          False       3  
1          False       5  
2          False       2  
3          False       6  
4           True       4  

متوسط ا