In [1]:
import streamlit as st
import pandas as pd
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import arabic_reshaper
from bidi.algorithm import get_display

# 📝 Streamlit page settings
st.set_page_config(page_title="تحليل ترك العمل", layout="centered")
st.title("📊 تحليل ترك العمل - الموارد البشرية")

# 🔄 Load Excel data
@st.cache_data
def load_data():
    df = pd.read_excel("hr_cleaned.xlsx", sheet_name="ترك")
    df.columns = df.columns.str.strip()
    return df

df_reasons = load_data()

# 🔎 Validate 'الإدارة' column
if 'الإدارة' not in df_reasons.columns:
    st.error("❌ العمود 'الإدارة' غير موجود في ورقة 'ترك'.")
    st.stop()

departments = df_reasons['الإدارة'].dropna().unique().tolist()
selected_dept = st.selectbox("🧭 اختر الإدارة", departments)

if selected_dept:
    filtered = df_reasons[df_reasons['الإدارة'] == selected_dept]

    if filtered.empty:
        st.warning("⚠️ لا توجد بيانات لهذا القسم.")
    else:
        # 📝 Display unique reasons
        reasons = pd.Series(filtered['السبب'].dropna().unique())
        st.subheader("📝 أسباب ترك العمل:")
        for i, reason in enumerate(reasons, 1):
            st.write(f"{i}. {reason}")

        # ☁️ Word Cloud for الأسباب with Arabic shaping
        text_raw = ' '.join(filtered['السبب'].dropna().astype(str).values)
        if text_raw.strip() != '':
            st.subheader("☁️ سحابة الكلمات لأسباب ترك العمل")

            # Arabic reshaping and bidi
            reshaped_text = arabic_reshaper.reshape(text_raw)
            bidi_text = get_display(reshaped_text)

            # Set your Arabic font path here
            font_path = "Amiri-Regular.ttf"  # Ensure this font is in your working folder

            wordcloud = WordCloud(
                font_path=font_path,
                width=800,
                height=400,
                background_color='white',
                collocations=False
            ).generate(bidi_text)

            fig_wc, ax_wc = plt.subplots(figsize=(10, 5))
            ax_wc.imshow(wordcloud, interpolation='bilinear')
            ax_wc.axis('off')
            st.pyplot(fig_wc)
        else:
            st.write("لا توجد بيانات كافية لإنشاء سحابة الكلمات.")

        # ⏳ Average years of work
        avg_years = pd.to_numeric(filtered['عدد السنوات'], errors='coerce').mean()
        if pd.isna(avg_years):
            st.write("⏳ متوسط سنوات العمل: لا توجد بيانات صالحة.")
        else:
            st.write(f"⏳ متوسط سنوات العمل لجميع الأسباب: {avg_years:.2f} سنة")

        # 👤 Gender distribution
        gender_map = {'Male': 'ذكر', 'ذكر': 'ذكر', 'Female': 'أنثى', 'أنثى': 'أنثى'}
        filtered_gender = filtered['الجنس'].map(gender_map).dropna()
        gender_counts = filtered_gender.value_counts()
        gender_labels = gender_counts.index.tolist()
        gender_sizes = gender_counts.values

        # 💍 Marital status
        marital_filtered = filtered[filtered['الوضع الاجتماعي'].isin(['متزوج/ة', 'أعزب/عزباء'])]
        marital_counts = marital_filtered['الوضع الاجتماعي'].value_counts()
        marital_labels = marital_counts.index.tolist()
        marital_sizes = marital_counts.values

        # 🎨 Pie charts
        fig, axes = plt.subplots(1, 2, figsize=(12, 5))

        if len(gender_sizes) > 0:
            axes[0].pie(gender_sizes, labels=gender_labels, autopct='%1.1f%%', startangle=140)
            axes[0].set_title('نسبة الذكور والإناث')
            axes[0].axis('equal')
        else:
            axes[0].text(0.5, 0.5, 'لا توجد بيانات للجنس', ha='center', va='center')
            axes[0].axis('off')

        if len(marital_sizes) > 0:
            axes[1].pie(marital_sizes, labels=marital_labels, autopct='%1.1f%%', startangle=90)
            axes[1].set_title('نسبة متزوج/ة وأعزب/عزباء')
            axes[1].axis('equal')
        else:
            axes[1].text(0.5, 0.5, 'لا توجد بيانات للوضع الاجتماعي', ha='center', va='center')
            axes[1].axis('off')

        plt.tight_layout()
        st.pyplot(fig)

        # 👥 Age intervals
        st.subheader("👥 الفئات العمرية:")
        age_bins = [20, 30, 40, 50, 60, 70]
        age_labels = ['20–29', '30–39', '40–49', '50–59', '60–69']
        filtered = filtered.copy()
        filtered['فئة العمر'] = pd.cut(pd.to_numeric(filtered['العمر'], errors='coerce'),
                                        bins=age_bins, labels=age_labels, right=False)
        age_counts = filtered['فئة العمر'].value_counts().sort_index()

        for label, count in age_counts.items():
            st.write(f"{label}: {count} موظف")


2025-06-28 01:31:23.103 
  command:

    streamlit run c:\Users\User\Desktop\hr_analysis_app\venv\Lib\site-packages\ipykernel_launcher.py [ARGUMENTS]
2025-06-28 01:31:23.108 No runtime found, using MemoryCacheStorageManager
2025-06-28 01:31:23.112 No runtime found, using MemoryCacheStorageManager
2025-06-28 01:31:24.765 Session state does not function when running a script without `streamlit run`
