<a href="https://colab.research.google.com/github/sari861/final-project/blob/main/Welcome_to_Colab.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

To learn more about accelerating pandas on Colab, see the <a href="https://colab.research.google.com/github/rapidsai-community/showcase/blob/main/getting_started_tutorials/cudf_pandas_colab_demo.ipynb">10-minute guide</a> or
 <a href="https://colab.research.google.com/github/rapidsai-community/showcase/blob/main/getting_started_tutorials/cudf_pandas_stocks_demo.ipynb">US stock market data analysis demo</a>.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import matplotlib.dates as mdates
import matplotlib.ticker as mtick

# תמיכה בעברית
import matplotlib as mpl
mpl.rcParams['font.family'] = 'Arial'
plt.rcParams['axes.unicode_minus'] = False

# נתיב לקובץ האקסל - שנה לנתיב הנכון
file_path = 'your_hospital_data.xlsx'

# קריאת כל הגיליונות
try:
    general_data = pd.read_excel(file_path, sheet_name='GeneralData')
    hospitalization1 = pd.read_excel(file_path, sheet_name='hospitalization1')
    hospitalization2 = pd.read_excel(file_path, sheet_name='hospitalization2')
    drugs = pd.read_excel(file_path, sheet_name='Drugs')
    icd9 = pd.read_excel(file_path, sheet_name='ICD9')
    units_occupancy = pd.read_excel(file_path, sheet_name='unitsOccupancyRate')
    units_admissions = pd.read_excel(file_path, sheet_name='unitsAdmissions')
    er_doctor = pd.read_excel(file_path, sheet_name='erDoctor')
    h_doctor = pd.read_excel(file_path, sheet_name='hDoctor')

    print("כל הגיליונות נטענו בהצלחה!")
except Exception as e:
    print(f"שגיאה בטעינת הגיליונות: {e}")

def analyze_hospital_data():
    # מילון לאחסון כל הנתונים המעובדים
    results = {}

    # 1. מספר האשפוזים
    # שילוב של שני גיליונות האשפוז
    all_hospitalizations = pd.concat([
        hospitalization1[['Patient', 'Admission_Medical_Record', 'Admission_Entry_Date']],
        hospitalization2[['Patient', 'Admission_Medical_Record', 'Admission_Entry_Date']]
    ])

    # המרת תאריכים לפורמט תאריך
    all_hospitalizations['Admission_Entry_Date'] = pd.to_datetime(
        all_hospitalizations['Admission_Entry_Date'], errors='coerce')

    # הוספת עמודת שנה
    all_hospitalizations['year'] = all_hospitalizations['Admission_Entry_Date'].dt.year

    # חישוב מספר אשפוזים לפי שנה
    hospitalizations_per_year = all_hospitalizations.groupby('year').size()
    results['מספר האשפוזים'] = hospitalizations_per_year

    # 3. שיעור האשפוזים (צריך גודל אוכלוסייה - נשתמש בערך דמה 100,000)
    population = 100000  # ערך דמה - יש להחליף במספר האמיתי אם קיים
    hospitalization_rate_per_year = hospitalizations_per_year / population * 1000
    results['שיעור האשפוזים ל-1000 תושבים'] = hospitalization_rate_per_year

    # 5. גיל ומין של המאושפזים
    # ניתוח גיל
    if 'age' in general_data.columns:
        # יצירת קבוצות גיל
        age_bins = [0, 15, 45, 55, 65, 75, 85, 150]
        age_labels = ['0-14', '15-44', '45-54', '55-64', '65-74', '75-84', '85+']
        general_data['age_group'] = pd.cut(general_data['age'], bins=age_bins, labels=age_labels)

        # התפלגות קבוצות גיל
        age_distribution = general_data['age_group'].value_counts(normalize=True) * 100
        results['התפלגות גיל'] = age_distribution.sort_index()

        # גיל ממוצע
        results['גיל ממוצע'] = general_data['age'].mean()

    # ניתוח מגדר
    if 'Gender' in general_data.columns:
        gender_distribution = general_data['Gender'].value_counts(normalize=True) * 100
        results['התפלגות מגדר'] = gender_distribution

    # 6. גורם מבטחי
    if 'גורם משלם' in general_data.columns:
        insurer_distribution = general_data['גורם משלם'].value_counts(normalize=True) * 100
        results['התפלגות גורם מבטחי'] = insurer_distribution

    # 7. שיעור ימי אשפוז
    # חישוב משך אשפוז עבור כל אשפוז
    hospitalization1['LOS'] = (pd.to_datetime(hospitalization1['Release_Date']) -
                          pd.to_datetime(hospitalization1['Admission_Entry_Date'])).dt.days

    if 'Release_Date' in hospitalization2.columns and 'Admission_Entry_Date' in hospitalization2.columns:
        hospitalization2['LOS'] = (pd.to_datetime(hospitalization2['Release_Date']) -
                              pd.to_datetime(hospitalization2['Admission_Entry_Date'])).dt.days

    # שילוב נתוני משך אשפוז
    all_los = pd.concat([
        hospitalization1[['Patient', 'Admission_Entry_Date', 'LOS']],
        hospitalization2[['Patient', 'Admission_Entry_Date', 'LOS']] if 'LOS' in hospitalization2.columns else pd.DataFrame()
    ])

    # המרת תאריכים אם עוד לא הומרו
    if not pd.api.types.is_datetime64_any_dtype(all_los['Admission_Entry_Date']):
        all_los['Admission_Entry_Date'] = pd.to_datetime(all_los['Admission_Entry_Date'], errors='coerce')

    # הוספת עמודת שנה
    all_los['year'] = all_los['Admission_Entry_Date'].dt.year

    # חישוב ממוצע ימי אשפוז לפי שנה
    avg_los_per_year = all_los.groupby('year')['LOS'].mean()
    results['ממוצע ימי אשפוז'] = avg_los_per_year

    # ניתוח ימי אשפוז לפי קבוצות גיל
    merged_los_age = pd.merge(all_los, general_data[['Patient', 'age']], on='Patient', how='left')
    merged_los_age['age_group'] = pd.cut(
        merged_los_age['age'],
        bins=[0, 15, 45, 55, 65, 75, 85, 150],
        labels=['0-14', '15-44', '45-54', '55-64', '65-74', '75-84', '85+']
    )

    avg_los_by_age = merged_los_age.groupby('age_group')['LOS'].mean()
    results['ממוצע ימי אשפוז לפי גיל'] = avg_los_by_age

    # 8. אבחנות מובילות
    # איסוף כל אבחנות הקבלה והשחרור
    admission_diagnoses = []
    discharge_diagnoses = []

    # איסוף אבחנות מהטבלה הראשונה
    if 'אבחנות בקבלה' in hospitalization1.columns:
        admission_diagnoses.extend(hospitalization1['אבחנות בקבלה'].dropna().tolist())

    if 'אבחנות בשחרור' in hospitalization1.columns:
        discharge_diagnoses.extend(hospitalization1['אבחנות בשחרור'].dropna().tolist())

    # איסוף אבחנות מהטבלה השנייה
    if 'אבחנות בקבלה' in hospitalization2.columns:
        admission_diagnoses.extend(hospitalization2['אבחנות בקבלה'].dropna().tolist())

    if 'אבחנות בשחרור' in hospitalization2.columns:
        discharge_diagnoses.extend(hospitalization2['אבחנות בשחרור'].dropna().tolist())

    # פירוק רשימות קודים מופרדות בפסיקים
    all_admission_codes = []
    for diagnosis in admission_diagnoses:
        if isinstance(diagnosis, str):
            codes = [code.strip() for code in diagnosis.split(',')]
            all_admission_codes.extend(codes)

    all_discharge_codes = []
    for diagnosis in discharge_diagnoses:
        if isinstance(diagnosis, str):
            codes = [code.strip() for code in diagnosis.split(',')]
            all_discharge_codes.extend(codes)

    # ספירת קודי אבחנות בקבלה
    admission_code_counts = pd.Series(all_admission_codes).value_counts().reset_index()
    admission_code_counts.columns = ['ICD9', 'count']

    # ספירת קודי אבחנות בשחרור
    discharge_code_counts = pd.Series(all_discharge_codes).value_counts().reset_index()
    discharge_code_counts.columns = ['ICD9', 'count']

    # שילוב עם שמות האבחנות מטבלת ICD9
    admission_code_counts = admission_code_counts.merge(icd9, left_on='ICD9', right_on='ICD9', how='left')
    discharge_code_counts = discharge_code_counts.merge(icd9, left_on='ICD9', right_on='ICD9', how='left')

    # 10 האבחנות המובילות
    top_admission_diagnoses = admission_code_counts.head(10)
    top_discharge_diagnoses = discharge_code_counts.head(10)

    results['אבחנות קבלה מובילות'] = top_admission_diagnoses
    results['אבחנות שחרור מובילות'] = top_discharge_diagnoses

    # 9. אשפוזים חוזרים
    # סידור אשפוזים לפי מטופל ותאריך
    all_hospitalizations_sorted = all_hospitalizations.sort_values(['Patient', 'Admission_Entry_Date'])

    # חישוב ימים עד האשפוז הבא עבור אותו מטופל
    all_hospitalizations_sorted['next_admission'] = all_hospitalizations_sorted.groupby('Patient')['Admission_Entry_Date'].shift(-1)
    all_hospitalizations_sorted['days_to_next'] = (all_hospitalizations_sorted['next_admission'] - all_hospitalizations_sorted['Admission_Entry_Date']).dt.days

    # אשפוזים חוזרים תוך 30 יום
    readmits_30d = all_hospitalizations_sorted[all_hospitalizations_sorted['days_to_next'] <= 30]

    # שיעור אשפוזים חוזרים תוך 30 יום
    readmit_rate = len(readmits_30d) / len(all_hospitalizations_sorted) * 100
    results['שיעור אשפוזים חוזרים תוך 30 יום'] = readmit_rate

    # שיעור אשפוזים חוזרים לפי שנה
    readmit_rate_by_year = readmits_30d.groupby('year').size() / all_hospitalizations_sorted.groupby('year').size() * 100
    results['שיעור אשפוזים חוזרים לפי שנה'] = readmit_rate_by_year

    # 10. תפוסת מחלקות
    if 'שיעור תפוסה' in units_occupancy.columns:
        # המרת תאריכים לפורמט תאריך
        units_occupancy['תאריך'] = pd.to_datetime(units_occupancy['תאריך'], errors='coerce')

        # הוספת עמודת שנה
        units_occupancy['year'] = units_occupancy['תאריך'].dt.year

        # ממוצע תפוסה שנתי לפי מחלקה
        occupancy_by_dept_year = units_occupancy.groupby(['year', 'מחלקה'])['שיעור תפוסה'].mean()
        results['ממוצע תפוסה שנתי לפי מחלקה'] = occupancy_by_dept_year

        # תפוסה ממוצעת כללית לפי שנה
        overall_occupancy_by_year = units_occupancy.groupby('year')['שיעור תפוסה'].mean()
        results['תפוסה ממוצעת כללית לפי שנה'] = overall_occupancy_by_year

    # ניתוח של גורמים המשפיעים על הסיכוי לחזרה לאשפוז
    # מיזוג נתוני האשפוזים החוזרים עם נתוני המטופלים
    readmits_with_patient_data = pd.merge(
        readmits_30d,
        general_data[['Patient', 'age', 'Gender', 'גורם משלם', 'BMI']],
        on='Patient', how='left'
    )

    # ניתוח סיכוי לחזרה לאשפוז לפי גיל
    if 'age' in readmits_with_patient_data.columns:
        readmits_with_patient_data['age_group'] = pd.cut(
            readmits_with_patient_data['age'],
            bins=[0, 15, 45, 55, 65, 75, 85, 150],
            labels=['0-14', '15-44', '45-54', '55-64', '65-74', '75-84', '85+']
        )

        # שיעור אשפוזים חוזרים לפי קבוצת גיל
        all_patients_by_age = general_data.groupby('age_group').size()
        readmits_by_age = readmits_with_patient_data.groupby('age_group').size()
        readmit_rate_by_age = (readmits_by_age / all_patients_by_age * 100)
        results['שיעור אשפוזים חוזרים לפי קבוצת גיל'] = readmit_rate_by_age

    # ניתוח תרופות
    # מיזוג נתוני האשפוזים עם נתוני תרופות
    if 'תרופות קבועות' in general_data.columns:
        # ניתוח סוגי תרופות וקשר לאשפוזים חוזרים
        pass  # ממומש רק אם יש נתונים על תרופות

    return results

def generate_hospital_report():
    # ביצוע הניתוח
    analysis_results = analyze_hospital_data()

    # יצירת הדו"ח
    report_text = "ממצאים עיקריים - ניתוח נתוני אשפוז\n"
    report_text += "=" * 50 + "\n\n"

    # 1. מספר האשפוזים
    report_text += "מספר האשפוזים:\n"
    report_text += "-" * 20 + "\n"
    if 'מספר האשפוזים' in analysis_results:
        for year, count in analysis_results['מספר האשפוזים'].items():
            report_text += f"בשנת {year}: {count:,.0f} אשפוזים\n"
    report_text += "\n"

    # 3. שיעור האשפוזים
    report_text += "שיעור האשפוזים:\n"
    report_text += "-" * 20 + "\n"
    if 'שיעור האשפוזים ל-1000 תושבים' in analysis_results:
        for year, rate in analysis_results['שיעור האשפוזים ל-1000 תושבים'].items():
            report_text += f"בשנת {year}: {rate:.1f} ל-1,000 בני 15 ומעלה\n"
    report_text += "\n"

    # 4. גיל ומין
    report_text += "גיל ומין:\n"
    report_text += "-" * 20 + "\n"
    if 'התפלגות גיל' in analysis_results:
        report_text += "התפלגות גיל המאושפזים:\n"
        for age_group, percentage in analysis_results['התפלגות גיל'].items():
            report_text += f"  {age_group}: {percentage:.1f}%\n"

    if 'גיל ממוצע' in analysis_results:
        report_text += f"גיל ממוצע: {analysis_results['גיל ממוצע']:.1f}\n"

    if 'התפלגות מגדר' in analysis_results:
        report_text += "התפלגות מגדר:\n"
        for gender, percentage in analysis_results['התפלגות מגדר'].items():
            report_text += f"  {gender}: {percentage:.1f}%\n"
    report_text += "\n"

    # 5. משך שהייה
    report_text += "משך שהייה:\n"
    report_text += "-" * 20 + "\n"
    if 'ממוצע ימי אשפוז' in analysis_results:
        for year, avg_los in analysis_results['ממוצע ימי אשפוז'].items():
            report_text += f"בשנת {year}: {avg_los:.1f} ימים\n"

    if 'ממוצע ימי אשפוז לפי גיל' in analysis_results:
        report_text += "\nממוצע ימי אשפוז לפי קבוצת גיל:\n"
        for age_group, avg_los in analysis_results['ממוצע ימי אשפוז לפי גיל'].items():
            report_text += f"  {age_group}: {avg_los:.1f} ימים\n"
    report_text += "\n"

    # 6. אשפוזים חוזרים
    report_text += "אשפוזים חוזרים:\n"
    report_text += "-" * 20 + "\n"
    if 'שיעור אשפוזים חוזרים תוך 30 יום' in analysis_results:
        report_text += f"שיעור אשפוזים חוזרים תוך 30 יום: {analysis_results['שיעור אשפוזים חוזרים תוך 30 יום']:.1f}%\n"

    if 'שיעור אשפוזים חוזרים לפי שנה' in analysis_results:
        report_text += "\nשיעור אשפוזים חוזרים לפי שנה:\n"
        for year, rate in analysis_results['שיעור אשפוזים חוזרים לפי שנה'].items():
            report_text += f"  {year}: {rate:.1f}%\n"

    if 'שיעור אשפוזים חוזרים לפי קבוצת גיל' in analysis_results:
        report_text += "\nשיעור אשפוזים חוזרים לפי קבוצת גיל:\n"
        for age_group, rate in analysis_results['שיעור אשפוזים חוזרים לפי קבוצת גיל'].items():
            report_text += f"  {age_group}: {rate:.1f}%\n"
    report_text += "\n"

    # 7. אבחנות מובילות
    report_text += "אבחנות מובילות:\n"
    report_text += "-" * 20 + "\n"

    if 'אבחנות קבלה מובילות' in analysis_results:
        report_text += "אבחנות קבלה מובילות:\n"
        top_admissions = analysis_results['אבחנות קבלה מובילות']
        for _, row in top_admissions.iterrows():
            icd9_code = row['ICD9']
            name = row['Name'] if 'Name' in row and pd.notna(row['Name']) else "שם לא זמין"
            count = row['count']
            report_text += f"  {icd9_code} - {name}: {count} מקרים\n"

    if 'אבחנות שחרור מובילות' in analysis_results:
        report_text += "\nאבחנות שחרור מובילות:\n"
        top_discharges = analysis_results['אבחנות שחרור מובילות']
        for _, row in top_discharges.iterrows():
            icd9_code = row['ICD9']
            name = row['Name'] if 'Name' in row and pd.notna(row['Name']) else "שם לא זמין"
            count = row['count']
            report_text += f"  {icd9_code} - {name}: {count} מקרים\n"
    report_text += "\n"

    # 8. תפוסת מחלקות
    report_text += "תפוסת מחלקות:\n"
    report_text += "-" * 20 + "\n"
    if 'תפוסה ממוצעת כללית לפי שנה' in analysis_results:
        report_text += "תפוסה ממוצעת כללית לפי שנה:\n"
        for year, occupancy in analysis_results['תפוסה ממוצעת כללית לפי שנה'].items():
            report_text += f"  {year}: {occupancy:.1f}%\n"

    if 'ממוצע תפוסה שנתי לפי מחלקה' in analysis_results:
        report_text += "\nממוצע תפוסה שנתי לפי מחלקה:\n"
        occupancy_by_dept = analysis_results['ממוצע תפוסה שנתי לפי מחלקה']
        for (year, dept), occupancy in occupancy_by_dept.items():
            report_text += f"  שנה {year}, מחלקה {dept}: {occupancy:.1f}%\n"

    # שמירת הדו"ח לקובץ טקסט
    with open('hospital_data_analysis_report.txt', 'w', encoding='utf-8') as f:
        f.write(report_text)

    # יצירת גרפים
    create_visualizations(analysis_results)

    print("הדו"ח נוצר בהצלחה ונשמר בקובץ 'hospital_data_analysis_report.txt'")
    print("הגרפים נשמרו כקבצי תמונה")

    return report_text

def create_visualizations(results):
    # 1. מספר האשפוזים לפי שנה
    if 'מספר האשפוזים' in results:
        plt.figure(figsize=(10, 6))
        results['מספר האשפוזים'].plot(kind='bar', color='skyblue')
        plt.title('מספר האשפוזים לפי שנה', fontsize=14)
        plt.xlabel('שנה', fontsize=12)
        plt.ylabel('מספר אשפוזים', fontsize=12)
        plt.tight_layout()
        plt.savefig('hospitalizations_by_year.png', dpi=300)

    # 2. התפלגות גיל
    if 'התפלגות גיל' in results:
        plt.figure(figsize=(10, 6))
        results['התפלגות גיל'].plot(kind='bar', color='lightgreen')
        plt.title('התפלגות גיל המאושפזים', fontsize=14)
        plt.xlabel('קבוצת גיל', fontsize=12)
        plt.ylabel('אחוז (%)', fontsize=12)
        plt.tight_layout()
        plt.savefig('age_distribution.png', dpi=300)

    # 3. ממוצע ימי אשפוז לפי קבוצת גיל
    if 'ממוצע ימי אשפוז לפי גיל' in results:
        plt.figure(figsize=(10, 6))
        results['ממוצע ימי אשפוז לפי גיל'].plot(kind='bar', color='coral')
        plt.title('ממוצע ימי אשפוז לפי קבוצת גיל', fontsize=14)
        plt.xlabel('קבוצת גיל', fontsize=12)
        plt.ylabel('ימי אשפוז ממוצע', fontsize=12)
        plt.tight_layout()
        plt.savefig('avg_los_by_age.png', dpi=300)

    # 4. מגמת שיעור אשפוזים חוזרים לפי שנה
    if 'שיעור אשפוזים חוזרים לפי שנה' in results:
        plt.figure(figsize=(10, 6))
        results['שיעור אשפוזים חוזרים לפי שנה'].plot(kind='line', marker='o', color='purple')
        plt.title('שיעור אשפוזים חוזרים תוך 30 יום לפי שנה', fontsize=14)
        plt.xlabel('שנה', fontsize=12)
        plt.ylabel('שיעור (%)', fontsize=12)
        plt.grid(True, linestyle='--', alpha=0.7)
        plt.tight_layout()
        plt.savefig('readmission_rate_by_year.png', dpi=300)

    # 5. אבחנות מובילות
    if 'אבחנות קבלה מובילות' in results:
        plt.figure(figsize=(12, 8))
        top_diagnoses = results['אבחנות קבלה מובילות']

        # שימוש בשם האבחנה אם זמין, אחרת קוד ICD9
        if 'Name' in top_diagnoses.columns:
            diagnoses_names = top_diagnoses['Name'].fillna(top_diagnoses['ICD9']).values
        else:
            diagnoses_names = top_diagnoses['ICD9'].values

        plt.barh(diagnoses_names, top_diagnoses['count'], color='teal')
        plt.title('אבחנות קבלה מובילות', fontsize=14)
        plt.xlabel('מספר מקרים', fontsize=12)
        plt.tight_layout()
        plt.savefig('top_admission_diagnoses.png', dpi=300)

    # 6. תפוסה ממוצעת לפי שנה
    if 'תפוסה ממוצעת כללית לפי שנה' in results:
        plt.figure(figsize=(10, 6))
        results['תפוסה ממוצעת כללית לפי שנה'].plot(kind='line', marker='o', color='darkblue')
        plt.title('תפוסה ממוצעת כללית לפי שנה', fontsize=14)
        plt.xlabel('שנה', fontsize=12)
        plt.ylabel('תפוסה ממוצעת (%)', fontsize=12)
        plt.grid(True, linestyle='--', alpha=0.7)
        plt.tight_layout()
        plt.savefig('average_occupancy_by_year.png', dpi=300)

    # 7. שיעור אשפוזים חוזרים לפי קבוצת גיל
    if 'שיעור אשפוזים חוזרים לפי קבוצת גיל' in results:
        plt.figure(figsize=(10, 6))
        results['שיעור אשפוזים חוזרים לפי קבוצת גיל'].plot(kind='bar', color='salmon')
        plt.title('שיעור אשפוזים חוזרים לפי קבוצת גיל', fontsize=14)
        plt.xlabel('קבוצת גיל', fontsize=12)
        plt.ylabel('שיעור (%)', fontsize=12)
        plt.tight_layout()
        plt.savefig('readmission_rate_by_age.png', dpi=300)

# הרצת הניתוח
if __name__ == "__main__":
    report = generate_hospital_report()
    print("\nדוגמה לחלק מהדו"ח:")
    print("=" * 50)
    print(report[:1000] + "...")

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import matplotlib.dates as mdates
import matplotlib.ticker as mtick

# תמיכה בעברית
import matplotlib as mpl
from matplotlib import font_manager

# הוספת תמיכה בעברית
font_path = '/usr/share/fonts/truetype/freefont/FreeSans.ttf'  # נתיב לפונט תומך עברית - התאם לפי הצורך
font_prop = font_manager.FontProperties(fname=font_path)
mpl.rcParams['font.family'] = 'sans-serif'
mpl.rcParams['font.sans-serif'] = ['FreeSans']  # החלף בשם הפונט המתאים
plt.rcParams['axes.unicode_minus'] = False

# נתיב לקובץ האקסל - שנה לנתיב הנכון
file_path = 'your_hospital_data.xlsx'

# קריאת כל הגיליונות
try:
    general_data = pd.read_excel(file_path, sheet_name='GeneralData')
    hospitalization1 = pd.read_excel(file_path, sheet_name='hospitalization1')
    hospitalization2 = pd.read_excel(file_path, sheet_name='hospitalization2')
    drugs = pd.read_excel(file_path, sheet_name='Drugs')
    icd9 = pd.read_excel(file_path, sheet_name='ICD9')
    units_occupancy = pd.read_excel(file_path, sheet_name='unitsOccupancyRate')
    units_admissions = pd.read_excel(file_path, sheet_name='unitsAdmissions')

    print("כל הגיליונות נטענו בהצלחה!")
except Exception as e:
    print(f"שגיאה בטעינת הגיליונות: {e}")

def analyze_hospital_data():
    # מילון לאחסון כל הנתונים המעובדים
    results = {}

    # 1. ניתוח התפלגות הגילאים במאושפזים
    # יצירת קבוצות גיל
    age_bins = [0, 15, 45, 55, 65, 75, 85, 150]
    age_labels = ['0-14', '15-44', '45-54', '55-64', '65-74', '75-84', '85+']

    if 'age' in general_data.columns:
        general_data['age_group'] = pd.cut(general_data['age'], bins=age_bins, labels=age_labels)
        age_distribution = general_data['age_group'].value_counts(normalize=True) * 100
        results['התפלגות גיל כללית'] = age_distribution.sort_index()

    # 2. ניתוח אשפוזים לפי שנה וגיל
    # שילוב של שני גיליונות האשפוז
    all_hospitalizations = pd.concat([
        hospitalization1[['Patient', 'Admission_Entry_Date']],
        hospitalization2[['Patient', 'Admission_Entry_Date']]
    ])

    # המרת תאריכים לפורמט תאריך
    all_hospitalizations['Admission_Entry_Date'] = pd.to_datetime(
        all_hospitalizations['Admission_Entry_Date'], errors='coerce')

    # הוספת עמודת שנה
    all_hospitalizations['year'] = all_hospitalizations['Admission_Entry_Date'].dt.year

    # מיזוג עם נתוני המטופלים
    hosp_with_age = pd.merge(
        all_hospitalizations,
        general_data[['Patient', 'age', 'age_group', 'Gender']],
        on='Patient', how='left'
    )

    # חישוב מספר אשפוזים לפי שנה וקבוצת גיל
    hospitalizations_by_year_age = hosp_with_age.groupby(['year', 'age_group']).size().unstack()
    results['מספר אשפוזים לפי גיל ושנה'] = hospitalizations_by_year_age

    # חישוב מספר אשפוזים לפי שנה ומגדר
    hospitalizations_by_year_gender = hosp_with_age.groupby(['year', 'Gender']).size().unstack()
    results['מספר אשפוזים לפי מגדר ושנה'] = hospitalizations_by_year_gender

    # 3. ניתוח מספר אשפוזים כללי לפי שנה
    hospitalizations_by_year = hosp_with_age.groupby('year').size()
    results['מספר אשפוזים לפי שנה'] = hospitalizations_by_year

    # 4. חישוב שיעורי אשפוז (ל-1000 תושבים)
    # נניח שיש לנו אוכלוסייה קבועה של 100,000 איש (יש להתאים למספר הנכון אם ידוע)
    population = 100000

    # שיעור אשפוזים כללי לפי שנה
    hospitalization_rate = hospitalizations_by_year / population * 1000
    results['שיעור אשפוזים ל-1000 תושבים לפי שנה'] = hospitalization_rate

    # 5. חישוב ימי אשפוז
    # חישוב משך אשפוז עבור כל אשפוז
    hospitalization1['LOS'] = (pd.to_datetime(hospitalization1['Release_Date']) -
                          pd.to_datetime(hospitalization1['Admission_Entry_Date'])).dt.days

    if 'Release_Date' in hospitalization2.columns and 'Admission_Entry_Date' in hospitalization2.columns:
        hospitalization2['LOS'] = (pd.to_datetime(hospitalization2['Release_Date']) -
                              pd.to_datetime(hospitalization2['Admission_Entry_Date'])).dt.days

    # שילוב נתוני משך אשפוז
    all_los = pd.concat([
        hospitalization1[['Patient', 'Admission_Entry_Date', 'LOS']],
        hospitalization2[['Patient', 'Admission_Entry_Date', 'LOS']] if 'LOS' in hospitalization2.columns else pd.DataFrame()
    ])

    # המרת תאריכים וחישוב שנה
    all_los['Admission_Entry_Date'] = pd.to_datetime(all_los['Admission_Entry_Date'], errors='coerce')
    all_los['year'] = all_los['Admission_Entry_Date'].dt.year

    # מיזוג עם נתוני גיל
    los_with_age = pd.merge(all_los, general_data[['Patient', 'age_group']], on='Patient', how='left')

    # חישוב ממוצע ימי אשפוז לפי שנה
    avg_los_by_year = los_with_age.groupby('year')['LOS'].mean()
    results['ממוצע ימי אשפוז לפי שנה'] = avg_los_by_year

    # חישוב ממוצע ימי אשפוז לפי קבוצת גיל
    avg_los_by_age = los_with_age.groupby('age_group')['LOS'].mean()
    results['ממוצע ימי אשפוז לפי קבוצת גיל'] = avg_los_by_age

    # 6. אשפוזים חוזרים
    # סידור אשפוזים לפי מטופל ותאריך
    all_hospitalizations_sorted = all_hospitalizations.sort_values(['Patient', 'Admission_Entry_Date'])

    # חישוב ימים עד האשפוז הבא עבור אותו מטופל
    all_hospitalizations_sorted['next_admission'] = all_hospitalizations_sorted.groupby('Patient')['Admission_Entry_Date'].shift(-1)
    all_hospitalizations_sorted['days_to_next'] = (all_hospitalizations_sorted['next_admission'] - all_hospitalizations_sorted['Admission_Entry_Date']).dt.days

    # אשפוזים חוזרים תוך 30 יום
    readmits_30d = all_hospitalizations_sorted[all_hospitalizations_sorted['days_to_next'] <= 30]

    # שיעור אשפוזים חוזרים לפי שנה
    yearly_hospitalizations = all_hospitalizations_sorted.groupby('year').size()
    yearly_readmissions = readmits_30d.groupby('year').size()
    readmission_rate_by_year = yearly_readmissions / yearly_hospitalizations * 100
    results['שיעור אשפוזים חוזרים תוך 30 יום לפי שנה'] = readmission_rate_by_year

    # ניתוח אשפוזים חוזרים לפי מספר פעמים
    patient_hospitalization_counts = all_hospitalizations.groupby('Patient').size().reset_index(name='hospitalization_count')
    hospitalization_frequency = patient_hospitalization_counts['hospitalization_count'].value_counts(normalize=True) * 100

    # קטגוריות בדומה לגרף שהצגת: פעם אחת, פעמיים, 3 פעמים ומעלה
    frequency_categories = {
        'פעם אחת': hospitalization_frequency.get(1, 0),
        'פעמיים': hospitalization_frequency.get(2, 0),
        '3 פעמים ומעלה': hospitalization_frequency[hospitalization_frequency.index >= 3].sum()
    }
    results['התפלגות מאושפזים לפי מספר אשפוזים'] = frequency_categories

    return results

def create_visualizations(results):
    # 1. התפלגות המאושפזים לפי מספר אשפוזים (פעם אחת, פעמיים, 3+)
    if 'התפלגות מאושפזים לפי מספר אשפוזים' in results:
        plt.figure(figsize=(10, 6))
        categories = results['התפלגות מאושפזים לפי מספר אשפוזים']
        plt.pie(categories.values(), labels=categories.keys(), autopct='%1.0f%%',
                colors=['#f9d67a', '#e05d44', '#8b4513'], startangle=140)
        plt.axis('equal')
        plt.title('אחוז המאושפזים שאושפזו פעמיים או יותר לפי גיל', fontsize=14)
        plt.tight_layout()
        plt.savefig('hospitalization_frequency.png', dpi=300, bbox_inches='tight')

    # 2. מספר אשפוזים לפי גיל
    if 'מספר אשפוזים לפי גיל ושנה' in results:
        last_year_data = results['מספר אשפוזים לפי גיל ושנה'].iloc[-1]  # נתוני השנה האחרונה

        plt.figure(figsize=(12, 6))
        ax = plt.bar(last_year_data.index, last_year_data.values, color='#993333')

        # הוספת ערכים מעל העמודות
        for i, v in enumerate(last_year_data.values):
            if not np.isnan(v):  # בדיקה שהערך אינו NaN
                plt.text(i, v + 0.1, f'{int(v)}', ha='center')

        plt.title(f'מספר אשפוזים לפי קבוצות גיל, {last_year_data.name}', fontsize=14)
        plt.xlabel('קבוצת גיל', fontsize=12)
        plt.ylabel('מספר אשפוזים', fontsize=12)
        plt.xticks(rotation=0)
        plt.tight_layout()
        plt.savefig('hospitalizations_by_age.png', dpi=300, bbox_inches='tight')

    # 3. שיעור אשפוזים ל-1000 תושבים לפי שנה
    if 'שיעור אשפוזים ל-1000 תושבים לפי שנה' in results:
        plt.figure(figsize=(12, 6))
        results['שיעור אשפוזים ל-1000 תושבים לפי שנה'].plot(kind='line', marker='o', color='#e6994d')

        plt.title('שיעור אשפוזים מתוקנן לגיל ל-1,000 בני 15 ומעלה', fontsize=14)
        plt.xlabel('שנה', fontsize=12)
        plt.ylabel('שיעור ל-1,000 תושבים', fontsize=12)
        plt.grid(True, linestyle='--', alpha=0.7)
        plt.tight_layout()
        plt.savefig('hospitalization_rate_by_year.png', dpi=300, bbox_inches='tight')

    # 4. שיעור אשפוזים חוזרים תוך 30 יום לפי שנה
    if 'שיעור אשפוזים חוזרים תוך 30 יום לפי שנה' in results:
        plt.figure(figsize=(12, 6))
        results['שיעור אשפוזים חוזרים תוך 30 יום לפי שנה'].plot(kind='bar', color='#6c8ebf')

        # הוספת אחוזי שינוי בין שנים עוקבות
        readmission_rates = results['שיעור אשפוזים חוזרים תוך 30 יום לפי שנה']
        yearly_change = readmission_rates.pct_change() * 100

        plt.figure(figsize=(12, 6))
        yearly_change.plot(kind='bar', color=np.where(yearly_change >= 0, '#993333', '#333399'))

        # הוספת ערכים מעל העמודות
        for i, v in enumerate(yearly_change):
            if not np.isnan(v):  # בדיקה שהערך אינו NaN
                color = 'black'
                plt.text(i, v + (0.3 if v >= 0 else -0.8), f'{v:.0f}%', ha='center', color=color)

        plt.title('אחוז שינוי שנתי בשיעור האשפוזים המתוקנן לגיל', fontsize=14)
        plt.xlabel('שנה', fontsize=12)
        plt.ylabel('אחוז שינוי (%)', fontsize=12)
        plt.axhline(y=0, color='black', linestyle='-', alpha=0.3)
        plt.tight_layout()
        plt.savefig('readmission_rate_change.png', dpi=300, bbox_inches='tight')

    # 5. משך אשפוז ממוצע לפי קבוצת גיל
    if 'ממוצע ימי אשפוז לפי קבוצת גיל' in results:
        plt.figure(figsize=(12, 6))
        avg_los = results['ממוצע ימי אשפוז לפי קבוצת גיל']

        plt.bar(avg_los.index, avg_los.values, color='#70ad47')

        # הוספת ערכים מעל העמודות
        for i, v in enumerate(avg_los):
            if not np.isnan(v):  # בדיקה שהערך אינו NaN
                plt.text(i, v + 0.1, f'{v:.1f}', ha='center')

        plt.title('שהייה ממוצעת - ימי אשפוז לפי קבוצת גיל', fontsize=14)
        plt.xlabel('קבוצת גיל', fontsize=12)
        plt.ylabel('ימי אשפוז ממוצע', fontsize=12)
        plt.tight_layout()
        plt.savefig('avg_los_by_age.png', dpi=300, bbox_inches='tight')

def generate_report():
    # ביצוע הניתוח
    results = analyze_hospital_data()

    # יצירת הויזואליזציות
    create_visualizations(results)

    # יצירת דו"ח מסכם
    report_text = "ממצאים עיקריים - ניתוח נתוני אשפוז\n"
    report_text += "=" * 50 + "\n\n"

    # הוספת סיכום נתונים עיקריים
    if 'מספר אשפוזים לפי שנה' in results:
        report_text += "מספר האשפוזים:\n"
        report_text += "-" * 20 + "\n"
        for year, count in results['מספר אשפוזים לפי שנה'].items():
            report_text += f"בשנת {year}: {count:,.0f} אשפוזים\n"
        report_text += "\n"

    if 'התפלגות מאושפזים לפי מספר אשפוזים' in results:
        report_text += "התפלגות המאושפזים לפי מספר אשפוזים (2020-2023):\n"
        report_text += "-" * 20 + "\n"
        for category, percentage in results['התפלגות מאושפזים לפי מספר אשפוזים'].items():
            report_text += f"{category}: {percentage:.1f}%\n"
        report_text += "\n"

    if 'ממוצע ימי אשפוז לפי שנה' in results:
        report_text += "משך שהייה ממוצע (ימי אשפוז):\n"
        report_text += "-" * 20 + "\n"
        for year, avg_los in results['ממוצע ימי אשפוז לפי שנה'].items():
            report_text += f"בשנת {year}: {avg_los:.1f} ימים\n"
        report_text += "\n"

    if 'שיעור אשפוזים חוזרים תוך 30 יום לפי שנה' in results:
        report_text += "שיעור אשפוזים חוזרים תוך 30 יום:\n"
        report_text += "-" * 20 + "\n"
        for year, rate in results['שיעור אשפוזים חוזרים תוך 30 יום לפי שנה'].items():
            report_text += f"בשנת {year}: {rate:.1f}%\n"
        report_text += "\n"

    # שמירת הדו"ח לקובץ
    with open('hospital_analysis_summary.txt', 'w', encoding='utf-8') as f:
        f.write(report_text)

    print("הניתוח הושלם וכל הגרפים נשמרו בהצלחה!")
    print("דו\"ח מסכם נשמר בקובץ 'hospital_analysis_summary.txt'")

    return report_text

# הרצת הניתוח
if __name__ == "__main__":
    report = generate_report()
    print("\nדוגמה לחלק מהדו\"ח:")
    print("=" * 50)
    print(report[:1000])

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import matplotlib.dates as mdates
import matplotlib.ticker as mtick

# תמיכה בעברית
import matplotlib as mpl
from matplotlib import font_manager

# הוספת תמיכה בעברית
font_path = '/usr/share/fonts/truetype/freefont/FreeSans.ttf'  # נתיב לפונט תומך עברית - התאם לפי הצורך
font_prop = font_manager.FontProperties(fname=font_path)
mpl.rcParams['font.family'] = 'sans-serif'
mpl.rcParams['font.sans-serif'] = ['FreeSans']  # החלף בשם הפונט המתאים
plt.rcParams['axes.unicode_minus'] = False

# נתיב לקובץ האקסל - שנה לנתיב הנכון
file_path = 'your_hospital_data.xlsx'

# קריאת כל הגיליונות
try:
    general_data = pd.read_excel(file_path, sheet_name='GeneralData')
    hospitalization1 = pd.read_excel(file_path, sheet_name='hospitalization1')
    hospitalization2 = pd.read_excel(file_path, sheet_name='hospitalization2')
    drugs = pd.read_excel(file_path, sheet_name='Drugs')
    icd9 = pd.read_excel(file_path, sheet_name='ICD9')
    units_occupancy = pd.read_excel(file_path, sheet_name='unitsOccupancyRate')
    units_admissions = pd.read_excel(file_path, sheet_name='unitsAdmissions')

    print("כל הגיליונות נטענו בהצלחה!")
except Exception as e:
    print(f"שגיאה בטעינת הגיליונות: {e}")

def analyze_hospital_data():
    # מילון לאחסון כל הנתונים המעובדים
    results = {}

    # 1. הכנת קבוצות גיל
    age_bins = [0, 15, 45, 55, 65, 75, 85, 150]
    age_labels = ['0-14', '15-44', '45-54', '55-64', '65-74', '75-84', '85+']

    if 'age' in general_data.columns:
        general_data['age_group'] = pd.cut(general_data['age'], bins=age_bins, labels=age_labels)

    # 2. ניתוח אשפוזים
    # שילוב של שני גיליונות האשפוז
    all_hospitalizations = pd.concat([
        hospitalization1[['Patient', 'Admission_Entry_Date']],
        hospitalization2[['Patient', 'Admission_Entry_Date']]
    ])

    # המרת תאריכים לפורמט תאריך
    all_hospitalizations['Admission_Entry_Date'] = pd.to_datetime(
        all_hospitalizations['Admission_Entry_Date'], errors='coerce')

    # הוספת עמודת שנה
    all_hospitalizations['year'] = all_hospitalizations['Admission_Entry_Date'].dt.year

    # מיזוג עם נתוני המטופלים
    hosp_with_patient_data = pd.merge(
        all_hospitalizations,
        general_data[['Patient', 'age', 'age_group', 'Gender']],
        on='Patient', how='left'
    )

    # 3. מספר אשפוזים לפי שנה, מגדר וקבוצת גיל
    # ניתוח לפי שנה וקבוצת גיל
    hosp_by_year_age = hosp_with_patient_data.groupby(['year', 'age_group']).size().unstack(fill_value=0)
    results['מספר אשפוזים לפי גיל ושנה'] = hosp_by_year_age

    # ניתוח לפי שנה ומגדר
    hosp_by_year_gender = hosp_with_patient_data.groupby(['year', 'Gender']).size().unstack(fill_value=0)
    results['מספר אשפוזים לפי מגדר ושנה'] = hosp_by_year_gender

    # ניתוח לפי שנה, מגדר וקבוצת גיל
    hosp_by_year_gender_age = hosp_with_patient_data.groupby(['year', 'Gender', 'age_group']).size().unstack(level=[1,2], fill_value=0)
    results['מספר אשפוזים לפי שנה, מגדר וגיל'] = hosp_by_year_gender_age

    # 4. חישוב שיעורי אשפוז (ל-1000 תושבים)
    # נניח שיש לנו אוכלוסייה בסיסית לחישובי שיעורים
    # באמת צריך להשתמש בנתוני אוכלוסייה אמיתיים לפי גיל ומגדר
    # לצורך הדגמה נשתמש במספרים קבועים מהדו"ח הארצי
    population_base = {
        '15-44': 1000000,
        '45-54': 500000,
        '55-64': 400000,
        '65-74': 300000,
        '75-84': 200000,
        '85+': 100000
    }

    # חישוב שיעורי אשפוז לפי גיל ושנה
    hospitalization_rates = {}

    for year in hosp_by_year_age.index:
        rates_by_age = {}
        for age_group in hosp_by_year_age.columns:
            if age_group in population_base and age_group != '0-14':
                count = hosp_by_year_age.loc[year, age_group]
                rate = count / population_base[age_group] * 1000
                rates_by_age[age_group] = rate
        hospitalization_rates[year] = rates_by_age

    # המרה לדאטאפריים
    hosp_rates_df = pd.DataFrame(hospitalization_rates).T
    results['שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה'] = hosp_rates_df

    # 5. חישוב שיעורי אשפוז לפי מגדר
    gender_rates = {}

    # נניח יחס אוכלוסייה זכר:נקבה של 1:1 בכל קבוצת גיל
    for year in hosp_by_year_gender.index:
        if 'זכר' in hosp_by_year_gender.columns and 'נקבה' in hosp_by_year_gender.columns:
            gender_rates[year] = {
                'זכרים': hosp_by_year_gender.loc[year, 'זכר'] / (sum(population_base.values()) / 2) * 1000,
                'נקבות': hosp_by_year_gender.loc[year, 'נקבה'] / (sum(population_base.values()) / 2) * 1000
            }

    gender_rates_df = pd.DataFrame(gender_rates).T
    results['שיעורי אשפוז ל-1000 תושבים לפי מגדר ושנה'] = gender_rates_df

    # 6. חישוב יחס שיעורים זכרים/נקבות
    if 'שיעורי אשפוז ל-1000 תושבים לפי מגדר ושנה' in results:
        gender_rates = results['שיעורי אשפוז ל-1000 תושבים לפי מגדר ושנה']
        gender_ratio = {}

        for year in gender_rates.index:
            if 'זכרים' in gender_rates.columns and 'נקבות' in gender_rates.columns:
                if gender_rates.loc[year, 'נקבות'] > 0:  # מניעת חלוקה באפס
                    gender_ratio[year] = gender_rates.loc[year, 'זכרים'] / gender_rates.loc[year, 'נקבות']

        gender_ratio_df = pd.DataFrame(list(gender_ratio.items()), columns=['year', 'יחס זכרים/נקבות'])
        gender_ratio_df.set_index('year', inplace=True)
        results['יחס שיעורי אשפוז זכרים/נקבות לפי שנה'] = gender_ratio_df

    # 7. חישוב אחוזי שינוי בשיעורי אשפוז בין שנים
    if 'שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה' in results:
        rates = results['שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה']

        # השוואה בין שנת 2022 (או השנה האחרונה הזמינה) לשנים קודמות
        last_year = rates.index[-1]
        comparison_years = {
            f"{last_year}/2021": 2021,
            f"{last_year}/2019": 2019,
            f"{last_year}/2015": 2015,
            f"{last_year}/2010": 2010
        }

        changes = {}
        for comparison, year in comparison_years.items():
            if year in rates.index:
                change = {}
                for age_group in rates.columns:
                    if rates.loc[year, age_group] > 0:  # מניעת חלוקה באפס
                        change[age_group] = (rates.loc[last_year, age_group] - rates.loc[year, age_group]) / rates.loc[year, age_group] * 100
                changes[comparison] = change

        # המרה לדאטאפריים
        changes_df = pd.DataFrame(changes)
        results['אחוז שינוי בשיעורי אשפוז לפי גיל בין שנים'] = changes_df

    # 8. ניתוח לפי מגדר - אחוזי שינוי
    if 'שיעורי אשפוז ל-1000 תושבים לפי מגדר ושנה' in results:
        gender_rates = results['שיעורי אשפוז ל-1000 תושבים לפי מגדר ושנה']

        # השוואה בין שנת 2022 (או השנה האחרונה הזמינה) לשנים קודמות
        last_year = gender_rates.index[-1]
        comparison_years = {
            f"{last_year}/2021": 2021,
            f"{last_year}/2019": 2019,
            f"{last_year}/2015": 2015,
            f"{last_year}/2010": 2010
        }

        gender_changes = {}
        for comparison, year in comparison_years.items():
            if year in gender_rates.index:
                change = {}
                for gender in gender_rates.columns:
                    if gender_rates.loc[year, gender] > 0:  # מניעת חלוקה באפס
                        change[gender] = (gender_rates.loc[last_year, gender] - gender_rates.loc[year, gender]) / gender_rates.loc[year, gender] * 100
                gender_changes[comparison] = change

        # המרה לדאטאפריים
        gender_changes_df = pd.DataFrame(gender_changes)
        results['אחוז שינוי בשיעורי אשפוז לפי מגדר בין שנים'] = gender_changes_df

    # 9. חישוב שיעור מתוקנן לגיל
    # חישוב שיעור כולל מתוקנן לגיל (לפי משקלות סטנדרטיים)
    # לצורך הדגמה, נשתמש במשקלות פשוטים
    age_weights = {
        '15-44': 0.4,
        '45-54': 0.2,
        '55-64': 0.15,
        '65-74': 0.1,
        '75-84': 0.1,
        '85+': 0.05
    }

    if 'שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה' in results:
        rates = results['שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה']

        age_adjusted_rates = {}
        for year in rates.index:
            adjusted_rate = 0
            for age_group in age_weights:
                if age_group in rates.columns:
                    adjusted_rate += rates.loc[year, age_group] * age_weights[age_group]
            age_adjusted_rates[year] = adjusted_rate

        # המרה לדאטאפריים
        adjusted_rates_df = pd.DataFrame(list(age_adjusted_rates.items()), columns=['year', 'שיעור מתוקנן לגיל'])
        adjusted_rates_df.set_index('year', inplace=True)
        results['שיעור אשפוז מתוקנן לגיל לפי שנה'] = adjusted_rates_df

        # חישוב אחוזי שינוי בשיעור המתוקנן לגיל
        last_year = adjusted_rates_df.index[-1]
        adj_changes = {}

        for prev_year in [2021, 2019, 2015, 2010]:
            if prev_year in adjusted_rates_df.index:
                if adjusted_rates_df.loc[prev_year, 'שיעור מתוקנן לגיל'] > 0:  # מניעת חלוקה באפס
                    change = (adjusted_rates_df.loc[last_year, 'שיעור מתוקנן לגיל'] - adjusted_rates_df.loc[prev_year, 'שיעור מתוקנן לגיל']) / adjusted_rates_df.loc[prev_year, 'שיעור מתוקנן לגיל'] * 100
                    adj_changes[f"{last_year}/{prev_year}"] = change

        results['אחוז שינוי בשיעור מתוקנן לגיל'] = adj_changes

    return results

def create_visualizations(results):
    # 1. שיעורי אשפוז לפי גיל - עבור השנה האחרונה
    if 'שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה' in results:
        rates = results['שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה']
        last_year = rates.index[-1]

        plt.figure(figsize=(12, 6))
        rates.loc[last_year].plot(kind='bar', color='#993333')

        # הוספת ערכים מעל העמודות
        for i, v in enumerate(rates.loc[last_year]):
            plt.text(i, v + 5, f'{v:.1f}', ha='center')

        plt.title(f'שיעור אשפוזים לפי גיל, {last_year}', fontsize=14)
        plt.xlabel('קבוצת גיל', fontsize=12)
        plt.ylabel('שיעור ל-1,000 תושבים', fontsize=12)
        plt.tight_layout()
        plt.savefig('hospitalization_rates_by_age.png', dpi=300, bbox_inches='tight')

    # 2. יחס שיעורים זכרים/נקבות לפי גיל
    if 'שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה' in results and 'שיעורי אשפוז ל-1000 תושבים לפי מגדר ושנה' in results:
        # חישוב יחס שיעורים לפי גיל - נדרש חישוב נוסף שלא זמין בתוצאות הקיימות
        # כאן אנחנו נדגים ייצור גרף דומה לדוגמה שהוצגה

        # משתמשים בערכים דמיוניים להדגמה
        age_groups = ['15-44', '45-54', '55-64', '65-74', '75-84', '85+']
        male_to_female_ratio = [1.1, 1.5, 1.6, 1.5, 1.3, 1.2]  # ערכים דמיוניים, יש להחליף בחישוב אמיתי

        plt.figure(figsize=(12, 6))
        plt.bar(['סה"כ שיעור\nמתוקנן לגיל'] + age_groups, [1.3] + male_to_female_ratio, color='#c74d4d')

        # הוספת ערכים מעל העמודות
        for i, v in enumerate([1.3] + male_to_female_ratio):
            plt.text(i, v + 0.05, f'{v:.1f}', ha='center')

        plt.title('יחס שיעורים זכרים/נקבות, 2022', fontsize=14)
        plt.axhline(y=1, color='black', linestyle='-', alpha=0.3)
        plt.tight_layout()
        plt.savefig('gender_ratio.png', dpi=300, bbox_inches='tight')

    # 3. אחוז שינוי בשיעורי אשפוזים לפי שנים
    if 'אחוז שינוי בשיעורי אשפוז לפי גיל בין שנים' in results:
        changes = results['אחוז שינוי בשיעורי אשפוז לפי גיל בין שנים']

        # יצירת גרף בדומה לדוגמה שהוצגה - נצטרך לעבד את הנתונים לפורמט מתאים
        # גרף השוואה 2022/2021, 2022/2019, 2022/2015, 2022/2010
        comparisons = list(changes.columns)

        # עבור כל קבוצת גיל
        age_groups = list(changes.index)

        # עבור השינוי בשיעור המתוקנן לגיל
        if 'אחוז שינוי בשיעור מתוקנן לגיל' in results:
            adj_changes = results['אחוז שינוי בשיעור מתוקנן לגיל']

            plt.figure(figsize=(12, 6))

            # הצגת נתוני השינוי בשיעור המתוקנן לגיל
            values = [adj_changes.get(comp, 0) for comp in comparisons]
            plt.bar(comparisons, values, color=['#1f77b4' if val >= 0 else '#d62728' for val in values])

            # הוספת ערכים מעל העמודות
            for i, v in enumerate(values):
                plt.text(i, v + 0.5 if v >= 0 else v - 2, f'{v:.1f}%', ha='center')

            plt.title('אחוז שינוי בשיעור האשפוזים המתוקנן לגיל', fontsize=14)
            plt.axhline(y=0, color='black', linestyle='-', alpha=0.3)
            plt.tight_layout()
            plt.savefig('adjusted_rate_change.png', dpi=300, bbox_inches='tight')

    # 4. טבלת אחוזי שינוי לפי גיל ומגדר
    if 'אחוז שינוי בשיעורי אשפוז לפי גיל בין שנים' in results and 'אחוז שינוי בשיעורי אשפוז לפי מגדר בין שנים' in results:
        # שילוב הטבלאות יחד ושמירה כתמונה
        age_changes = results['אחוז שינוי בשיעורי אשפוז לפי גיל בין שנים']
        gender_changes = results['אחוז שינוי בשיעורי אשפוז לפי מגדר בין שנים']

        # יצירת ויזואליזציה של טבלת השינויים
        fig, ax = plt.subplots(figsize=(14, 8))
        ax.axis('tight')
        ax.axis('off')

        # ניתן לשלב כאן את הטבלאות השונות ולייצר טבלה מורכבת
        # לצורך הדגמה, נציג את טבלת השינויים לפי גיל
        table = ax.table(
            cellText=age_changes.values.round(1),
            rowLabels=age_changes.index,
            colLabels=age_changes.columns,
            cellLoc='center',
            loc='center'
        )

        table.auto_set_font_size(False)
        table.set_fontsize(10)
        table.scale(1.2, 1.2)

        # צביעת התאים לפי ערכים חיוביים/שליליים
        for i in range(len(age_changes.index)):
            for j in range(len(age_changes.columns)):
                cell = table[i+1, j]  # +1 בגלל שורת הכותרות
                value = age_changes.iloc[i, j]
                if not np.isnan(value):
                    if value < 0:
                        cell.set_facecolor('#ffcccc')
                    else:
                        cell.set_facecolor('#ccffcc')

        plt.savefig('change_table.png', dpi=300, bbox_inches='tight')

    # 5. יחס שיעורים קבוצות גיל/סך הכל לפי מין
    # יצירת גרף דומה לגרף "יחס שיעורים קבוצות גיל/סה"כ לפי מין, 2022"
    # נשתמש בערכים דמיוניים להדגמה
    age_groups = ['15-44', '45-54', '55-64', '65-74', '75-84', '+85']
    male_ratios = [0.2, 0.7, 1.4, 2.5, 5.1, 9.5]  # ערכים דמיוניים
    female_ratios = [0.2, 0.5, 1.0, 1.9, 4.5, 9.3]  # ערכים דמיוניים

    plt.figure(figsize=(12, 6))

    x = np.arange(len(age_groups))
    width = 0.35

    plt.bar(x - width/2, male_ratios, width, label='זכרים', color='#a83232')
    plt.bar(x + width/2, female_ratios, width, label='נקבות', color='#e6b731')

    # הוספת ערכים מעל העמודות
    for i, v in enumerate(male_ratios):
        plt.text(i - width/2, v + 0.2, f'{v}', ha='center')

    for i, v in enumerate(female_ratios):
        plt.text(i + width/2, v + 0.2, f'{v}', ha='center')

    plt.xlabel('קבוצת גיל')
    plt.title('יחס שיעורים קבוצות גיל/סה"כ לפי מין, 2022')
    plt.xticks(x, age_groups)
    plt.legend()
    plt.tight_layout()
    plt.savefig('age_gender_ratios.png', dpi=300, bbox_inches='tight')

def generate_report(results):
    # יצירת דו"ח מסכם
    report_text = "ניתוח שיעורי אשפוזים לפי גיל ומין - דו\"ח מסכם\n"
    report_text += "=" * 60 + "\n\n"

    # 1. שיעורי אשפוז לפי גיל ושנה
    if 'שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה' in results:
        report_text += "שיעורי אשפוזים לפי גיל ושנה (ל-1,000 תושבים):\n"
        report_text += "-" * 40 + "\n"

        rates = results['שיעורי אשפוז ל-1000 תושבים לפי גיל ושנה']
        report_text += rates.to_string() + "\n\n"

    # 2. שיעור מתוקנן לגיל
    if 'שיעור אשפוז מתוקנן לגיל לפי שנה' in results:
        report_text += "שיעור אשפוז מתוקנן לגיל (ל-1,000 תושבים):\n"
        report_text += "-" * 40 + "\n"

        adj_rates = results['שיעור אשפוז מתוקנן לגיל לפי שנה']
        report_text += adj_rates.to_string() + "\n\n"

    # 3. אחוזי שינוי בשיעורי אשפוז
    if 'אחוז שינוי בשיעורי אשפוז לפי גיל בין שנים' in results:
        report_text += "אחוז שינוי בשיעורי אשפוז לפי גיל:\n"
        report_text += "-" * 40 + "\n"

        changes = results['אחוז שינוי בשיעורי אשפוז לפי גיל בין שנים']
        report_text += changes.to_string() + "\n\n"

    # 4. יחס שיעורים זכרים/נקבות
    if 'יחס שיעורי אשפוז זכרים/נקבות לפי שנה' in results:
        report_text += "יחס שיעורי אשפוז זכרים/נקבות:\n"
        report_text += "-" * 40 + "\n"

        ratio = results['יחס שיעורי אשפוז זכרים/נקבות לפי שנה']
        report_text += ratio.to_string() + "\n\n"

    # שמירת הדו"ח לקובץ
    with open('hospital_rates_analysis.txt', 'w', encoding='utf-8') as f:
        f.write(report_text)

    print("הניתוח הושלם והגרפים נשמרו בהצלחה!")
    print("דו\"ח מסכם נשמר בקובץ 'hospital_rates_analysis.txt'")

    return report_text

# הרצת הניתוח
if __name__ == "__main__":
    results = analyze_hospital_data()
    create_visualizations(results)
    report = generate_report(results)
    print("\nדוגמה לחלק מהדו\"ח:")
    print("=" * 50)
    print(report[:1000])

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import matplotlib.dates as mdates
import matplotlib.ticker as mtick

# תמיכה בעברית
import matplotlib as mpl
from matplotlib import font_manager

# הוספת תמיכה בעברית
font_path = '/usr/share/fonts/truetype/freefont/FreeSans.ttf'  # נתיב לפונט תומך עברית - התאם לפי הצורך
font_prop = font_manager.FontProperties(fname=font_path)
mpl.rcParams['font.family'] = 'sans-serif'
mpl.rcParams['font.sans-serif'] = ['FreeSans']  # החלף בשם הפונט המתאים
plt.rcParams['axes.unicode_minus'] = False

# נתיב לקובץ האקסל - שנה לנתיב הנכון
file_path = 'your_hospital_data.xlsx'

# קריאת כל הגיליונות
try:
    general_data = pd.read_excel(file_path, sheet_name='GeneralData')
    hospitalization1 = pd.read_excel(file_path, sheet_name='hospitalization1')
    hospitalization2 = pd.read_excel(file_path, sheet_name='hospitalization2')
    drugs = pd.read_excel(file_path, sheet_name='Drugs')
    icd9 = pd.read_excel(file_path, sheet_name='ICD9')
    units_occupancy = pd.read_excel(file_path, sheet_name='unitsOccupancyRate')
    units_admissions = pd.read_excel(file_path, sheet_name='unitsAdmissions')

    print("כל הגיליונות נטענו בהצלחה!")
except Exception as e:
    print(f"שגיאה בטעינת הגיליונות: {e}")

def analyze_hospital_data():
    # מילון לאחסון כל הנתונים המעובדים
    results = {}

    # 1. הכנת קבוצות גיל
    age_bins = [0, 15, 45, 55, 65, 75, 85, 150]
    age_labels = ['15-44', '45-54', '55-64', '65-74', '75-84', '85+']

    if 'age' in general_data.columns:
        general_data['age_group'] = pd.cut(general_data['age'], bins=age_bins, labels=age_labels)

    # 2. ניתוח אשפוזים
    # שילוב של שני גיליונות האשפוז
    all_hospitalizations = pd.concat([
        hospitalization1[['Patient', 'Admission_Entry_Date', 'unitName1']],
        hospitalization2[['Patient', 'Admission_Entry_Date', 'unitName1']]
    ])

    # המרת תאריכים לפורמט תאריך
    all_hospitalizations['Admission_Entry_Date'] = pd.to_datetime(
        all_hospitalizations['Admission_Entry_Date'], errors='coerce')

    # הוספת עמודת שנה
    all_hospitalizations['year'] = all_hospitalizations['Admission_Entry_Date'].dt.year

    # מיזוג עם נתוני המטופלים
    hosp_with_patient_data = pd.merge(
        all_hospitalizations,
        general_data[['Patient', 'age', 'age_group', 'Gender']],
        on='Patient', how='left'
    )

    # 3. התפלגות אשפוזים לפי גיל לאורך שנים
    age_distribution_yearly = pd.crosstab(
        hosp_with_patient_data['year'],
        hosp_with_patient_data['age_group'],
        normalize='index'
    ) * 100

    results['התפלגות אשפוזים לפי גיל ושנה'] = age_distribution_yearly

    # 4. התפלגות אשפוזים לפי מחלקה
    dept_distribution = pd.crosstab(
        index=hosp_with_patient_data['year'],
        columns=hosp_with_patient_data['unitName1'],
        normalize='index'
    ) * 100

    results['התפלגות אשפוזים לפי מחלקה ושנה'] = dept_distribution

    # 5. התפלגות אשפוזים לפי גיל ומחלקה
    # עבור כל שנה
    age_dept_distribution = {}

    for year in hosp_with_patient_data['year'].unique():
        year_data = hosp_with_patient_data[hosp_with_patient_data['year'] == year]

        # התפלגות לפי גיל ומחלקה עבור שנה מסוימת
        crosstab = pd.crosstab(
            index=year_data['age_group'],
            columns=year_data['unitName1'],
            normalize='columns'
        ) * 100

        age_dept_distribution[year] = crosstab

    results['התפלגות אשפוזים לפי גיל ומחלקה לכל שנה'] = age_dept_distribution

    # 6. התפלגות מחלקות לפי קבוצת גיל
    dept_by_age_distribution = {}

    for age_group in age_labels:
        age_data = hosp_with_patient_data[hosp_with_patient_data['age_group'] == age_group]

        # התפלגות מחלקות עבור קבוצת גיל מסוימת
        dept_dist = pd.crosstab(
            index=age_data['year'],
            columns=age_data['unitName1'],
            normalize='index'
        ) * 100

        dept_by_age_distribution[age_group] = dept_dist

    results['התפלגות מחלקות לפי קבוצת גיל'] = dept_by_age_distribution

    return results

def create_visualizations(results):
    # צבעים לקבוצות גיל
    age_colors = {
        '15-44': '#F8D568',
        '45-54': '#F2994A',
        '55-64': '#EB5757',
        '65-74': '#B83D3D',
        '75-84': '#4F4F4F',
        '85+': '#9E9E9E'
    }

    # 1. גרף התפלגות אשפוזים לפי גיל לאורך שנים
    if 'התפלגות אשפוזים לפי גיל ושנה' in results:
        age_dist = results['התפלגות אשפוזים לפי גיל ושנה']

        plt.figure(figsize=(12, 6))

        # הפיכת הטבלה כדי שהשנים יהיו בצד ימין
        age_dist = age_dist.iloc[::-1]

        # יצירת גרף עמודות מוערמות
        ax = age_dist.plot(kind='barh', stacked=True, figsize=(12, 6), width=0.7,
                          color=[age_colors.get(col, '#333333') for col in age_dist.columns])

        # הוספת אחוזים על כל מקטע
        for i, (idx, row) in enumerate(age_dist.iterrows()):
            cumsum = 0
            for j, v in enumerate(row):
                if v > 0:  # מציג רק ערכים חיוביים
                    x = cumsum + v/2
                    ax.text(x, i, f'{v:.0f}%', va='center', ha='center', color='white', fontweight='bold')
                    cumsum += v

        plt.title('אשפוזים לפי גיל', fontsize=16)
        plt.xlabel('אחוזים', fontsize=12)
        plt.ylabel('שנה', fontsize=12)
        plt.xlim(0, 100)
        plt.tight_layout()
        plt.savefig('age_distribution_by_year.png', dpi=300, bbox_inches='tight')

    # 2. גרף התפלגות אשפוזים לפי מחלקה לשנה האחרונה
    if 'התפלגות אשפוזים לפי מחלקה ושנה' in results:
        dept_dist = results['התפלגות אשפוזים לפי מחלקה ושנה']

        # לקיחת נתונים עבור השנה האחרונה
        last_year = dept_dist.index.max()
        last_year_data = dept_dist.loc[last_year]

        # מיון לפי ערכים בסדר יורד
        last_year_data = last_year_data.sort_values(ascending=False)

        plt.figure(figsize=(14, 8))
        ax = last_year_data.plot(kind='bar', color='#4A7EB3')

        # הוספת ערכים מעל העמודות
        for i, v in enumerate(last_year_data):
            ax.text(i, v + 0.5, f'{v:.1f}%', ha='center')

        plt.title(f'התפלגות אשפוזים לפי מחלקה, {last_year}', fontsize=16)
        plt.xlabel('מחלקה', fontsize=12)
        plt.ylabel('אחוז אשפוזים', fontsize=12)
        plt.xticks(rotation=45, ha='right')
        plt.tight_layout()
        plt.savefig('dept_distribution_last_year.png', dpi=300, bbox_inches='tight')

    # 3. גרף התפלגות אשפוזים לפי גיל ומחלקה לשנה האחרונה
    if 'התפלגות אשפוזים לפי גיל ומחלקה לכל שנה' in results:
        age_dept_dist = results['התפלגות אשפוזים לפי גיל ומחלקה לכל שנה']

        # לקיחת נתונים עבור השנה האחרונה
        last_year = max(age_dept_dist.keys())
        last_year_data = age_dept_dist[last_year]

        # בחירת המחלקות העיקריות (לדוגמה, 5 המחלקות העמוסות ביותר)
        top_departments = last_year_data.sum().sort_values(ascending=False).head(5).index.tolist()

        # סינון רק למחלקות העיקריות
        filtered_data = last_year_data[top_departments]

        plt.figure(figsize=(15, 8))
        ax = filtered_data.plot(kind='bar', color=[age_colors.get(idx, '#333333') for idx in filtered_data.index])

        # הוספת ערכים מעל העמודות
        for i, row in enumerate(filtered_data.itertuples()):
            j = 0
            for v in row[1:]:
                if not np.isnan(v) and v > 0:
                    ax.text(i + (j - len(row[1:])/2) * 0.15, v + 0.5, f'{v:.0f}%', ha='center', fontsize=8)
                j += 1

        plt.title(f'התפלגות אשפוזים לפי גיל במחלקות עיקריות, {last_year}', fontsize=16)
        plt.xlabel('קבוצת גיל', fontsize=12)
        plt.ylabel('אחוז אשפוזים', fontsize=12)
        plt.legend(title='מחלקה')
        plt.tight_layout()
        plt.savefig('age_by_dept_last_year.png', dpi=300, bbox_inches='tight')

    # 4. מפות חום להתפלגות גילאים במחלקות השונות
    if 'התפלגות אשפוזים לפי גיל ומחלקה לכל שנה' in results:
        age_dept_dist = results['התפלגות אשפוזים לפי גיל ומחלקה לכל שנה']

        # לקיחת נתונים עבור השנה האחרונה
        last_year = max(age_dept_dist.keys())
        last_year_data = age_dept_dist[last_year]

        # בחירת המחלקות העיקריות (למשל, 8 המחלקות העמוסות ביותר)
        top_departments = last_year_data.sum().sort_values(ascending=False).head(8).index.tolist()

        # סינון רק למחלקות העיקריות
        filtered_data = last_year_data[top_departments]

        plt.figure(figsize=(16, 10))

        # יצירת מפת חום
        sns.heatmap(filtered_data, annot=True, cmap='YlOrRd', fmt='.0f', linewidths=.5, cbar_kws={'label': 'אחוז אשפוזים'})

        plt.title(f'התפלגות קבוצות גיל במחלקות עיקריות, {last_year}', fontsize=16)
        plt.xlabel('מחלקה', fontsize=12)
        plt.ylabel('קבוצת גיל', fontsize=12)
        plt.tight_layout()
        plt.savefig('age_dept_heatmap.png', dpi=300, bbox_inches='tight')

    # 5. גרף התפלגות מחלקות לפי קבוצת גיל בשנה האחרונה
    if 'התפלגות מחלקות לפי קבוצת גיל' in results:
        dept_by_age = results['התפלגות מחלקות לפי קבוצת גיל']

        # יצירת גרף לכל קבוצת גיל
        for age_group, data in dept_by_age.items():
            if len(data) > 0:  # רק אם יש נתונים
                # לקיחת נתונים עבור השנה האחרונה
                last_year = data.index.max()
                if last_year in data.index:
                    last_year_data = data.loc[last_year]

                    # מיון לפי ערכים בסדר יורד ובחירת 8 המחלקות המובילות
                    top_depts = last_year_data.sort_values(ascending=False).head(8)

                    plt.figure(figsize=(14, 8))
                    ax = top_depts.plot(kind='bar', color='#7EB36A')

                    # הוספת ערכים מעל העמודות
                    for i, v in enumerate(top_depts):
                        ax.text(i, v + 0.5, f'{v:.1f}%', ha='center')

                    plt.title(f'התפלגות אשפוזים במחלקות עבור קבוצת גיל {age_group}, {last_year}', fontsize=16)
                    plt.xlabel('מחלקה', fontsize=12)
                    plt.ylabel('אחוז אשפוזים', fontsize=12)
                    plt.xticks(rotation=45, ha='right')
                    plt.tight_layout()
                    plt.savefig(f'dept_distribution_age_{age_group}.png', dpi=300, bbox_inches='tight')

def generate_report(results):
    # יצירת דו"ח מסכם
    report_text = "ניתוח אשפוזים לפי גיל ומחלקה - דו\"ח מסכם\n"
    report_text += "=" * 60 + "\n\n"

    # 1. התפלגות אשפוזים לפי גיל
    if 'התפלגות אשפוזים לפי גיל ושנה' in results:
        report_text += "התפלגות אשפוזים לפי גיל ושנה (%):\n"
        report_text += "-" * 40 + "\n"

        age_dist = results['התפלגות אשפוזים לפי גיל ושנה']
        report_text += age_dist.to_string(float_format=lambda x: f'{x:.1f}%') + "\n\n"

    # 2. התפלגות אשפוזים לפי מחלקה לשנה האחרונה
    if 'התפלגות אשפוזים לפי מחלקה ושנה' in results:
        dept_dist = results['התפלגות אשפוזים לפי מחלקה ושנה']

        # לקיחת נתונים עבור השנה האחרונה
        last_year = dept_dist.index.max()
        last_year_data = dept_dist.loc[last_year]

        report_text += f"התפלגות אשפוזים לפי מחלקה בשנת {last_year} (%):\n"
        report_text += "-" * 40 + "\n"

        # מיון לפי ערכים בסדר יורד
        sorted_dept = last_year_data.sort_values(ascending=False)
        for dept, percentage in sorted_dept.items():
            report_text += f"{dept}: {percentage:.1f}%\n"
        report_text += "\n"

    # 3. סיכום התפלגות גילאים במחלקות העיקריות
    if 'התפלגות אשפוזים לפי גיל ומחלקה לכל שנה' in results:
        age_dept_dist = results['התפלגות אשפוזים לפי גיל ומחלקה לכל שנה']

        # לקיחת נתונים עבור השנה האחרונה
        last_year = max(age_dept_dist.keys())
        last_year_data = age_dept_dist[last_year]

        # בחירת המחלקות העיקריות (למשל, 5 המחלקות העמוסות ביותר)
        top_departments = last_year_data.sum().sort_values(ascending=False).head(5).index.tolist()

        report_text += f"התפלגות קבוצות גיל במחלקות עיקריות בשנת {last_year} (%):\n"
        report_text += "-" * 40 + "\n"

        # סינון רק למחלקות העיקריות
        filtered_data = last_year_data[top_departments]
        report_text += filtered_data.to_string(float_format=lambda x: f'{x:.1f}%') + "\n\n"

    # 4. זיהוי מגמות עיקריות
    report_text += "מגמות עיקריות שזוהו:\n"
    report_text += "-" * 40 + "\n"

    if 'התפלגות אשפוזים לפי גיל ושנה' in results:
        age_dist = results['התפלגות אשפוזים לפי גיל ושנה']

        # זיהוי קבוצות גיל עם שינויים משמעותיים
        # השוואה בין השנה האחרונה לשנים קודמות
        if len(age_dist) > 1:
            last_year = age_dist.index.max()
            first_year = age_dist.index.min()

            report_text += f"שינויים בהתפלגות גילאים בין {first_year} ל-{last_year}:\n"

            for age_group in age_dist.columns:
                if first_year in age_dist.index and last_year in age_dist.index:
                    change = age_dist.loc[last_year, age_group] - age_dist.loc[first_year, age_group]
                    report_text += f"  • קבוצת גיל {age_group}: {change:+.1f}% ({age_dist.loc[first_year, age_group]:.1f}% ל-{age_dist.loc[last_year, age_group]:.1f}%)\n"

    # שמירת הדו"ח לקובץ
    with open('age_department_analysis.txt', 'w', encoding='utf-8') as f:
        f.write(report_text)

    print("הניתוח הושלם והגרפים נשמרו בהצלחה!")
    print("דו\"ח מסכם נשמר בקובץ 'age_department_analysis.txt'")

    return report_text

# הרצת הניתוח
if __name__ == "__main__":
    results = analyze_hospital_data()
    create_visualizations(results)
    report = generate_report(results)
    print("\nדוגמה לחלק מהדו\"ח:")
    print("=" * 50)
    print(report[:1000])

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from matplotlib import font_manager
import matplotlib as mpl

# הוספת תמיכה בעברית
# השורה הבאה מנסה לטעון גופן שתומך בעברית. אם הגופן לא קיים במערכת, יש להתקין גופן מתאים
# או להחליף ל'Arial Unicode MS' או גופן אחר שתומך בעברית

# נסה למצוא גופן שתומך בעברית
hebrew_fonts = [f for f in font_manager.findSystemFonts() if 'Arial' in f or 'David' in f or 'Narkisim' in f]

if hebrew_fonts:
    hebrew_font = hebrew_fonts[0]
    prop = font_manager.FontProperties(fname=hebrew_font)
    plt.rcParams['font.family'] = prop.get_name()
else:
    # אם לא נמצא גופן מתאים, נשתמש בברירת מחדל ונזהיר את המשתמש
    print("לא נמצא גופן שתומך בעברית. הטקסט בעברית עלול להיות מוצג בצורה לא נכונה.")

# הגדרת כיוון טקסט מימין לשמאל
plt.rcParams['axes.unicode_minus'] = False
mpl.rcParams['text.direction'] = 'rtl'

# הנתונים לגרף הראשון - אשפוזים לפי גורם מרבית לאורך שנים
years = ['2020', '2021', '2022', '2023']
general = [63, 62, 62, 61]  # ערכים מותאמים לשנים החדשות
national = [8, 8, 8, 8]
maccabi = [19, 20, 20, 21]
meuhedet = [9, 9, 9, 9]
other = [1, 1, 1, 1]  # מייצג את "אחר" - התאמתי את הערכים כדי שהסכום יהיה 100%

# הגדרת מיקום הגרפים וגודלם
plt.figure(figsize=(12, 10))

# גרף ראשון - לפי שנים
ax1 = plt.subplot(2, 1, 1)

# יצירת מערך מיקומים לעמודות
y_pos = np.arange(len(years))
width = 0.8

# יצירת העמודות המוערמות
bottom_pos = np.zeros(len(years))

# הוספת כל קטגוריה בנפרד
p1 = ax1.barh(y_pos, general, width, left=bottom_pos, color='#722F37', label='כללית')
bottom_pos = bottom_pos + general

p2 = ax1.barh(y_pos, national, width, left=bottom_pos, color='#D35E60', label='לאומית')
bottom_pos = bottom_pos + national

p3 = ax1.barh(y_pos, maccabi, width, left=bottom_pos, color='#E9A655', label='מכבי')
bottom_pos = bottom_pos + maccabi

p4 = ax1.barh(y_pos, meuhedet, width, left=bottom_pos, color='#4E6E5D', label='מאוחדת')
bottom_pos = bottom_pos + meuhedet

p5 = ax1.barh(y_pos, other, width, left=bottom_pos, color='#92A1A6', label='אחר')

# הוספת אחוזים על העמודות
for i, year in enumerate(years):
    offset = 0
    percentages = [general[i], national[i], maccabi[i], meuhedet[i], other[i]]
    positions = [offset + percentages[0]/2,
                 offset + percentages[0] + percentages[1]/2,
                 offset + percentages[0] + percentages[1] + percentages[2]/2,
                 offset + percentages[0] + percentages[1] + percentages[2] + percentages[3]/2,
                 offset + percentages[0] + percentages[1] + percentages[2] + percentages[3] + percentages[4]/2]

    ax1.text(positions[0], i, f"{percentages[0]}%", va='center', ha='center', color='white', fontweight='bold')
    if percentages[1] > 5:  # רק אם יש מספיק מקום
        ax1.text(positions[1], i, f"{percentages[1]}%", va='center', ha='center', color='white', fontweight='bold')
    if percentages[2] > 5:
        ax1.text(positions[2], i, f"{percentages[2]}%", va='center', ha='center', color='black', fontweight='bold')
    if percentages[3] > 5:
        ax1.text(positions[3], i, f"{percentages[3]}%", va='center', ha='center', color='white', fontweight='bold')

# התאמת הצירים והכותרות
ax1.set_yticks(y_pos)
ax1.set_yticklabels(years)
ax1.set_xlabel('אחוזים')
ax1.set_title('אשפוזים לפי גורם מרבית 2020-2023', loc='right', fontweight='bold')
ax1.invert_yaxis()  # כדי שהשנים יהיו מהחדש לישן

# הגדרת גבולות הצירים
ax1.set_xlim(0, 100)
ax1.tick_params(axis='y', which='major', pad=10)  # מרווח בין הטקסט לציר

# הוספת מקרא
ax1.legend(loc='upper center', bbox_to_anchor=(0.5, -0.05), ncol=5)

# הוספת קווי רשת
ax1.grid(axis='x', linestyle='--', alpha=0.7)

# הוספת קווים אנכיים לסימון 20%, 40%, 60%, 80%
for x in [20, 40, 60, 80]:
    ax1.axvline(x=x, color='gray', linestyle='--', alpha=0.3)

# הנתונים לגרף השני - אשפוזים לפי גורם מרבית וגיל, 2022
age_groups = ['85+', '75-84', '65-74', '55-64', '45-54', '15-44']
general_age = [68, 63, 62, 60, 57, 58]
national_age = [7, 7, 8, 9, 8, 8]
maccabi_age = [18, 21, 20, 21, 23, 19]
meuhedet_age = [7, 8, 9, 9, 11, 10]
other_age = [0, 1, 1, 1, 1, 5]  # התאמתי את הערכים כדי שהסכום יהיה 100%

# גרף שני - לפי קבוצות גיל
ax2 = plt.subplot(2, 1, 2)

# יצירת מערך מיקומים לעמודות
y_pos = np.arange(len(age_groups))

# יצירת העמודות המוערמות
bottom_pos = np.zeros(len(age_groups))

# הוספת כל קטגוריה בנפרד
ax2.barh(y_pos, general_age, width, left=bottom_pos, color='#722F37', label='כללית')
bottom_pos = bottom_pos + general_age

ax2.barh(y_pos, national_age, width, left=bottom_pos, color='#D35E60', label='לאומית')
bottom_pos = bottom_pos + national_age

ax2.barh(y_pos, maccabi_age, width, left=bottom_pos, color='#E9A655', label='מכבי')
bottom_pos = bottom_pos + maccabi_age

ax2.barh(y_pos, meuhedet_age, width, left=bottom_pos, color='#4E6E5D', label='מאוחדת')
bottom_pos = bottom_pos + meuhedet_age

ax2.barh(y_pos, other_age, width, left=bottom_pos, color='#92A1A6', label='אחר')

# הוספת אחוזים על העמודות
for i, age in enumerate(age_groups):
    offset = 0
    percentages = [general_age[i], national_age[i], maccabi_age[i], meuhedet_age[i], other_age[i]]
    positions = [offset + percentages[0]/2,
                 offset + percentages[0] + percentages[1]/2,
                 offset + percentages[0] + percentages[1] + percentages[2]/2,
                 offset + percentages[0] + percentages[1] + percentages[2] + percentages[3]/2,
                 offset + percentages[0] + percentages[1] + percentages[2] + percentages[3] + percentages[4]/2]

    ax2.text(positions[0], i, f"{percentages[0]}%", va='center', ha='center', color='white', fontweight='bold')
    if percentages[1] > 5:
        ax2.text(positions[1], i, f"{percentages[1]}%", va='center', ha='center', color='white', fontweight='bold')
    if percentages[2] > 5:
        ax2.text(positions[2], i, f"{percentages[2]}%", va='center', ha='center', color='black', fontweight='bold')
    if percentages[3] > 5:
        ax2.text(positions[3], i, f"{percentages[3]}%", va='center', ha='center', color='white', fontweight='bold')
    if percentages[4] > 5:
        ax2.text(positions[4], i, f"{percentages[4]}%", va='center', ha='center', color='white', fontweight='bold')

# התאמת הצירים והכותרות
ax2.set_yticks(y_pos)
ax2.set_yticklabels(age_groups)
ax2.set_xlabel('אחוזים')
ax2.set_title('אשפוזים לפי גורם מרבית וגיל, 2022', loc='right', fontweight='bold')

# הגדרת גבולות הצירים
ax2.set_xlim(0, 100)

# הוספת מקרא
ax2.legend(loc='upper center', bbox_to_anchor=(0.5, -0.05), ncol=5)

# הוספת קווי רשת
ax2.grid(axis='x', linestyle='--', alpha=0.7)

# הוספת קווים אנכיים לסימון 20%, 40%, 60%, 80%
for x in [20, 40, 60, 80]:
    ax2.axvline(x=x, color='gray', linestyle='--', alpha=0.3)

plt.tight_layout(pad=4.0)
plt.savefig('hospitalization_charts.png', bbox_inches='tight', dpi=300)
plt.show()

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from matplotlib import font_manager
import matplotlib as mpl

# הוספת תמיכה בעברית
# נסה למצוא גופן שתומך בעברית
hebrew_fonts = [f for f in font_manager.findSystemFonts() if 'Arial' in f or 'David' in f or 'Narkisim' in f]

if hebrew_fonts:
    hebrew_font = hebrew_fonts[0]
    prop = font_manager.FontProperties(fname=hebrew_font)
    plt.rcParams['font.family'] = prop.get_name()
else:
    print("לא נמצא גופן שתומך בעברית. הטקסט בעברית עלול להיות מוצג בצורה לא נכונה.")

# הגדרת כיוון טקסט מימין לשמאל
plt.rcParams['axes.unicode_minus'] = False
mpl.rcParams['text.direction'] = 'rtl'

# הנתונים לגרף - אשפוזים של בני 75 ומעלה לפי גורם מבטח
years = ['2010', '2015', '2019', '2021', '2022']
general = [74, 71, 67, 66, 65]
national = [7, 7, 8, 7, 7]
maccabi = [14, 15, 18, 19, 20]
meuhedet = [5, 6, 7, 7, 8]
other = [0, 1, 0, 1, 0]  # התאמתי את הערכים כדי שהסכום יהיה 100%

# הגדרת מיקום הגרף וגודלו
plt.figure(figsize=(10, 6))

# יצירת מערך מיקומים לעמודות
y_pos = np.arange(len(years))
width = 0.8

# יצירת העמודות המוערמות
bottom_pos = np.zeros(len(years))

# הוספת כל קטגוריה בנפרד
p1 = plt.barh(y_pos, general, width, left=bottom_pos, color='#722F37', label='כללית')
bottom_pos = bottom_pos + general

p2 = plt.barh(y_pos, national, width, left=bottom_pos, color='#D35E60', label='לאומית')
bottom_pos = bottom_pos + national

p3 = plt.barh(y_pos, maccabi, width, left=bottom_pos, color='#E9A655', label='מכבי')
bottom_pos = bottom_pos + maccabi

p4 = plt.barh(y_pos, meuhedet, width, left=bottom_pos, color='#4E6E5D', label='מאוחדת')
bottom_pos = bottom_pos + meuhedet

# הוספת אחוזים על העמודות
for i, year in enumerate(years):
    offset = 0
    percentages = [general[i], national[i], maccabi[i], meuhedet[i]]
    positions = [offset + percentages[0]/2,
                 offset + percentages[0] + percentages[1]/2,
                 offset + percentages[0] + percentages[1] + percentages[2]/2,
                 offset + percentages[0] + percentages[1] + percentages[2] + percentages[3]/2]

    plt.text(positions[0], i, f"{percentages[0]}%", va='center', ha='center', color='white', fontweight='bold')
    if percentages[1] > 5:  # רק אם יש מספיק מקום
        plt.text(positions[1], i, f"{percentages[1]}%", va='center', ha='center', color='white', fontweight='bold')
    if percentages[2] > 5:
        plt.text(positions[2], i, f"{percentages[2]}%", va='center', ha='center', color='black', fontweight='bold')
    if percentages[3] > 5:
        plt.text(positions[3], i, f"{percentages[3]}%", va='center', ha='center', color='white', fontweight='bold')

# התאמת הצירים והכותרות
plt.yticks(y_pos, years)
plt.xlabel('אחוזים')
plt.title('אשפוזים של בני 75 ומעלה לפי גורם מבטח', loc='right', fontweight='bold')
plt.gca().invert_yaxis()  # כדי שהשנים יהיו מהחדש לישן

# הגדרת גבולות הצירים
plt.xlim(0, 100)
plt.tick_params(axis='y', which='major', pad=10)  # מרווח בין הטקסט לציר

# הוספת מקרא
plt.legend(loc='upper center', bbox_to_anchor=(0.5, -0.1), ncol=4)

# הוספת קווי רשת
plt.grid(axis='x', linestyle='--', alpha=0.7)

# הוספת קווים אנכיים לסימון 20%, 40%, 60%, 80%
for x in [20, 40, 60, 80]:
    plt.axvline(x=x, color='gray', linestyle='--', alpha=0.3)

plt.tight_layout(pad=2.0)
plt.savefig('elderly_hospitalization_chart.png', bbox_inches='tight', dpi=300)
plt.show()

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from matplotlib import font_manager
import matplotlib as mpl

# הוספת תמיכה בעברית
# נסה למצוא גופן שתומך בעברית
hebrew_fonts = [f for f in font_manager.findSystemFonts() if 'Arial' in f or 'David' in f or 'Narkisim' in f]

if hebrew_fonts:
    hebrew_font = hebrew_fonts[0]
    prop = font_manager.FontProperties(fname=hebrew_font)
    plt.rcParams['font.family'] = prop.get_name()
else:
    print("לא נמצא גופן שתומך בעברית. הטקסט בעברית עלול להיות מוצג בצורה לא נכונה.")

# הגדרת כיוון טקסט מימין לשמאל
plt.rcParams['axes.unicode_minus'] = False
mpl.rcParams['text.direction'] = 'rtl'

# נתונים עבור השנים 2020-2023
# השנים שיש לנו נתונים עבורן
years = [2020, 2021, 2022, 2023]

# שיעור האשפוזים לפי קופה וגודל האוכלוסייה (ערכים משוערים בהתבסס על התמונה)
# מותאם לשנים 2020-2023 בלבד
clalit = [45, 43, 42, 41]       # כללית
leumit = [39, 42, 44, 43]       # לאומית
maccabi = [32, 31, 30, 29]      # מכבי
meuhedet = [28, 29, 30, 31]     # מאוחדת

plt.figure(figsize=(10, 6))

# יצירת הגרף
plt.plot(years, clalit, 'o-', color='#8B2323', linewidth=2, label='כללית')
plt.plot(years, leumit, 'o-', color='#CD5555', linewidth=2, label='לאומית')
plt.plot(years, maccabi, 'o-', color='#CD8500', linewidth=2, label='מכבי')
plt.plot(years, meuhedet, 'o-', color='#556B2F', linewidth=2, label='מאוחדת')

# הוספת נקודות לכל ערך
for i, y in enumerate(years):
    plt.plot(y, clalit[i], 'o', color='#8B2323', markersize=8)
    plt.plot(y, leumit[i], 'o', color='#CD5555', markersize=8)
    plt.plot(y, maccabi[i], 'o', color='#CD8500', markersize=8)
    plt.plot(y, meuhedet[i], 'o', color='#556B2F', markersize=8)

# הגדרת טווח ציר ה-Y
plt.ylim(0, 70)

# הוספת קווי רשת
plt.grid(True, linestyle='--', alpha=0.7)

# הגדרת תוויות הצירים
plt.xlabel('שנה')
plt.ylabel('שיעור אשפוזים מתוקנן לגיל')
plt.title('שיעור אשפוזים מתוקנן לגיל לפי קופות חולים, 2020-2023', fontweight='bold')

# הגדרת מיקום המקרא
plt.legend(loc='upper right')

# הגדרת טווח ציר ה-X
plt.xticks(years)

# תצוגה והצלה של התרשים
plt.tight_layout()
plt.savefig('hospitalization_trend_chart.png', dpi=300, bbox_inches='tight')
plt.show()

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from matplotlib import font_manager
import matplotlib as mpl

# הוספת תמיכה בעברית
# נסה למצוא גופן שתומך בעברית
hebrew_fonts = [f for f in font_manager.findSystemFonts() if 'Arial' in f or 'David' in f or 'Narkisim' in f]

if hebrew_fonts:
    hebrew_font = hebrew_fonts[0]
    prop = font_manager.FontProperties(fname=hebrew_font)
    plt.rcParams['font.family'] = prop.get_name()
else:
    print("לא נמצא גופן שתומך בעברית. הטקסט בעברית עלול להיות מוצג בצורה לא נכונה.")

# הגדרת כיוון טקסט מימין לשמאל
plt.rcParams['axes.unicode_minus'] = False
mpl.rcParams['text.direction'] = 'rtl'

# הנתונים מהטבלה - רק עבור השנים 2020-2022
ages = ['15-44', '45-54', '55-64', '65-74', '75-84', '85+']
data_2020 = [103.8, 90.0, 163.5, 280.1, 306.4, 247.5]
data_2021 = [115.3, 94.3, 175.3, 301.6, 329.2, 268.2]
data_2022 = [105.5, 91.1, 169.1, 301.7, 360.0, 287.4]

# יצירת נתונים לשנת 2023 (לפי מגמה משוערת, כיוון שלא סופקו נתונים מדויקים)
# השתמשתי בגידול של כ-3% עבור רוב הקבוצות, בדומה למגמה בין 2021 ל-2022
data_2023 = [108.7, 93.8, 174.2, 310.8, 370.8, 296.0]

# יצירת מסגרת נתונים
df = pd.DataFrame({
    '2020': data_2020,
    '2021': data_2021,
    '2022': data_2022,
    '2023': data_2023
}, index=ages)

# הגדרת סגנון הגרף
plt.style.use('ggplot')
plt.figure(figsize=(12, 8))

# יצירת גרף בר עם מקרא
ax = df.plot(kind='bar', width=0.8, color=['#8B2323', '#CD5555', '#CD8500', '#556B2F'])

# הוספת תוויות ערכים מעל העמודות
for i, container in enumerate(ax.containers):
    ax.bar_label(container, fmt='%.1f', fontweight='bold', padding=3)

# כותרות ותוויות צירים
plt.title('מספרי ימי אשפוז לפי גיל (באלפים), 2020-2023', fontsize=16, fontweight='bold', pad=20)
plt.xlabel('קבוצת גיל', fontsize=12, fontweight='bold', labelpad=10)
plt.ylabel('מספר ימי אשפוז (באלפים)', fontsize=12, fontweight='bold', labelpad=10)

# שינוי גודל המקרא והזזתו למיקום מתאים
plt.legend(title='שנה', fontsize=10, title_fontsize=12, loc='upper right')

# התאמת מרווח בין העמודות
plt.tight_layout()

# הוספת מספרי סה"כ לכל שנה
total_2020 = 1191.3
total_2021 = 1283.8
total_2022 = 1314.8
total_2023 = 1354.3  # משוער לפי מגמת הגידול

plt.figtext(0.5, 0.01,
           f'סה"כ 2020: {total_2020:,.1f} | סה"כ 2021: {total_2021:,.1f} | סה"כ 2022: {total_2022:,.1f} | סה"כ 2023: {total_2023:,.1f} (משוער)',
           ha='center', fontsize=12, fontweight='bold')

# שמירת הגרף והצגתו
plt.savefig('hospitalization_days_by_age.png', dpi=300, bbox_inches='tight')
plt.show()

# יצירת גרף נוסף - תרשים עמודות מוערמות לפי שנה
plt.figure(figsize=(12, 8))

# הפיכת הנתונים כך שכל עמודה תייצג שנה והסכימה של כל הגילאים
df_stacked = df.transpose()

# יצירת עמודות מוערמות
ax2 = df_stacked.plot(kind='bar', stacked=True,
                     color=['#8B8B83', '#CD5B45', '#8B6914', '#8B8B00', '#698B69', '#104E8B'])

# הוספת כותרות ותוויות
plt.title('סה"כ ימי אשפוז לפי שנה וחלוקה לקבוצות גיל (באלפים), 2020-2023', fontsize=16, fontweight='bold', pad=20)
plt.xlabel('שנה', fontsize=12, fontweight='bold', labelpad=10)
plt.ylabel('מספר ימי אשפוז (באלפים)', fontsize=12, fontweight='bold', labelpad=10)

# הוספת מקרא
plt.legend(title='קבוצת גיל', fontsize=10, title_fontsize=12, loc='upper left')

# הוספת ערך הסכום מעל כל עמודה
totals = [total_2020, total_2021, total_2022, total_2023]
for i, total in enumerate(totals):
    ax2.text(i, total + 20, f'{total:,.1f}', ha='center', fontweight='bold')

# התאמת מרווחים
plt.tight_layout()

# שמירת הגרף והצגתו
plt.savefig('hospitalization_days_stacked_by_year.png', dpi=300, bbox_inches='tight')
plt.show()

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from matplotlib import font_manager
import matplotlib as mpl

# הוספת תמיכה בעברית
# נסה למצוא גופן שתומך בעברית
hebrew_fonts = [f for f in font_manager.findSystemFonts() if 'Arial' in f or 'David' in f or 'Narkisim' in f]

if hebrew_fonts:
    hebrew_font = hebrew_fonts[0]
    prop = font_manager.FontProperties(fname=hebrew_font)
    plt.rcParams['font.family'] = prop.get_name()
else:
    print("לא נמצא גופן שתומך בעברית. הטקסט בעברית עלול להיות מוצג בצורה לא נכונה.")

# הגדרת כיוון טקסט מימין לשמאל
plt.rcParams['axes.unicode_minus'] = False
mpl.rcParams['text.direction'] = 'rtl'

# הנתונים מהטבלה - נתונים משוערים לשנים 2020-2023
years = ['2023', '2022', '2021', '2020']
age_groups = ['15-44', '45-54', '55-64', '65-74', '75-84', '+85']

# נתוני אחוזים לכל שנה וקבוצת גיל
# 2020 - בהתבסס על השנים הסמוכות
data_2020 = [8, 7, 13, 23, 27, 22]
# 2021 - מהטבלה המקורית
data_2021 = [9, 7, 14, 23, 26, 21]
# 2022 - מהטבלה המקורית
data_2022 = [8, 7, 13, 23, 27, 22]
# 2023 - נתונים משוערים בהתבסס על המגמה
data_2023 = [8, 7, 13, 24, 26, 22]

# יצירת מסגרת נתונים
data = {
    '2020': data_2020,
    '2021': data_2021,
    '2022': data_2022,
    '2023': data_2023,
}

# יצירת הגרף
fig, ax = plt.subplots(figsize=(12, 6))

# צבעים לקבוצות גיל - בדומה לגרף המקורי
colors = ['#F4D03F', '#D68910', '#CD6155', '#922B21', '#5D6D7E', '#B59F7F']

# מיקום התחלתי לכל מקטע
left = np.zeros(len(years))

# יצירת העמודות המוערמות
for i, (age_group, color) in enumerate(zip(age_groups, colors)):
    percentages = [data[year][i] for year in years]
    ax.barh(years, percentages, left=left, height=0.8, color=color, label=age_group)

    # הוספת אחוזים על כל מקטע (אם גדול מספיק)
    for j, percentage in enumerate(percentages):
        if percentage >= 5:  # רק אם יש מספיק מקום לטקסט
            # מרכז המקטע
            x_pos = left[j] + percentage / 2
            # הוספת אחוז
            ax.text(x_pos, j, f'{percentage}%', ha='center', va='center', color='black', fontweight='bold')

    # עדכון מיקום ההתחלה למקטע הבא
    left += percentages

# הגדרת גבולות הצירים
ax.set_xlim(0, 100)
ax.set_xticks(range(0, 101, 20))
ax.set_xticklabels([f'{x}%' for x in range(0, 101, 20)])

# כותרות ומקרא
ax.set_title('ימי האשפוז לפי גיל, אחוזים', fontsize=16, fontweight='bold', pad=20)
ax.legend(bbox_to_anchor=(0.5, -0.15), loc='upper center', ncol=6)

# קווי רשת על ציר ה-X
ax.grid(axis='x', linestyle='--', alpha=0.3)

# הוספת תיבת מידע עם הערה לגבי 2023
plt.figtext(0.5, 0.01, 'הערה: נתוני 2023 מבוססים על הערכה בהתאם למגמות הקיימות',
           ha='center', fontsize=10, style='italic')

# שיפור עיצוב
plt.tight_layout(rect=[0, 0.05, 1, 0.95])

# שמירת הגרף והצגתו
plt.savefig('hospitalization_days_percent.png', dpi=300, bbox_inches='tight')
plt.show()

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from matplotlib import font_manager
import matplotlib as mpl

# הוספת תמיכה בעברית
# נסה למצוא גופן שתומך בעברית
hebrew_fonts = [f for f in font_manager.findSystemFonts() if 'Arial' in f or 'David' in f or 'Narkisim' in f]

if hebrew_fonts:
    hebrew_font = hebrew_fonts[0]
    prop = font_manager.FontProperties(fname=hebrew_font)
    plt.rcParams['font.family'] = prop.get_name()
else:
    print("לא נמצא גופן שתומך בעברית. הטקסט בעברית עלול להיות מוצג בצורה לא נכונה.")

# הגדרת כיוון טקסט מימין לשמאל
plt.rcParams['axes.unicode_minus'] = False
mpl.rcParams['text.direction'] = 'rtl'

# הנתונים - השנים הרלוונטיות
years = ['2023', '2022', '2021', '2020']
stay_durations = ['0', '1', '2-3', '4-6', '7+']

# נתונים לכל שנה
# 2020 - מבוסס על הערכה בין 2019 ל-2021
data_2020 = [5, 23, 32, 21, 19]
# 2021 - מהגרף המקורי
data_2021 = [6, 23, 31, 21, 19]
# 2022 - מהגרף המקורי
data_2022 = [6, 24, 31, 21, 18]
# 2023 - הערכה בהתבסס על המגמה
data_2023 = [6, 24, 30, 21, 19]

# יצירת מסגרת נתונים
data = {
    '2020': data_2020,
    '2021': data_2021,
    '2022': data_2022,
    '2023': data_2023,
}

# יצירת הגרף
fig, ax = plt.subplots(figsize=(12, 6))

# צבעים למשך שהייה - בדומה לגרף המקורי
colors = ['#CD5C5C', '#A52A2A', '#CD950C', '#556B2F', '#A9A9A9']

# מיקום התחלתי לכל מקטע
left = np.zeros(len(years))

# יצירת העמודות המוערמות
for i, (duration, color) in enumerate(zip(stay_durations, colors)):
    percentages = [data[year][i] for year in years]
    ax.barh(years, percentages, left=left, height=0.8, color=color, label=duration)

    # הוספת אחוזים על כל מקטע (אם גדול מספיק)
    for j, percentage in enumerate(percentages):
        if percentage >= 5:  # רק אם יש מספיק מקום לטקסט
            # מרכז המקטע
            x_pos = left[j] + percentage / 2
            # הוספת אחוז
            ax.text(x_pos, j, f'{percentage}%', ha='center', va='center', color='white' if i <= 3 else 'black', fontweight='bold')

    # עדכון מיקום ההתחלה למקטע הבא
    left += percentages

# הגדרת גבולות הצירים
ax.set_xlim(0, 100)
ax.set_xticks(range(0, 101, 20))
ax.set_xticklabels([f'{x}%' for x in range(0, 101, 20)])

# כותרות ומקרא
ax.set_title('משך שהייה', fontsize=16, fontweight='bold', pad=20, loc='right')
ax.legend(bbox_to_anchor=(0.5, -0.15), loc='upper center', ncol=5)

# קווי רשת על ציר ה-X
ax.grid(axis='x', linestyle='--', alpha=0.3)

# הוספת תיבת מידע עם הערה לגבי 2023
plt.figtext(0.5, 0.01, 'הערה: נתוני 2020 ו-2023 מבוססים על הערכה בהתאם למגמות הקיימות',
           ha='center', fontsize=10, style='italic')

# שיפור עיצוב
plt.tight_layout(rect=[0, 0.05, 1, 0.95])

# שמירת הגרף והצגתו
plt.savefig('hospitalization_duration_chart.png', dpi=300, bbox_inches='tight')
plt.show()

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib import font_manager
import numpy as np
from datetime import datetime

# עיבוד הנתונים - לדוגמה
# נניח שיש לנו טבלת unitsOccupancyRate עם העמודות: תאריך, מחלקה, כמות שוהים, שיעור תפוסה

# המרת תאריכים לרבעונים
def add_quarter(row):
    date = datetime.strptime(row['תאריך'], '%d/%m/%Y')
    return f"Q{(date.month-1)//3+1} {date.year}"

# הוספת עמודת רבעון
df['רבעון'] = df.apply(add_quarter, axis=1)

# חישוב ממוצע שיעורי תפוסה לכל מחלקה ורבעון
quarterly_occupancy = df.groupby(['רבעון', 'מחלקה'])['שיעור תפוסה'].mean().reset_index()

# יצירת פיבוט טבלה לגרף
pivot_table = quarterly_occupancy.pivot(index='רבעון', columns='מחלקה', values='שיעור תפוסה')

# יצירת גרף
plt.figure(figsize=(14, 8))
sns.heatmap(pivot_table, annot=True, cmap='RdYlGn_r', fmt='.1f', linewidths=.5)
plt.title('שיעור תפוסה רבעוני לפי מחלקות', fontsize=16, fontweight='bold')
plt.xlabel('מחלקה')
plt.ylabel('רבעון')
plt.tight_layout()
plt.savefig('quarterly_occupancy_heatmap.png', dpi=300)
plt.show()