In [1]:
import pandas as pd
import numpy as np
import os
import sys

pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.float_format', lambda x: '%.2f' % x)

In [2]:
cwd = os.getcwd()

education_folder_path = os.path.dirname(cwd)

sys.path.append(education_folder_path)

In [3]:
from global_functions import remove_spaces_in_columns, up_load_df

In [4]:
#בתי ספר וגנים מעיריית ירושלים
JLM=up_load_df(r'{}\background_files\jerusalem_muni'.format(education_folder_path),'מוסדות בירושלים 2020')
JLM=remove_spaces_in_columns(JLM)

In [5]:
#קאורדינטות של מוסדות חינוך בכל הארץ ממשרד החינוך
JTMT_setls_schools_coordinates=up_load_df(r'{}\background_files'.format(education_folder_path),'JTMT_setls_schools_coordinates')
JTMT_setls_schools_coordinates=remove_spaces_in_columns(JTMT_setls_schools_coordinates)

In [6]:
JLM.rename(columns={'סמל_חינוך': 'סמל_מוסד'}, inplace=True)

JLM = JLM.drop(columns=['פיקוח', 'מעמד_משפטי', "מס'_תלמידים_ז-ט", "מס'_תלמידים_י-יד", 'קוד_אזור_סטיסטי', 'תאור_אזור_סטטיסטי', 'Unnamed:_18', 'Unnamed:_19'])

JLM=JLM[JLM['שלב_חינוך'] != 'גני ילדים']

In [7]:
rows_with_zero = JLM[JLM['coordinate_x'] == 0]
JLM = JLM[JLM['coordinate_x'] != 0]

# מיזוג הטבלאות לפי העמודה "סמל_מוסד"
rows_with_zero = pd.merge(rows_with_zero, JTMT_setls_schools_coordinates[['סמל_מוסד', 'coordinate_x', 'coordinate_y']],
                     on='סמל_מוסד', how='left')

# עדכון העמודות המקוריות
rows_with_zero['coordinate_x'] = rows_with_zero['coordinate_x_y']
rows_with_zero['coordinate_y'] = rows_with_zero['coordinate_y_y']

# מחיקת העמודות המיותרות
rows_with_zero = rows_with_zero.drop(['coordinate_x_x', 'coordinate_y_x', 'coordinate_x_y', 'coordinate_y_y'], axis=1)

In [8]:
# מיזוג הטבלאות
JLM=pd.concat([JLM, rows_with_zero], ignore_index=True)

In [9]:
JLM['סמל_מוסד'] = JLM['סמל_עירייה']
JLM.drop(columns='סמל_עירייה', inplace=True)

In [10]:
is_unique = JLM['סמל_מוסד'].is_unique
is_unique

True

In [11]:
JLM.head()

Unnamed: 0,סמל_מוסד,שם_מוסד,אגף,שלב_חינוך,סוג_חינוך,מכיתה,עד_כיתה,מספר_כיתות,"סה""כ_תלמידים",coordinate_x,coordinate_y
0,21321.0,"מ""מ אגרון",כללי,יסודי,רגיל,א,ו,8.0,230.0,216876.0,629987.0
1,21323.0,"מ""מ ארגנטינה הניסויי",כללי,יסודי,רגיל,א,ח,12.0,347.0,216154.0,630603.0
2,21326.0,"מ""מ בית הכרם -הישראלי",כללי,יסודי,רגיל,א,ו,17.0,534.0,218166.0,632109.0
3,21327.0,"מ""מ תל""י גאולים ע""ש יצחק נבון",כללי,יסודי,רגיל,א,ו,13.0,331.0,220805.0,629266.0
4,21328.0,"מ""מ זלמן ארן",כללי,יסודי,רגיל,א,ו,13.0,367.0,220633.0,628408.0


In [12]:
# הגדרת רשימת הכיתות לטווח א' עד ח'
class_map = ['א', 'ב', 'ג', 'ד', 'ה', 'ו', 'ז', 'ח', 'ט', 'י', 'יא', 'יב', 'יג', 'יד']

# הגדרת עמודות לכיתות עם NaN כערך ברירת מחדל
for single_class in class_map:
    JLM[f'כיתה_{single_class}'] = np.nan

# פונקציה לחישוב מספר התלמידים לכל כיתה בטווח
def first_15_division(row):
    start_idx = class_map.index(row['מכיתה'])
    end_idx = class_map.index(row['עד_כיתה'])
    class_range = class_map[start_idx:end_idx + 1]

    students_remaining = row['סה"כ_תלמידים']
    for single_class in class_range:
        students_in_class = min(15, students_remaining)
        row[f'כיתה_{single_class}'] = students_in_class
        students_remaining -= students_in_class

    row['סה"כ_תלמידים'] = students_remaining
    return row


# החלת הפונקציה על כל השורות בטבלה
JLM = JLM.apply(first_15_division, axis=1)

# הצגת הטבלה החדשה
JLM.head()

Unnamed: 0,סמל_מוסד,שם_מוסד,אגף,שלב_חינוך,סוג_חינוך,מכיתה,עד_כיתה,מספר_כיתות,"סה""כ_תלמידים",coordinate_x,coordinate_y,כיתה_א,כיתה_ב,כיתה_ג,כיתה_ד,כיתה_ה,כיתה_ו,כיתה_ז,כיתה_ח,כיתה_ט,כיתה_י,כיתה_יא,כיתה_יב,כיתה_יג,כיתה_יד
0,21321.0,"מ""מ אגרון",כללי,יסודי,רגיל,א,ו,8.0,140.0,216876.0,629987.0,15.0,15.0,15.0,15.0,15.0,15.0,,,,,,,,
1,21323.0,"מ""מ ארגנטינה הניסויי",כללי,יסודי,רגיל,א,ח,12.0,227.0,216154.0,630603.0,15.0,15.0,15.0,15.0,15.0,15.0,15.0,15.0,,,,,,
2,21326.0,"מ""מ בית הכרם -הישראלי",כללי,יסודי,רגיל,א,ו,17.0,444.0,218166.0,632109.0,15.0,15.0,15.0,15.0,15.0,15.0,,,,,,,,
3,21327.0,"מ""מ תל""י גאולים ע""ש יצחק נבון",כללי,יסודי,רגיל,א,ו,13.0,241.0,220805.0,629266.0,15.0,15.0,15.0,15.0,15.0,15.0,,,,,,,,
4,21328.0,"מ""מ זלמן ארן",כללי,יסודי,רגיל,א,ו,13.0,277.0,220633.0,628408.0,15.0,15.0,15.0,15.0,15.0,15.0,,,,,,,,


In [13]:
# פונקציה לחלוקת התלמידים הנותרים שווה בשווה
def equal_distribution_students(row):
    # איתור הטווח של הכיתות
    start_idx = class_map.index(row['מכיתה'])
    end_idx = class_map.index(row['עד_כיתה'])
    class_range = class_map[start_idx:end_idx + 1]
    
    # חישוב מספר התלמידים הנותרים
    students_remaining = row['סה"כ_תלמידים']
    num_of_classes = len(class_range)
    
    if num_of_classes > 0:
        # חלוקת התלמידים הנותרים שווה בשווה לכיתות בטווח
        students_per_class = students_remaining / num_of_classes
        for single_class in class_range:
            # אם יש כבר ערך בעמודת הכיתה, נוסיף את הערך החדש
            if pd.notna(row[f'כיתה_{single_class}']):
                row[f'כיתה_{single_class}'] += students_per_class
            else:
                row[f'כיתה_{single_class}'] = students_per_class

    # עדכון סה"כ תלמידים לאחר חלוקה
    row['סה"כ_תלמידים'] = 0
    return row

# החלת הפונקציה על כל השורות בטבלה
JLM = JLM.apply(equal_distribution_students, axis=1)

# הצגת הטבלה החדשה
JLM.head()

Unnamed: 0,סמל_מוסד,שם_מוסד,אגף,שלב_חינוך,סוג_חינוך,מכיתה,עד_כיתה,מספר_כיתות,"סה""כ_תלמידים",coordinate_x,coordinate_y,כיתה_א,כיתה_ב,כיתה_ג,כיתה_ד,כיתה_ה,כיתה_ו,כיתה_ז,כיתה_ח,כיתה_ט,כיתה_י,כיתה_יא,כיתה_יב,כיתה_יג,כיתה_יד
0,21321.0,"מ""מ אגרון",כללי,יסודי,רגיל,א,ו,8.0,0,216876.0,629987.0,38.33,38.33,38.33,38.33,38.33,38.33,,,,,,,,
1,21323.0,"מ""מ ארגנטינה הניסויי",כללי,יסודי,רגיל,א,ח,12.0,0,216154.0,630603.0,43.38,43.38,43.38,43.38,43.38,43.38,43.38,43.38,,,,,,
2,21326.0,"מ""מ בית הכרם -הישראלי",כללי,יסודי,רגיל,א,ו,17.0,0,218166.0,632109.0,89.0,89.0,89.0,89.0,89.0,89.0,,,,,,,,
3,21327.0,"מ""מ תל""י גאולים ע""ש יצחק נבון",כללי,יסודי,רגיל,א,ו,13.0,0,220805.0,629266.0,55.17,55.17,55.17,55.17,55.17,55.17,,,,,,,,
4,21328.0,"מ""מ זלמן ארן",כללי,יסודי,רגיל,א,ו,13.0,0,220633.0,628408.0,61.17,61.17,61.17,61.17,61.17,61.17,,,,,,,,


In [14]:
class_map = ['כיתה_א', 'כיתה_ב', 'כיתה_ג', 'כיתה_ד', 'כיתה_ה', 'כיתה_ו', 'כיתה_ז', 'כיתה_ח', 'כיתה_ט', 'כיתה_י', 'כיתה_יא', 'כיתה_יב', 'כיתה_יג', 'כיתה_יד']

# בדיקה ועדכון כל תא אם מספר התלמידים קטן מ-15
for single_class in class_map:
    JLM[single_class] = JLM[single_class].apply(lambda x: x if pd.isna(x) or x >= 15 else 0)

# הצגת הטבלה המעודכנת
JLM.head()

Unnamed: 0,סמל_מוסד,שם_מוסד,אגף,שלב_חינוך,סוג_חינוך,מכיתה,עד_כיתה,מספר_כיתות,"סה""כ_תלמידים",coordinate_x,coordinate_y,כיתה_א,כיתה_ב,כיתה_ג,כיתה_ד,כיתה_ה,כיתה_ו,כיתה_ז,כיתה_ח,כיתה_ט,כיתה_י,כיתה_יא,כיתה_יב,כיתה_יג,כיתה_יד
0,21321.0,"מ""מ אגרון",כללי,יסודי,רגיל,א,ו,8.0,0,216876.0,629987.0,38.33,38.33,38.33,38.33,38.33,38.33,,,,,,,,
1,21323.0,"מ""מ ארגנטינה הניסויי",כללי,יסודי,רגיל,א,ח,12.0,0,216154.0,630603.0,43.38,43.38,43.38,43.38,43.38,43.38,43.38,43.38,,,,,,
2,21326.0,"מ""מ בית הכרם -הישראלי",כללי,יסודי,רגיל,א,ו,17.0,0,218166.0,632109.0,89.0,89.0,89.0,89.0,89.0,89.0,,,,,,,,
3,21327.0,"מ""מ תל""י גאולים ע""ש יצחק נבון",כללי,יסודי,רגיל,א,ו,13.0,0,220805.0,629266.0,55.17,55.17,55.17,55.17,55.17,55.17,,,,,,,,
4,21328.0,"מ""מ זלמן ארן",כללי,יסודי,רגיל,א,ו,13.0,0,220633.0,628408.0,61.17,61.17,61.17,61.17,61.17,61.17,,,,,,,,


In [15]:
# חלוקה לשכבות גיל
ages = {
    'ele': ['כיתה_א', 'כיתה_ב', 'כיתה_ג', 'כיתה_ד', 'כיתה_ה', 'כיתה_ו'],
    'mid': ['כיתה_ז', 'כיתה_ח', 'כיתה_ט'],
    'high': ['כיתה_י', 'כיתה_יא', 'כיתה_יב', 'כיתה_יג', 'כיתה_יד']
}

# חישוב מספר התלמידים לכל שכבה
JLM['ele_stu'] = JLM[ages['ele']].sum(axis=1)
JLM['mid_stu'] = JLM[ages['mid']].sum(axis=1)
JLM['high_stu'] = JLM[ages['high']].sum(axis=1)

#sector
JLM.loc[JLM['אגף']=='ערבי','sector'] = 1
JLM.loc[JLM['אגף']=='חרדי','sector'] = 2
JLM.loc[JLM['אגף']=='כללי','sector'] = 3

JLM_final = JLM.drop(['אגף', 'שלב_חינוך', 'כיתה_א', 'כיתה_ב', 'כיתה_ג', 'כיתה_ד', 'כיתה_ה', 'כיתה_ו', 'כיתה_ז', 'כיתה_ח', 'כיתה_ט', 'כיתה_י', 'כיתה_יא', 'כיתה_יב', 'כיתה_יג', 'כיתה_יד', 'מספר_כיתות', 'סה"כ_תלמידים', 'מכיתה', 'עד_כיתה', 'שם_מוסד', 'סוג_חינוך'], axis=1)

JLM_final.rename(columns={'סמל_מוסד': 'ID'}, inplace=True)

JLM_final.rename(columns={'coordinate_x': 'x'}, inplace=True)

JLM_final.rename(columns={'coordinate_y': 'y'}, inplace=True)

In [16]:
JLM.head()

Unnamed: 0,סמל_מוסד,שם_מוסד,אגף,שלב_חינוך,סוג_חינוך,מכיתה,עד_כיתה,מספר_כיתות,"סה""כ_תלמידים",coordinate_x,coordinate_y,כיתה_א,כיתה_ב,כיתה_ג,כיתה_ד,כיתה_ה,כיתה_ו,כיתה_ז,כיתה_ח,כיתה_ט,כיתה_י,כיתה_יא,כיתה_יב,כיתה_יג,כיתה_יד,ele_stu,mid_stu,high_stu,sector
0,21321.0,"מ""מ אגרון",כללי,יסודי,רגיל,א,ו,8.0,0,216876.0,629987.0,38.33,38.33,38.33,38.33,38.33,38.33,,,,,,,,,230.0,0.0,0.0,3.0
1,21323.0,"מ""מ ארגנטינה הניסויי",כללי,יסודי,רגיל,א,ח,12.0,0,216154.0,630603.0,43.38,43.38,43.38,43.38,43.38,43.38,43.38,43.38,,,,,,,260.25,86.75,0.0,3.0
2,21326.0,"מ""מ בית הכרם -הישראלי",כללי,יסודי,רגיל,א,ו,17.0,0,218166.0,632109.0,89.0,89.0,89.0,89.0,89.0,89.0,,,,,,,,,534.0,0.0,0.0,3.0
3,21327.0,"מ""מ תל""י גאולים ע""ש יצחק נבון",כללי,יסודי,רגיל,א,ו,13.0,0,220805.0,629266.0,55.17,55.17,55.17,55.17,55.17,55.17,,,,,,,,,331.0,0.0,0.0,3.0
4,21328.0,"מ""מ זלמן ארן",כללי,יסודי,רגיל,א,ו,13.0,0,220633.0,628408.0,61.17,61.17,61.17,61.17,61.17,61.17,,,,,,,,,367.0,0.0,0.0,3.0


In [17]:
JLM_final.head()

Unnamed: 0,ID,x,y,ele_stu,mid_stu,high_stu,sector
0,21321.0,216876.0,629987.0,230.0,0.0,0.0,3.0
1,21323.0,216154.0,630603.0,260.25,86.75,0.0,3.0
2,21326.0,218166.0,632109.0,534.0,0.0,0.0,3.0
3,21327.0,220805.0,629266.0,331.0,0.0,0.0,3.0
4,21328.0,220633.0,628408.0,367.0,0.0,0.0,3.0


In [18]:
JLM.to_excel('JLM.xlsx', index=False)
JLM_final.to_excel('JLM_final.xlsx', index=False)