In [150]:
import pandas as pd
from datetime import datetime
import numpy as np

In [297]:
home_23_24 = pd.read_excel('23_24_home.xlsx')
home_22_23 = pd.read_excel('22_23_home.xlsx')
home_21_22 = pd.read_excel('21_22_home.xlsx')

users = pd.read_csv('StatisticReport_2024-12-26-4.csv')

In [298]:
games = pd.read_excel('Games_id.xlsx')
teams = pd.read_excel('teams id.xlsx')

### Process ticketing

In [300]:
def ticketing(home_table):
    suite_table = home_table[
        (home_table['price_category'] == 'Suite') | 
        (home_table['price_list'] == 'תא צפיה')
    ]
    suite_table = suite_table.drop(
        ['purchaser_client_number', 'sale_date', 'game_hour', 'is_vip', 'is_adult'], 
        axis=1)
    
    suite_table = suite_table.drop_duplicates(subset=['client_number', 'game_id'])
    return suite_table

home_23_24_cleaned = ticketing(home_23_24)
home_22_23_cleaned = ticketing(home_22_23)
home_21_22_cleaned = ticketing(home_21_22)

# combine the results
all_home_cleaned = pd.concat([home_23_24_cleaned, home_22_23_cleaned, home_21_22_cleaned])

### Process the data - merge all users with the home_cleaned data

In [302]:
def process_home_tickets(users, all_home_cleaned):
    users = users.rename(columns={'id': 'client_number'})
    
    home_tickets = pd.merge(all_home_cleaned, users, on='client_number')
    
    columns_to_drop = [
        '[19] Season Ticket 19-20', '[20] Season Ticket 20-21', '[21] Season Ticket 21-22',
        '[22] Season Ticket 22-23', '[23] מנוי לעונת 2023/2024',
        '[62] מנוי לעונת 2024/2025', '[95] מנוי חניה 2024-25', 'price_list', 'price',
        '[128] מנוי הסעות - מחוץ לחומות', 'Active vouchers', 'Account active', 'User group','opponent_id', 'competition_id'
    ]
    
    home_tickets = home_tickets.drop(columns=columns_to_drop, errors='ignore')
    
    home_tickets = home_tickets.drop_duplicates(subset=['client_number', 'game_id'])
    
    # filter rows where 'seat_id' starts with 3
    home_tickets = home_tickets[home_tickets['seat_id'].astype(str).str.startswith('3')]
    home_tickets = home_tickets.reset_index(drop=True)
    
    return home_tickets

processed_tickets = process_home_tickets(users, all_home_cleaned)

In [303]:
members = pd.merge(processed_tickets,games, on='game_id', how='left')
members = pd.merge(members, teams, left_on='opponent_id', right_on = 'team_id', how='left')

members['game_date'] = members['game_date_x'].combine_first(members['game_date_y'])

members['season_id'] = members['season_id_x'].combine_first(members['season_id_y'])

members['Event name'] = members.loc[members['Event name'].isna() & members['game_id'].notna(), 'Event name'] = (
'הפועל ירושלים נגד ' + members['display_name'])

members = members.drop(['team_name', 'team_city', 'game_importance', 'datetime',
                        'game_date_x', 'game_date_y', 'season_id_x', 'season_id_y', 'game_time'], axis=1)

In [304]:
members

Unnamed: 0,client_number,transaction_number,price_category,seat_id,game_id,Identifier‏,First name,Last name,Email,Phone No.,opponent_id,venue_id,competition_id,team_id,display_name,game_date,season_id,Event name
0,18007,961351,Suite,30701001,115,18007,יוסי,מחלקת הנוער,,0526506105,2,1,1,2,הפועל באר שבע,2024-01-01 00:00:00,23,הפועל ירושלים נגד הפועל באר שבע
1,37941,961444,Suite,30501001,115,37941,מפנאת,הרשות לפיתוח,,0505070343,2,1,1,2,הפועל באר שבע,2024-01-01 00:00:00,23,הפועל ירושלים נגד הפועל באר שבע
2,18007,964720,Suite,30801001,116,18007,יוסי,מחלקת הנוער,,0526506105,25,1,1,25,הפועל חיפה,2024-05-01 00:00:00,23,הפועל ירושלים נגד הפועל חיפה
3,37462,964825,Suite,30701001,116,37462,אייל,תורג'מן,,0506233879,25,1,1,25,הפועל חיפה,2024-05-01 00:00:00,23,הפועל ירושלים נגד הפועל חיפה
4,37941,964812,Suite,30501001,116,37941,מפנאת,הרשות לפיתוח,,0505070343,25,1,1,25,הפועל חיפה,2024-05-01 00:00:00,23,הפועל ירושלים נגד הפועל חיפה
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
619,37941,862843,Suite,30301001,47,37941,מפנאת,הרשות לפיתוח,,0505070343,19,1,1,19,הפועל חולון,2022-06-02 00:00:00,21,הפועל ירושלים נגד הפועל חולון
620,11654,840927,Suite,30801001,30,11654,דייויד,בסן,David.j.bassan@gmail.com,0525558702,23,1,1,23,בני הרצליה,2022-03-07 00:00:00,21,הפועל ירושלים נגד בני הרצליה
621,23998,840965,Suite,30802012,30,23998,ישר,לחייל,Moshe@yasharlachayal.org,0587220288,23,1,1,23,בני הרצליה,2022-03-07 00:00:00,21,הפועל ירושלים נגד בני הרצליה
622,27706,845889,Suite,30402011,36,27706,איציק,עוזר,itzikoz@hotmail.com,0505070343,27,1,1,27,הפועל גליל עליון,2022-04-11 00:00:00,21,הפועל ירושלים נגד הפועל גליל עליון


### Process member

In [332]:
output_23_24 = pd.read_excel('23_24output.xlsx')
output_22_23 = pd.read_excel('22_23output.xlsx')
output_21_22 = pd.read_excel('21_22output.xlsx')

In [333]:
def membership(member_table):
    member_suite_table = member_table[member_table['price_category'] == 'Suite']
    member_suite_table = member_suite_table.drop(
        ['price','notes', 
         'is_vip', 'is_adult' ,'purchaser_client_number'], 
        axis=1)
    
    member_suite_table = member_suite_table.drop_duplicates(subset=['client_number'])
    return member_suite_table

output_23_24_cleaned = membership(output_23_24)
output_22_23_cleaned = membership(output_22_23)
output_21_22_cleaned = membership(output_21_22)

# combine the results
all_membership_cleaned = pd.concat([output_23_24_cleaned, output_22_23_cleaned, output_21_22_cleaned])

### Process the data - merge all users with the home_cleaned data

In [407]:
def process_membership_users(users, all_membership_cleaned):
    users = users.rename(columns={'id': 'client_number'})
    
    member_tickets = pd.merge(all_membership_cleaned, users, on='client_number')

    columns_to_drop = [
        '[19] Season Ticket 19-20', '[20] Season Ticket 20-21', '[21] Season Ticket 21-22',
        '[22] Season Ticket 22-23', '[23] מנוי לעונת 2023/2024',
        '[62] מנוי לעונת 2024/2025', '[95] מנוי חניה 2024-25', 'price_list', 'price',
        '[128] מנוי הסעות - מחוץ לחומות', 'Active vouchers', 'Account active', 'User group'
    ]
    
    member_tickets = member_tickets.drop(columns=columns_to_drop, errors='ignore')
    member_tickets = member_tickets.drop_duplicates(subset=['client_number'])
    member_tickets = member_tickets.reset_index(drop=True)
    
    return member_tickets

process_membership = process_membership_users(users, all_membership_cleaned)

In [429]:
process_membership_subset = process_membership[process_membership.columns]
process_membership_subset

Unnamed: 0,season_id,client_number,seat_id,price_category,sale_date,Identifier‏,First name,Last name,Email,Phone No.,Event name
0,23,14848,30601001,Suite,2023-12-28,520020421,עובדים,יהב,avraamb@yahav.co.il,506532173,
1,23,47403,30401001,Suite,2023-12-13,47403,RTMI,RTMI,Liat@rtmi.co.il,523867330,
2,23,16935,30301001,Suite,2023-08-01,16935,מובילאיי,מובילאיי,Avital.edry@mobileye.com,544522660,
3,23,37941,30501001,Suite,2023-08-01,37941,מפנאת,הרשות לפיתוח,,505070343,
4,23,18007,30801001,Suite,2023-08-01,18007,יוסי,מחלקת הנוער,,526506105,
5,21,16914,30601001,Suite,2021-10-04,16914,מנהלים,יהב,iritb@yahav.co.il,507646029,


In [431]:
suites = pd.concat([members, process_membership_subset], ignore_index=True)
suites

Unnamed: 0,client_number,transaction_number,price_category,seat_id,game_id,Identifier‏,First name,Last name,Email,Phone No.,opponent_id,venue_id,competition_id,team_id,display_name,game_date,season_id,Event name,sale_date
0,18007,961351.0,Suite,30701001,115.0,18007,יוסי,מחלקת הנוער,,0526506105,2.0,1.0,1.0,2.0,הפועל באר שבע,2024-01-01 00:00:00,23,הפועל ירושלים נגד הפועל באר שבע,NaT
1,37941,961444.0,Suite,30501001,115.0,37941,מפנאת,הרשות לפיתוח,,0505070343,2.0,1.0,1.0,2.0,הפועל באר שבע,2024-01-01 00:00:00,23,הפועל ירושלים נגד הפועל באר שבע,NaT
2,18007,964720.0,Suite,30801001,116.0,18007,יוסי,מחלקת הנוער,,0526506105,25.0,1.0,1.0,25.0,הפועל חיפה,2024-05-01 00:00:00,23,הפועל ירושלים נגד הפועל חיפה,NaT
3,37462,964825.0,Suite,30701001,116.0,37462,אייל,תורג'מן,,0506233879,25.0,1.0,1.0,25.0,הפועל חיפה,2024-05-01 00:00:00,23,הפועל ירושלים נגד הפועל חיפה,NaT
4,37941,964812.0,Suite,30501001,116.0,37941,מפנאת,הרשות לפיתוח,,0505070343,25.0,1.0,1.0,25.0,הפועל חיפה,2024-05-01 00:00:00,23,הפועל ירושלים נגד הפועל חיפה,NaT
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
625,47403,,Suite,30401001,,47403,RTMI,RTMI,Liat@rtmi.co.il,0523867330,,,,,,,23,,2023-12-13
626,16935,,Suite,30301001,,16935,מובילאיי,מובילאיי,Avital.edry@mobileye.com,0544522660,,,,,,,23,,2023-08-01
627,37941,,Suite,30501001,,37941,מפנאת,הרשות לפיתוח,,0505070343,,,,,,,23,,2023-08-01
628,18007,,Suite,30801001,,18007,יוסי,מחלקת הנוער,,0526506105,,,,,,,23,,2023-08-01


In [433]:
suites['Event name'].value_counts()

Event name
הפועל ירושלים נגד מכבי תל אביב          236
הפועל ירושלים נגד הפועל תל אביב         128
הפועל ירושלים נגד אאק אתונה              70
הפועל ירושלים נגד הפועל חולון            51
הפועל ירושלים נגד בני הרצליה             21
הפועל ירושלים נגד הפועל גליל עליון       18
הפועל ירושלים נגד הפועל אילת             12
הפועל ירושלים נגד הפועל חיפה             11
הפועל ירושלים נגד עירוני נס ציונה        10
הפועל ירושלים נגד עירוני קריית אתא        9
הפועל ירושלים נגד הפועל גלבוע גליל        9
הפועל ירושלים נגד הפועל באר שבע           8
הפועל ירושלים נגד באקן ברס                7
הפועל ירושלים נגד דרושפאקה                6
הפועל ירושלים נגד לודוויגסבורג            6
הפועל ירושלים נגד דיזון באסקט             6
הפועל ירושלים נגד שטרסבורג                6
nan                                       6
הפועל ירושלים נגד מכבי עירוני רמת גן      4
הפועל ירושלים נגד הפועל עפולה             4
הפועל ירושלים נגד אוסטרוב                 2
Name: count, dtype: int64

### Games this season

In [435]:
game1 = pd.read_csv('AuthorizedAttendanceReportCsv_🏠 מחזור 9_ הפועל ״בנק יהב״ ירושלים -הפועל גליל עליון.csv')
game2 = pd.read_csv('AuthorizedAttendanceReportCsv_🏠 מחזור11_ הפועל ״בנק יהב״ ירושלים -מכבי ת"א.csv')
game3 = pd.read_csv('AuthorizedAttendanceReportCsv_Round 2_ Hapoel Tel Aviv 🚗.csv')
game4 = pd.read_csv('AuthorizedAttendanceReportCsv_Round 3_ Ironi Kiryat Ata (Malcha) 🏠.csv')
game5 = pd.read_csv('AuthorizedAttendanceReportCsv_Round 4_ Hapoel Holon 🏠.csv')
game6 = pd.read_csv('AuthorizedAttendanceReportCsv_Round 8_ Hapoel Afula 🏠.csv')
game7 = pd.read_csv('AuthorizedAttendanceReportCsv_שלב הבתים משחק 1_ עירוני נס ציונה.csv')

In [441]:
def ticketing24_25(home_table24_25):    
    suite_table24_25 = home_table24_25[home_table24_25['Price area'] == 'תא צפיה']

    suite_table24_25 = suite_table24_25.drop(
        ['Transaction owner first name.1', 'Transaction owner last name.1',
       'Transaction owner email.1', 'Transaction owner phone number.1',
       'Hospitality - feature', 'Hospitality - voucher name',
       'Hospitality - voucher batch name', 'Hospitality - voucher code used', 'Event Id',
       'Hospitality - role', 'Hospitality - payment method', 'Age', 'Type', 'School', 'Gender',
        'Transaction owner first name', 'Additional phone number',
           'Transaction owner last name', 'Transaction owner email',
           'Transaction owner address', 'Transaction owner zip code',
           'Transaction owner phone number', 'Feature',
           'CloseLink reservation name', 'CloseLink code', 'Name',
           'Voucher batch name', 'Discount price', 'Used voucher code',
           'Member card status', 'Transaction with member card status', 'Role',
           'User group', 'Payment method', 'Ticket note', 'Season tickets',
           'Discount rule', 'Discount user id', 'Discount user email',
           'Attendance', 'Attendance date', 'Hospitality ticket identifier',
           'Hospitality product', 'Hospitality ticket number',
           'Hospitality barcode text', 'Hospitality user identifier',
           'Hospitality identifier', 'Hospitality - first name',
           'Hospitality - last name', 'Hospitality - platform', 'Transaction identifier',
           'Hospitality - sector', 'Hospitality - table', 'Hospitality - number',
           'Hospitality - entrance code', 'Hospitality - entrance text',
           'Hospitality - transaction Id', 'Hospitality - transaction date',
           'Hospitality - price type', 'Hospitality - price paid', 'Entrance code',
           'EntranceCode2', 'Entrance text', 'Street', 'Barcode', 'Price type',
             'TransactionOwnerPhonePrefix', 'Id', 'Stand',
           'HospPhonePrefix', 'Product', 'STRefID', 'OwnerSTUserId', 'OwnerSTName',
           'Subtype', 'Reservations identifiers', 'TicketBank reservation identifier', 'Ticket number', 'Card number',
           'MifareUID', 'Card member Id', 'User Id', 'Delivery type', 'Row', 'Number',
           'House number', 'Apartment number', 'City', 'Country', 'Zip code',
           'Hospitality - email', 'Hospitality - phone number', 'Price paid'], 
        axis=1)

    
    suite_table24_25 = suite_table24_25.drop_duplicates(subset=['assign using  ID number'])
    return suite_table24_25

game1_cleaned = ticketing24_25(game1)
game2_cleaned = ticketing24_25(game2)
game3_cleaned = ticketing24_25(game3)
game4_cleaned = ticketing24_25(game4)
game5_cleaned = ticketing24_25(game5)
game6_cleaned = ticketing24_25(game6)
game7_cleaned = ticketing24_25(game7)

# combine the results
all_home24_25_cleaned = pd.concat([game1_cleaned, game2_cleaned, game3_cleaned, game4_cleaned, game5_cleaned, game6_cleaned, game7_cleaned])

In [447]:
all_home24_25_cleaned.shape[0]

36

In [449]:
all_home24_25_cleaned

Unnamed: 0,assign using ID number,First name,Last name,Email,Event name,Area,Price area,Transaction date,Phone No.
12,023851058,דיזנהאוז,דיזנהאוז,sigi.cohen@diesenhaus.co.il,🏠 מחזור 9: הפועל ״בנק יהב״ ירושלים -הפועל גליל...,תא צפיה 3,תא צפיה,2024-12-02 10:10:48,0505688475
47,37462,אייל,תורג'מן,,🏠 מחזור 9: הפועל ״בנק יהב״ ירושלים -הפועל גליל...,תא צפיה 4,תא צפיה,2024-12-06 14:42:04,0506233879
109,029006194,יוני,חי,yoni.h@inz.org.il,🏠 מחזור 9: הפועל ״בנק יהב״ ירושלים -הפועל גליל...,תא צפיה 5,תא צפיה,2024-12-02 13:08:09,0522678222
171,520020421,עובדים,יהב,avraamb@yahav.co.il,🏠 מחזור 9: הפועל ״בנק יהב״ ירושלים -הפועל גליל...,תא צפיה 6,תא צפיה,2024-12-02 10:10:48,0506532173
1758,052821683,מודי,בן אבו,modi@ariel.org.il,🏠 מחזור 9: הפועל ״בנק יהב״ ירושלים -הפועל גליל...,תא צפיה 16,תא צפיה,2024-12-05 09:56:07,0509221140
840,520042540,מנורה,מבטחים,GALMO@MENORAMIVT.CO.IL,"🏠 מחזור11: הפועל ״בנק יהב״ ירושלים -מכבי תא""",תא צפיה 7,תא צפיה,2024-12-11 15:52:44,
1144,520020421,עובדים,יהב,avraamb@yahav.co.il,"🏠 מחזור11: הפועל ״בנק יהב״ ירושלים -מכבי תא""",תא צפיה 6,תא צפיה,2024-12-12 10:31:40,0506532173
1160,023851058,דיזנהאוז,דיזנהאוז,sigi.cohen@diesenhaus.co.il,"🏠 מחזור11: הפועל ״בנק יהב״ ירושלים -מכבי תא""",תא צפיה 3,תא צפיה,2024-12-12 10:31:40,0505688475
1598,37462,אייל,תורג'מן,,"🏠 מחזור11: הפועל ״בנק יהב״ ירושלים -מכבי תא""",תא צפיה 1,תא צפיה,2024-12-16 10:10:10,0506233879
2398,23998,ישר,לחייל,Moshe@yasharlachayal.org,"🏠 מחזור11: הפועל ״בנק יהב״ ירושלים -מכבי תא""",תא צפיה 2,תא צפיה,2024-12-18 15:27:51,0587220288


### Combine all tables together

In [505]:
all_24_25 = all_home24_25_cleaned[all_home24_25_cleaned.columns]
all = pd.concat([suites, all_24_25], ignore_index=True)
all

Unnamed: 0,client_number,transaction_number,price_category,seat_id,game_id,Identifier‏,First name,Last name,Email,Phone No.,...,team_id,display_name,game_date,season_id,Event name,sale_date,assign using ID number,Area,Price area,Transaction date
0,18007.0,961351.0,Suite,30701001.0,115.0,18007,יוסי,מחלקת הנוער,,0526506105,...,2.0,הפועל באר שבע,2024-01-01 00:00:00,23.0,הפועל ירושלים נגד הפועל באר שבע,NaT,,,,
1,37941.0,961444.0,Suite,30501001.0,115.0,37941,מפנאת,הרשות לפיתוח,,0505070343,...,2.0,הפועל באר שבע,2024-01-01 00:00:00,23.0,הפועל ירושלים נגד הפועל באר שבע,NaT,,,,
2,18007.0,964720.0,Suite,30801001.0,116.0,18007,יוסי,מחלקת הנוער,,0526506105,...,25.0,הפועל חיפה,2024-05-01 00:00:00,23.0,הפועל ירושלים נגד הפועל חיפה,NaT,,,,
3,37462.0,964825.0,Suite,30701001.0,116.0,37462,אייל,תורג'מן,,0506233879,...,25.0,הפועל חיפה,2024-05-01 00:00:00,23.0,הפועל ירושלים נגד הפועל חיפה,NaT,,,,
4,37941.0,964812.0,Suite,30501001.0,116.0,37941,מפנאת,הרשות לפיתוח,,0505070343,...,25.0,הפועל חיפה,2024-05-01 00:00:00,23.0,הפועל ירושלים נגד הפועל חיפה,NaT,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
661,,,,,,,אייל,תורג'מן,,0506233879,...,,,,,Round 4: Hapoel Holon 🏠,NaT,37462,תא צפיה 4,תא צפיה,2024-10-22 16:06:11
662,,,,,,,עובדים,יהב,avraamb@yahav.co.il,0506532173,...,,,,,Round 8: Hapoel Afula 🏠,NaT,520020421,תא צפיה 6,תא צפיה,2024-11-04 09:43:59
663,,,,,,,דיזנהאוז,דיזנהאוז,sigi.cohen@diesenhaus.co.il,0505688475,...,,,,,Round 8: Hapoel Afula 🏠,NaT,023851058,תא צפיה 3,תא צפיה,2024-11-11 11:57:20
664,,,,,,,מודי,בן אבו,modi@ariel.org.il,0509221140,...,,,,,Round 8: Hapoel Afula 🏠,NaT,052821683,תא צפיה 2,תא צפיה,2024-11-13 10:22:49


In [507]:
all['Identifier‏'] = all['Identifier‏'].combine_first(all['assign using  ID number'])
all = all.drop('assign using  ID number', axis=1)

In [509]:
all.columns

Index(['client_number', 'transaction_number', 'price_category', 'seat_id',
       'game_id', 'Identifier‏', 'First name', 'Last name', 'Email',
       'Phone No.', 'opponent_id', 'venue_id', 'competition_id', 'team_id',
       'display_name', 'game_date', 'season_id', 'Event name', 'sale_date',
       'Area', 'Price area', 'Transaction date'],
      dtype='object')

### Combine the games and teams

In [522]:
def process(all):
    all['season_id'] = all['season_id'].astype(str)
    
    all['Transaction date'] = pd.to_datetime(all['Transaction date'], errors='coerce')
    all['Transaction year'] = all['Transaction date'].dt.year.astype(str) 
    
    all.loc[all['season_id'] == 'nan', 'season_id'] = all['Transaction year'].str[-2:]  
    
    all['sale_date'] = pd.to_datetime(all['sale_date'], errors='coerce')
    all['Sale year'] = all['sale_date'].dt.year.astype(str)  # Extract year as string
    all.loc[all['season_id'] == 'nan', 'season_id'] = all['Sale year'].str[-2:]
    
    if 'game_date' in all.columns:
        all['game_date'] = all['game_date'].astype(str)  
        all.loc[all['season_id'] == 'nan', 'season_id'] = all['game_date'].str[-2:]
    
    all['season_id'] = pd.to_numeric(all['season_id'], errors='coerce').fillna(0).astype(int)
    
    return all

merged_df = process(all)

In [524]:
merged_df['season_id'].value_counts()

season_id
22    360
23    246
24     36
21     24
Name: count, dtype: int64

In [526]:
def fill_area(row):
    if pd.isna(row['Area']):  
        seat_id = str(row['seat_id']).zfill(8)  # Ensure it's at least 8 characters
        booth_number = seat_id[1:3]  # Extract the 2nd and 3rd digits
        return f"תא צפיה {int(booth_number)}" 
    return row['Area']

def clean_seat_id(value):
    if pd.isna(value) or value == '':
        return 0  # Replace empty or NaN with 0
    try:
        return int(str(value).split('.')[0])  # Remove decimal part and convert to int
    except ValueError:
        return 0  # Handle unexpected values gracefully

merged_df['seat_id'] = merged_df['seat_id'].apply(clean_seat_id)

# Apply the fill_area function
merged_df['Area'] = merged_df.apply(fill_area, axis=1)

In [530]:
merged_df['Area'].value_counts()

Area
תא צפיה 21    346
תא צפיה 3      49
תא צפיה 5      46
תא צפיה 7      42
תא צפיה 8      39
תא צפיה 4      36
תא צפיה 2      29
תא צפיה 1      17
תא צפיה 11     17
תא צפיה 6      13
תא צפיה 10     11
תא צפיה 13      7
תא צפיה 12      6
תא צפיה 9       3
תא צפיה 14      2
תא צפיה 16      2
תא צפיה 15      1
Name: count, dtype: int64

In [534]:
merged_df['Event name'].value_counts()

Event name
הפועל ירושלים נגד מכבי תל אביב                          236
הפועל ירושלים נגד הפועל תל אביב                         128
הפועל ירושלים נגד אאק אתונה                              70
הפועל ירושלים נגד הפועל חולון                            51
הפועל ירושלים נגד בני הרצליה                             21
הפועל ירושלים נגד הפועל גליל עליון                       18
🏠 מחזור11: הפועל ״בנק יהב״ ירושלים -מכבי תא"             15
הפועל ירושלים נגד הפועל אילת                             12
הפועל ירושלים נגד הפועל חיפה                             11
הפועל ירושלים נגד עירוני נס ציונה                        10
הפועל ירושלים נגד עירוני קריית אתא                        9
הפועל ירושלים נגד הפועל גלבוע גליל                        9
Round 2: Hapoel Tel Aviv 🚗                                9
הפועל ירושלים נגד הפועל באר שבע                           8
הפועל ירושלים נגד באקן ברס                                7
nan                                                       6
הפועל ירושלים נגד שטרסבורג   

In [538]:
merged_df.to_csv('combined_data2.csv', index=False)