<table>
  <tr>
    <td>Guy Uliel</td>
    <td>Rotem Dahan</td>
  </tr>
  <tr>
    <td>318439908</td>
    <td>316222215</td>
  </tr>
</table>


In [1]:
import requests
from bs4 import BeautifulSoup
from datetime import datetime
import calendar

## Scraping Data
##### We will insert the data into a list of dictionaries - each dictionary in the list represent an ad


In [2]:
def get_html(url):  # function that gets an HTML and response it back (Unreadable)
    try:
        response = requests.get(url)
        response.raise_for_status()  # Raise an error for bad status codes
        return response.text
    except requests.RequestException as e:
        print(f"Error fetching URL {url}: {e}")
        return None

def get_ad_urls(url):  # function that gets a URL (page) and for each page find all the URL ads and save them in a list
    try:
        html_content = get_html(url)
        if html_content is None:
            return []
        soup = BeautifulSoup(html_content, 'html.parser')
        cards = soup.find_all('div', class_='card-block')

        ad_urls = []
        for card in cards:
            # Stop processing once we reach the footer section
            if card.find_parent('footer'):
                break
            ad_url_tag = card.find('a', href=True)
            if ad_url_tag:
                ad_urls.append('https://www.ad.co.il' + ad_url_tag['href'])

        return ad_urls
    except Exception as e:
        print(f"Error parsing ad URLs from {url}: {e}")
        return []

def data_scrape(url):  # function that gets a URL and scrapes all the relevant data into a dictionary
    try:
        html_content = get_html(url)
        if html_content is None:
            return {}
        soup = BeautifulSoup(html_content, 'html.parser')

        # Initialize the dictionary with all possible keys and default value 'NA'
        vehicle_data = {
            'manufactor': 'NA',
            'Year': 'NA',
            'model': 'NA',
            'Hand': 'NA',
            'Gear': 'NA',
            'Engine_capacity': 'NA',
            'Engine_type': 'NA',
            'Prev_ownership': 'NA',
            'Curr_ownership': 'NA',
            'Area': 'NA',
            'City': 'NA',
            'Price': 'NA',
            'Pic_num': 'NA',
            'Cre_date': 'NA',
            'Repub_date': 'NA',
            'Description': 'NA',
            'Color': 'NA',
            'Km': 'NA',
            'Test': 'NA',
            'Supply_score':'NA'
        }

        # Mapping from Hebrew keys to English keys
        key_mapping = {
            'יצרן': 'manufactor',
            'שנה': 'Year',
            'דגם': 'model',
            'יד': 'Hand',
            'ת. הילוכים': 'Gear',
            'נפח': 'Engine_capacity',
            'סוג מנוע': 'Engine_type',
            'בעלות קודמת': 'Prev_ownership',
            'בעלות נוכחית': 'Curr_ownership',
            'אזור': 'Area',
            'עיר': 'City',
            'מחיר': 'Price',
            'מספר תמונות': 'Pic_num',
            'תאריך יצירה': 'Cre_date',
            'תאריך הקפצה אחרון': 'Repub_date',
            'תיאור': 'Description',
            'צבע': 'Color',
            'ק"מ': 'Km',
            'טסט עד': 'Test',
        }

        # Extract details from the table
        try:
            table = soup.find('table', class_='table table-sm mb-4')
            rows = table.find_all('tr')
            for row in rows:
                key_element = row.find_all('td')[0]
                value_element = row.find_all('td')[1]
                key = key_element.text.strip()
                value = value_element.text.strip()
                if key_mapping[key] in ['Km', 'Engine_capacity']:
                    value = value.replace(',', '')
                vehicle_data[key_mapping[key]] = value
        except AttributeError:
            print(f"Table not found on page {url}")

        # Extract manufacturer, model and price
        try:
            card_body = soup.find('div', class_='card-body p-3')
            if card_body:
                titles = card_body.find_all('h2', class_='card-title')
                if len(titles) >= 2:
                    title_text = titles[0].text.strip()
                    price_text = titles[1].text.strip()
                    # Assuming the title contains the manufacturer and model
                    title_parts = title_text.split()
                    if len(title_parts) >= 2:
                        vehicle_data['manufactor'] = title_parts[0]  # Assuming the first word is the manufacturer
                        vehicle_data['model'] = ' '.join(title_parts[1:])  # The rest is the model
                    vehicle_data['Price'] = price_text.replace('₪', '').replace(',', '').strip()  # Remove the currency symbol, commas, and whitespace
        except AttributeError:
            print(f"Card body not found on page {url}")

        # Count the number of images in the gallery
        try:
            gallery_div = soup.find('div', class_='col-12 d-flex mt-3 justify-content-center flex-wrap', itemscope=True)
            if gallery_div:
                images = gallery_div.find_all('img')
                vehicle_data['Pic_num'] = len(images)
            else:
                vehicle_data['Pic_num'] = 0
        except AttributeError:
            print(f"Gallery not found on page {url}")

        # Extract creation date and last bump date
        try:
            date_divs = soup.find_all('div', class_='px-3')
            if date_divs:
                for date_div in date_divs:
                    text = date_div.text.strip()
                    if 'תאריך יצירה' in text:
                        vehicle_data['Cre_date'] = text.split(':')[-1].strip()
                    elif 'תאריך הקפצה אחרון' in text:
                        vehicle_data['Repub_date'] = text.split(':')[-1].strip()
        except AttributeError:
            print(f"Date divs not found on page {url}")

        # Extract description and clean it up
        try:
            meta_description = soup.find('meta', attrs={'name': 'description'})
            if meta_description and 'content' in meta_description.attrs:
                description = meta_description['content'].strip()
                # Clean up the description by replacing newline characters with spaces and reducing multiple spaces to a single space
                clean_description = ' '.join(description.split())
                vehicle_data['Description'] = clean_description
        except AttributeError:
            print(f"Meta description not found on page {url}")

        # Convert 'Test' date to days until the last day of the month
        try:
            test_date_str = vehicle_data['Test']
            if test_date_str != 'NA':
                test_date = datetime.strptime(test_date_str, '%m/%Y')
                last_day_of_month = datetime(test_date.year, test_date.month, calendar.monthrange(test_date.year, test_date.month)[1])
                days_until_last_day = (last_day_of_month - datetime.now()).days
                vehicle_data['Test'] = days_until_last_day
        except ValueError:
            vehicle_data['Test'] = 'Invalid date'

        return vehicle_data
    except Exception as e:
        print(f"Error scraping data from {url}: {e}")
        return {}

def get_next_page_url(soup):  # function that gets the next page URL
    try:
        next_page_tag = soup.find('li', class_='nextPage')
        if next_page_tag:
            next_page_link = next_page_tag.find('a', href=True)
            if next_page_link and 'href' in next_page_link.attrs:
                return 'https://www.ad.co.il' + next_page_link['href']
        return None
    except Exception as e:
        print(f"Error finding next page URL: {e}")
        return None


In [3]:
base_url = 'https://www.ad.co.il/car?sp261=13905'  # URL for Mitsubishi cars
url = base_url
mitsu = [] # the list of the dictionaries - each dictionary is an ad

while url != None:
    html_content = get_html(url) # we get the html file (unreadble) by using the function 'get_html'
    soup = BeautifulSoup(html_content, 'html.parser') # make it readable( HTML document) 
    ad_urls = get_ad_urls(url) # we get into list all the urls of the page i

    for ad_url in ad_urls:
        vehicle_data = data_scrape(ad_url) # we scrape each ad for page i (as a dictionary)
        mitsu.append(vehicle_data) # we add it into the list 
    # Get the URL of the next page
    url = get_next_page_url(soup) # we change the value of the url to be index + 1 (next page) 
    # And we go back to the while loop to do the same as we did - with the next page



In [4]:
mitsu

[{'manufactor': 'מיצובישי',
  'Year': '2005',
  'model': 'לנסר קלאסיק',
  'Hand': '8',
  'Gear': 'אוטומטית',
  'Engine_capacity': '1600',
  'Engine_type': 'בנזין',
  'Prev_ownership': 'פרטית',
  'Curr_ownership': 'פרטית',
  'Area': 'ירושלים והסביבה',
  'City': 'ירושלים',
  'Price': '4700',
  'Pic_num': 3,
  'Cre_date': '22/05/2024',
  'Repub_date': '27/05/2024',
  'Description': 'רכב במצב פצצה שירת אותי נאמנה הוחלף לפני חודש תושבות מנוע פלאגים ברקסים צלחות רפידות עבר טיפול 10000 ממש לאחרונה מזגן מקפיא רכב במצב מצוין פשוט תדלק וסע גמיש מע...',
  'Color': 'כסוף',
  'Km': '230000',
  'Test': 141,
  'Supply_score': 'NA'},
 {'manufactor': 'מיצובישי',
  'Year': '2016',
  'model': 'GT3000',
  'Hand': '2',
  'Gear': 'אוטומטית',
  'Engine_capacity': '2000',
  'Engine_type': 'בנזין',
  'Prev_ownership': 'פרטית',
  'Curr_ownership': 'פרטית',
  'Area': 'חיפה וחוף הכרמל',
  'City': 'נשר',
  'Price': '92000',
  'Pic_num': 4,
  'Cre_date': '05/05/2024',
  'Repub_date': '05/05/2024',
  'Description': 

In [5]:
import pandas as pd 

In [6]:
scrape_df = pd.DataFrame(mitsu)

In [7]:
scrape_df

Unnamed: 0,manufactor,Year,model,Hand,Gear,Engine_capacity,Engine_type,Prev_ownership,Curr_ownership,Area,City,Price,Pic_num,Cre_date,Repub_date,Description,Color,Km,Test,Supply_score
0,מיצובישי,2005,לנסר קלאסיק,8,אוטומטית,1600,בנזין,פרטית,פרטית,ירושלים והסביבה,ירושלים,4700,3,22/05/2024,27/05/2024,רכב במצב פצצה שירת אותי נאמנה הוחלף לפני חודש ...,כסוף,230000,141,
1,מיצובישי,2016,GT3000,2,אוטומטית,2000,בנזין,פרטית,פרטית,חיפה וחוף הכרמל,נשר,92000,4,05/05/2024,05/05/2024,אאוטלנדר המפואר פרמיום 7 מקומות טופל אצל היבוא...,לבן,141000,,
2,מיצובישי,2016,I-MIEV,2,אוטומטית,2000,בנזין,פרטית,פרטית,חיפה וחוף הכרמל,נשר,92000,4,05/05/2024,04/05/2024,אאוטלנדר הדגם המפואר 7 מקומות שמור ומטופל אצל ...,לבן,141000,261,
3,מיצובישי,2020,אקליפס,2,אוטומטית,2000,בנזין,ליסינג,פרטית,חיפה וחוף הכרמל,טירת כרמל,85000,3,25/04/2024,25/04/2024,"מיצובישי ASX 76,000 ק""מ מוכן גם להחליף.",שחור,76000,110,
4,מיצובישי,2010,לנסר,3,אוטומטית,1600,בנזין,פרטית,פרטית,נתניה והסביבה,נתניה,10000,7,16/03/2024,16/03/2024,גיר מנוע תקינים מעככת מוביליין רכב 7 שנים עצלי...,כסוף,242000,171,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
154,מיצובישי,2017,אאוטלנדר,1,אוטומטית,1998,בנזין,,,מודיעין והסביבה,מודיעין מכבים רעות,106000,0,22/05/2022,22/05/2022,"מצב מצויין, שמור, כל הטיפולים בסוכנות מיצובישי...",,122000,,
155,מיצובישי,2020,אקליפס,1,אוטומטית,1500,בנזין,,,מודיעין והסביבה,מודיעין,129000,0,11/05/2022,11/05/2022,רכב שמור נמצא בחניה מקורה נהג יחיד(70),,16000,,
156,מיצובישי,2010,לנסר הדור החדש,3,אוטומטית,1500,בנזין,,,קריות,רכסים,11500,0,05/05/2022,05/05/2022,חלונות שחורים מסך באגז גדול מושבים יפים,,220000,,
157,מיצובישי,2017,אאוטלנדר,2,אוטומטית,2000,בנזין,,,באר שבע והסביבה,באר שבע,115000,0,26/04/2022,26/04/2022,הרכב במצב מצויין טסט שלמה שלמה צלחות ברקסים וצ...,,85000,,


In [28]:
int_lst = ['Year','Hand','Engine_capacity','Pic_num','Km','Test']
str_lst = ['manufactor','model','Area','City','Description','Color']
date_lst = ['Cre_date','Repub_date']
cat_lst = ['Gear','Engine_type','Prev_ownership','Curr_ownership']

In [29]:
# Convert 
scrape_df[int_lst] = scrape_df[int_lst].apply(pd.to_numeric,errors='coerce').astype('Int64')
scrape_df["Price"] = scrape_df["Price"].apply(pd.to_numeric,errors='coerce').astype(float)
scrape_df[date_lst] = scrape_df[date_lst].apply(lambda x : pd.to_datetime(x,format='%d/%m/%Y'))
scrape_df[str_lst] = scrape_df[str_lst].astype(str)
scrape_df[cat_lst] = scrape_df[cat_lst].astype('category')

In [30]:
scrape_df.dtypes

manufactor                 object
Year                        Int64
model                      object
Hand                        Int64
Gear                     category
Engine_capacity             Int64
Engine_type              category
Prev_ownership           category
Curr_ownership           category
Area                       object
City                       object
Price                     float64
Pic_num                     Int64
Cre_date           datetime64[ns]
Repub_date         datetime64[ns]
Description                object
Color                      object
Km                          Int64
Test                        Int64
Supply_score                Int64
dtype: object

In [None]:
###### מתחת לזה אני שם את הקוד של הapi

In [11]:
import urllib.request
import urllib.parse
import json

In [12]:
def fetch_filtered_data_from_api(api_url, resource_id, query, keys_to_extract, limit=1000):
    offset = 0
    all_records = []

    while True:
        # Construct the URL with limit, offset, and query parameters
        params = {
            'resource_id': resource_id,
            'limit': limit,
            'offset': offset,
            'q': query
        }
        url = f"{api_url}?{urllib.parse.urlencode(params)}"
        
        print(f"Fetching URL: {url}")  # Debugging statement to see the full URL

        # Make a GET request to the API
        with urllib.request.urlopen(url) as response:
            if response.status == 200:
                data = json.loads(response.read().decode())
                
                # Check if the response contains the 'result' key
                if 'result' in data:
                    records = data['result']['records']
                    
                    if not records:
                        print("No records found.")
                        break
                    
                    # Filter the records to include only the specified keys
                    filtered_records = [
                        {key: record.get(key, 'NA') for key in keys_to_extract}
                        for record in records
                    ]
                    
                    # Add the filtered records to the all_records list
                    all_records.extend(filtered_records)
                    
                    # Update the offset for the next iteration
                    offset += limit
                else:
                    print("No 'result' key found in the API response.")
                    break
            else:
                print(f"Failed to fetch data from API. Status code: {response.status}")
                break

    return all_records
# Base URL for the API
api_url = 'https://data.gov.il/api/3/action/datastore_search'
    
# Resource ID for the dataset
resource_id = '5e87a7a1-2f6f-41c1-8aec-7216d52a6cf6'
    
# Query parameter for Mitsubishi vehicles
query = 'מיצובישי'
    
# Keys to extract from the API response
keys_to_extract = ['tozar', 'kinuy_mishari', 'shnat_yitzur']
    
# Fetch filtered data from the API
filtered_data = fetch_filtered_data_from_api(api_url, resource_id, query, keys_to_extract)

Fetching URL: https://data.gov.il/api/3/action/datastore_search?resource_id=5e87a7a1-2f6f-41c1-8aec-7216d52a6cf6&limit=1000&offset=0&q=%D7%9E%D7%99%D7%A6%D7%95%D7%91%D7%99%D7%A9%D7%99
Fetching URL: https://data.gov.il/api/3/action/datastore_search?resource_id=5e87a7a1-2f6f-41c1-8aec-7216d52a6cf6&limit=1000&offset=1000&q=%D7%9E%D7%99%D7%A6%D7%95%D7%91%D7%99%D7%A9%D7%99
Fetching URL: https://data.gov.il/api/3/action/datastore_search?resource_id=5e87a7a1-2f6f-41c1-8aec-7216d52a6cf6&limit=1000&offset=2000&q=%D7%9E%D7%99%D7%A6%D7%95%D7%91%D7%99%D7%A9%D7%99
No records found.


In [13]:
filtered_data

[{'tozar': 'מיצובישי',
  'kinuy_mishari': 'מיצובישי סופר לנסר I',
  'shnat_yitzur': 1996},
 {'tozar': 'מיצובישי',
  'kinuy_mishari': 'מיצובישי סופר לנסר I',
  'shnat_yitzur': 1996},
 {'tozar': 'מיצובישי',
  'kinuy_mishari': 'מיצובישי סופר לנסר I',
  'shnat_yitzur': 1997},
 {'tozar': 'מיצובישי',
  'kinuy_mishari': 'מיצובישי סופר לנסר I',
  'shnat_yitzur': 1997},
 {'tozar': 'מיצובישי', 'kinuy_mishari': 'OUTLANDER', 'shnat_yitzur': 2021},
 {'tozar': 'מיצובישי', 'kinuy_mishari': 'OUTLANDER', 'shnat_yitzur': 2017},
 {'tozar': 'מיצובישי', 'kinuy_mishari': 'PAJERO', 'shnat_yitzur': 2012},
 {'tozar': 'מיצובישי', 'kinuy_mishari': 'OUTLANDER', 'shnat_yitzur': 2017},
 {'tozar': 'מיצובישי',
  'kinuy_mishari': '004-L מיניבוס בנזין',
  'shnat_yitzur': 1998},
 {'tozar': 'מיצובישי', 'kinuy_mishari': 'GALANT', 'shnat_yitzur': 2002},
 {'tozar': 'מיצובישי', 'kinuy_mishari': 'L 200', 'shnat_yitzur': 2002},
 {'tozar': 'מיצובישי', 'kinuy_mishari': 'L-200', 'shnat_yitzur': 2008},
 {'tozar': 'מיצובישי', 'kinu

In [14]:
kinuy_mishari_mappings = {
    'OUILANDER': 'אאוטלנדר',
    'OUTLANDER': 'אאוטלנדר',
    'LANCER': 'לנסר',
    'ECLIPSE CROSS': 'אקליפס',
    'SPACE STAR': 'ספייס סטאר',
    'LANCER EVOLUTIO': 'לנסר איוולושן',
    'LANCER SPORTBAC': 'לנסר ספורטבק',
    'GRANDIS': 'גרנדיס',
    'ATTRAGE': "אטראז'",
    'COLT': 'קולט',
    'מיצובישי סופר לנסר I': 'סופר לנסר',
    'סופר לנסר ILG סלון': 'סופר לנסר'
}

In [15]:
for record in filtered_data:
    kinuy_mishari = record.get('kinuy_mishari', '')
    if kinuy_mishari in kinuy_mishari_mappings:
        record['kinuy_mishari'] = kinuy_mishari_mappings[kinuy_mishari]


In [16]:
api_df = pd.DataFrame(filtered_data)

In [17]:
api_df

Unnamed: 0,tozar,kinuy_mishari,shnat_yitzur
0,מיצובישי,סופר לנסר,1996
1,מיצובישי,סופר לנסר,1996
2,מיצובישי,סופר לנסר,1997
3,מיצובישי,סופר לנסר,1997
4,מיצובישי,אאוטלנדר,2021
...,...,...,...
1602,מיצובישי,לנסר,2008
1603,מיצובישי,אאוטלנדר,2020
1604,מיצובישי,לנסר,2009
1605,מיצובישי,אאוטלנדר,2022


In [18]:
aggregated_data = api_df.groupby(['tozar', 'kinuy_mishari', 'shnat_yitzur']).size().reset_index(name='Supply_score')

In [36]:
aggregated_data

Unnamed: 0,manufactor,model,Year,Supply_score
0,מיצובישי,004-L מיניבוס בנזין,1998,1
1,מיצובישי,004-L קומבי דיזל ידנ,1998,1
2,מיצובישי,004-L קומבי דיזל ידנ,1999,1
3,מיצובישי,ASX,2011,2
4,מיצובישי,ASX,2017,3
...,...,...,...,...
260,מיצובישי,קומבי דיזל 1+3,1998,1
261,מיצובישי,קומבי דיזל 2+3,1998,1
262,מיצובישי,קומבי דיזל 2+6,1998,1
263,מיצובישי,קומבי דיזל 2+6 אוטוב,1998,1


In [39]:
aggregated_data.rename(columns={'tozar': 'manufactor', 'kinuy_mishari': 'model', 'shnat_yitzur': 'Year'}, inplace=True)

# Merge DataFrames on the specified columns
merged_df = pd.merge(scrape_df, aggregated_data, on=['manufactor', 'model', 'Year'], how='left')

# Update the Supply_score in merged_df with the values from aggregated_data
merged_df['Supply_score'] = merged_df['Supply_score_y'].fillna(merged_df['Supply_score_x'])
merged_df['Supply_score'] = merged_df['Supply_score'].apply(pd.to_numeric,errors='coerce').astype('Int64')

# Drop the extra columns created during the merge
merged_df.drop(columns=['Supply_score_x', 'Supply_score_y'], inplace=True)

In [40]:
merged_df

Unnamed: 0,manufactor,Year,model,Hand,Gear,Engine_capacity,Engine_type,Prev_ownership,Curr_ownership,Area,City,Price,Pic_num,Cre_date,Repub_date,Description,Color,Km,Test,Supply_score
0,מיצובישי,2005,לנסר קלאסיק,8,אוטומטית,1600,בנזין,פרטית,פרטית,ירושלים והסביבה,ירושלים,4700.0,3,2024-05-22,2024-05-27,רכב במצב פצצה שירת אותי נאמנה הוחלף לפני חודש ...,כסוף,230000,141,
1,מיצובישי,2016,GT3000,2,אוטומטית,2000,בנזין,פרטית,פרטית,חיפה וחוף הכרמל,נשר,92000.0,4,2024-05-05,2024-05-05,אאוטלנדר המפואר פרמיום 7 מקומות טופל אצל היבוא...,לבן,141000,,
2,מיצובישי,2016,I-MIEV,2,אוטומטית,2000,בנזין,פרטית,פרטית,חיפה וחוף הכרמל,נשר,92000.0,4,2024-05-05,2024-05-04,אאוטלנדר הדגם המפואר 7 מקומות שמור ומטופל אצל ...,לבן,141000,261,
3,מיצובישי,2020,אקליפס,2,אוטומטית,2000,בנזין,ליסינג,פרטית,חיפה וחוף הכרמל,טירת כרמל,85000.0,3,2024-04-25,2024-04-25,"מיצובישי ASX 76,000 ק""מ מוכן גם להחליף.",שחור,76000,110,15
4,מיצובישי,2010,לנסר,3,אוטומטית,1600,בנזין,פרטית,פרטית,נתניה והסביבה,נתניה,10000.0,7,2024-03-16,2024-03-16,גיר מנוע תקינים מעככת מוביליין רכב 7 שנים עצלי...,כסוף,242000,171,9
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
154,מיצובישי,2017,אאוטלנדר,1,אוטומטית,1998,בנזין,,,מודיעין והסביבה,מודיעין מכבים רעות,106000.0,0,2022-05-22,2022-05-22,"מצב מצויין, שמור, כל הטיפולים בסוכנות מיצובישי...",,122000,,26
155,מיצובישי,2020,אקליפס,1,אוטומטית,1500,בנזין,,,מודיעין והסביבה,מודיעין,129000.0,0,2022-05-11,2022-05-11,רכב שמור נמצא בחניה מקורה נהג יחיד(70),,16000,,15
156,מיצובישי,2010,לנסר הדור החדש,3,אוטומטית,1500,בנזין,,,קריות,רכסים,11500.0,0,2022-05-05,2022-05-05,חלונות שחורים מסך באגז גדול מושבים יפים,,220000,,
157,מיצובישי,2017,אאוטלנדר,2,אוטומטית,2000,בנזין,,,באר שבע והסביבה,באר שבע,115000.0,0,2022-04-26,2022-04-26,הרכב במצב מצויין טסט שלמה שלמה צלחות ברקסים וצ...,,85000,,26


In [41]:
merged_df.dtypes

manufactor                 object
Year                        Int64
model                      object
Hand                        Int64
Gear                     category
Engine_capacity             Int64
Engine_type              category
Prev_ownership           category
Curr_ownership           category
Area                       object
City                       object
Price                     float64
Pic_num                     Int64
Cre_date           datetime64[ns]
Repub_date         datetime64[ns]
Description                object
Color                      object
Km                          Int64
Test                        Int64
Supply_score                Int64
dtype: object

In [42]:
mydf = merged_df[(merged_df['Year'] >= 2017) & (merged_df['Year'] <= 2024)]

In [11]:
mydf.to_csv('mitsu17_24.csv',encoding='utf-8-sig',index=False)