## SAMUEL BITTON: 2246844
## RICARDO CASTER: 342688405

## https://github.com/RicardoCaster/kryat_netunim_matala1


In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import time

In [2]:
import requests
from bs4 import BeautifulSoup
import re

def get_ad_links():
    base_url = "https://www.ad.co.il"
    listings_url = "https://www.ad.co.il/nadlanrent?sp275=17413&sp277=17633,18274,17512"
    
    response = requests.get(listings_url)
    response.raise_for_status()  # אם יש שגיאת חיבור

    soup = BeautifulSoup(response.text, "html.parser")

    # מוצא את כל הקישורים שכוללים את התבנית של מודעה
    ad_links = set()
    for a_tag in soup.find_all("a", href=True):
        match = re.search(r"/ad/(\d+)", a_tag["href"])
        if match:
            ad_id = match.group(1)
            full_link = f"{base_url}/ad/{ad_id}"
            ad_links.add(full_link)

    return list(ad_links)


def get_apartment_details(url):
    details = {}
    headers = {'User-Agent': 'Mozilla/5.0'}

    try:
        response = requests.get(url, headers=headers)
        if response.status_code != 200:
            print("Failed to fetch page.")
            return details

        soup = BeautifulSoup(response.content, 'html.parser')

        # 🟡 חיפוש טקסט שמכיל את הסימן ₪
        price_tag = soup.find(string=lambda text: text and "₪" in text)
        if price_tag:
            price = price_tag.strip()
        else:
            price = "מחיר לא נמצא"
        details['מחיר כלל'] = price

        # 🟢 שליפת פרטי הדירה מתוך הטבלה
        table = soup.find('table', class_='table table-sm mb-4')
        if table:
            for row in table.find_all('tr'):
                cols = row.find_all('td')
                if len(cols) == 2:
                    key = cols[0].get_text(strip=True)
                    value = cols[1].get_text(strip=True)
                    details[key] = value

        # 🟠 שליפת תיאור הדירה
        description_tag = soup.find('p', class_='text-word-break')
        if description_tag:
            description = description_tag.get_text("\n", strip=True)
            description = description.replace("\n\n", " ").replace(" ,", ",").strip()
            details['description'] = description
        else:
            details['description'] = "אין תיאור"

        # 🔸 שליפת עמודות בוליאניות מתוך הקלאסים הגרפיים
        features_section = soup.find('div', class_='card-icons-wrap p-3')
        features = {
            'is_furnished': 'מרוהטת',
            'ac': 'מזגן',
            'has_parking': 'חניה',
            'has_safe_room': 'ממ\"ד',
            'has_balcon': 'מרפסת',
            'handicap': 'נגישות',
            'has_bars': 'סורגים',
            'elevator': 'מעלית',
            'has_stotsge': 'מחסן',
            'has_sun_balcon': 'מרפסת שמש',
            'is_renovated': 'משופצת'
        }

        if features_section:
            icons = features_section.find_all('div', class_='card-icon')
            for key, label in features.items():
                found = 0
                for icon in icons:
                    span = icon.find('span')
                    if span and label in span.text:
                        if 'fa-check' in icon.decode():
                            found = 1
                        break
                details[key] = found
        else:
            for key in features:
                details[key] = 0

        # 🔹 שליפת תמונות
        image_tags = soup.find_all('img', class_='img-fluid')  # או כל class שמתאים לתמונות
        image_urls = [img['src'] for img in image_tags if 'src' in img.attrs]
        details['num_of_images'] = len(image_urls)  # סופרים את התמונות

        return details

    except Exception as e:
        print("Error:", e)
        return details


def get_all_apartments():
    # שלב 1: קבל את כל ה-URLs של הדירות
    ad_links = get_ad_links()
    
    all_apartments = {}
    
    # שלב 2: עבור כל URL, קבל את פרטי הדירה
    for url in ad_links:
        apartment_details = get_apartment_details(url)
        
        # אם נמצא פרטי דירה, הוסף למילון
        if apartment_details:
            all_apartments[url] = apartment_details
    
    return all_apartments


# שלב 3: הפעל את הפונקציה וצלם את התוצאה
apartments_data = get_all_apartments()

# הצגת המידע
for url, details in apartments_data.items():
    print(f"URL: {url}")
    for key, value in details.items():
        print(f"{key}: {value}")
    print("-" * 50)



URL: https://www.ad.co.il/ad/16197381
מחיר כלל: 5,000 ₪
פרטי הנכס: דירה
אזור: תל אביב
עיר: תל אביב יפו
שכונה: נוה חן
כתובת: מעפילי אגוז 5
חדרים: 2.5
קומה: 3 מתוך 4
שטח בנוי: 65
תאריך כניסה: מיידית
תשלומים בשנה: 12
ארנונה בחודש: 450
ועד בית בחודש: 60
description: רחוב:מעפילי אגוז שכונה: כפיר דירה 2.5 חד כ 65 מטר קומה 3 ללא מעלית משופצת ויפה,יציאה למרפסת סגורה מטבח עם מקרר חדרי שינה מרוחים,עם פרקטים ומזגן. אזור עם חניה חופשי. כניסה מידית.
is_furnished: 0
ac: 1
has_parking: 0
has_safe_room: 0
has_balcon: 0
handicap: 0
has_bars: 0
elevator: 0
has_stotsge: 0
has_sun_balcon: 0
is_renovated: 1
num_of_images: 19
--------------------------------------------------
URL: https://www.ad.co.il/ad/13704459
מחיר כלל: 7,000 ₪
פרטי הנכס: דירה
אזור: תל אביב
עיר: תל אביב יפו
שכונה: לב תל אביב החלק הדרומי
כתובת: מלצ'ט 8
חדרים: 3
מרפסות: 2
קומה: 2 מתוך 4
שטח בנוי: 76
תאריך כניסה: מיידית
תשלומים בשנה: 12
ארנונה בחודש: 450
ועד בית בחודש: 300
description: 3  חדרים,כ - 76  מטר מסודרת מוארת מקסימה ואיוכתית.
חזית

In [3]:
import pandas as pd
import numpy as np

# 1. Convert the dictionary to a DataFrame
df = pd.DataFrame.from_dict(apartments_data, orient='index').reset_index()
df.rename(columns={'index': 'ad_url'}, inplace=True)

# 2. Standardize the columns: identify all possible columns
all_columns = set()
for data in apartments_data.values():
    all_columns.update(data.keys())

# 3. Make sure each row contains all columns; if not, fill with None or 0 depending on the case
bool_columns = {
    'has_parking', 'has_safe_room', 'has_balcon', 'handicap', 'has_bars',
    'elevator', 'has_storage', 'has_sun_balcon', 'is_renovated', 'is_furnished', 'ac'
}

# Filling in missing columns in the DataFrame
for col in all_columns:
    if col not in df.columns:
        # If it's a boolean column → 0, otherwise NaN
        df[col] = 0 if col in bool_columns else np.nan

# 4. Raw save without renaming
df.to_csv("apartments_full_data_raw.csv", index=False, encoding='utf-8-sig')

# 5. Display the current structure
df.head()


Unnamed: 0,ad_url,מחיר כלל,פרטי הנכס,אזור,עיר,שכונה,כתובת,חדרים,קומה,שטח בנוי,...,סוג מנוע,"ק""מ",טסט עד,צבע,בעלות קודמת,בעלות נוכחית,תת קטגוריה,יצרן,סוג,מצב
0,https://www.ad.co.il/ad/16197381,"5,000 ₪",דירה,תל אביב,תל אביב יפו,נוה חן,מעפילי אגוז 5,2.5,3 מתוך 4,65,...,,,,,,,,,,
1,https://www.ad.co.il/ad/13704459,"7,000 ₪",דירה,תל אביב,תל אביב יפו,לב תל אביב החלק הדרומי,מלצ'ט 8,3.0,2 מתוך 4,76,...,,,,,,,,,,
2,https://www.ad.co.il/ad/15547083,"7,500 ₪",דירה,תל אביב,תל אביב יפו,לב תל אביב החלק הדרומי,אחד עם 88,3.0,קרקע מתוך 4,70,...,,,,,,,,,,
3,https://www.ad.co.il/ad/16191330,"11,000 ₪",גג/ פנטהאוז,תל אביב,תל אביב יפו,נוה חן,מעפילי אגוז 66,5.0,7 מתוך 7,190,...,,,,,,,,,,
4,https://www.ad.co.il/ad/15905127,"7,000 ₪",דירה,תל אביב,תל אביב יפו,לב תל אביב החלק הדרומי,במנחם בגין 9,3.0,2 מתוך 4,70,...,,,,,,,,,,


In [4]:
import numpy as np

# 1. הסרת עמודות לא רלוונטיות אם הן קיימות
columns_to_drop = ['has_sun_balcon','ad_url', 'אזור', 'תת קטגוריה', 'מצב','עיר','מרפסות']
df = df.drop(columns=[col for col in columns_to_drop if col in df.columns])

# 2. הוספת עמודה DistanceFromCenter עם ערכים NaN
df['DistanceFromCenter'] = np.nan
df.head()


Unnamed: 0,מחיר כלל,פרטי הנכס,שכונה,כתובת,חדרים,קומה,שטח בנוי,תאריך כניסה,תשלומים בשנה,ארנונה בחודש,...,נפח,סוג מנוע,"ק""מ",טסט עד,צבע,בעלות קודמת,בעלות נוכחית,יצרן,סוג,DistanceFromCenter
0,"5,000 ₪",דירה,נוה חן,מעפילי אגוז 5,2.5,3 מתוך 4,65,מיידית,12,450,...,,,,,,,,,,
1,"7,000 ₪",דירה,לב תל אביב החלק הדרומי,מלצ'ט 8,3.0,2 מתוך 4,76,מיידית,12,450,...,,,,,,,,,,
2,"7,500 ₪",דירה,לב תל אביב החלק הדרומי,אחד עם 88,3.0,קרקע מתוך 4,70,,12,450,...,,,,,,,,,,
3,"11,000 ₪",גג/ פנטהאוז,נוה חן,מעפילי אגוז 66,5.0,7 מתוך 7,190,,12,500,...,,,,,,,,,,
4,"7,000 ₪",דירה,לב תל אביב החלק הדרומי,במנחם בגין 9,3.0,2 מתוך 4,70,מיידית,12,350,...,,,,,,,,,,


In [5]:
import pandas as pd

# מילון לשינוי שמות עמודות מעברית לאנגלית
rename_dict = {
    'פרטי הנכס': 'property_type',
    'שכונה': 'neighborhood',
    'כתובת': 'address',
    'חדרים': 'room_num',
    'קומה': 'floor',
    'שטח בנוי': 'area',
    'שטח גינה': 'garden_area',
    'תאריך כניסה': 'days_to_enter',
    'תשלומים בשנה': 'num_of_payments',
    'ארנונה בחודש': 'monthly_arnona',
    'num_of_images':'num_of_images',
    'ועד בית בחודש': 'building_tax',
    'קומות בבניין': 'total_floors',
    'מחיר כלל': 'price',
    'DistanceFromCenter': 'distance_from_center',
}

# חילוץ מספר קומה וסך הקומות מתוך מחרוזת כמו "3 מתוך 5"
if 'floor' in df.columns:
    df[['floor', 'total_floors']] = df['floor'].astype(str).str.extract(r'(\d+)\s*(?:מתוך\s*(\d+))?')
    df['floor'] = pd.to_numeric(df['floor'], errors='coerce').astype('Int64')
    df['total_floors'] = pd.to_numeric(df['total_floors'], errors='coerce').astype('Int64')

# שינוי שמות העמודות
df.rename(columns=rename_dict, inplace=True)

# הסרת עמודות מיותרות
columns_to_drop = ['ad_url','אזור', 'תת קטגוריה', 'מרפסות', 'עיר', 'יצרן', 'סוג', 'מצב']
df.drop(columns=columns_to_drop, inplace=True, errors='ignore')

# עמודות בוליאניות -> int32
bool_columns = [
    'has_parking', 'has_storage', 'elevator', 'ac', 'handicap',
    'has_bars', 'has_safe_room', 'has_balcon', 'is_furnished', 'is_renovated'
]
for col in bool_columns:
    if col in df.columns:
        df[col] = pd.to_numeric(df[col], errors='coerce').fillna(0).astype('int32')

df.dtypes


price                    object
property_type            object
neighborhood             object
address                  object
room_num                 object
floor                    object
area                     object
days_to_enter            object
num_of_payments          object
monthly_arnona           object
building_tax             object
description              object
is_furnished              int32
ac                        int32
has_parking               int32
has_safe_room             int32
has_balcon                int32
handicap                  int32
has_bars                  int32
elevator                  int32
has_stotsge               int64
is_renovated              int32
num_of_images             int64
garden_area              object
שנה                      object
יד                       object
ת. הילוכים               object
נפח                      object
סוג מנוע                 object
ק"מ                      object
טסט עד                   object
צבע     

In [6]:
df.head()

Unnamed: 0,price,property_type,neighborhood,address,room_num,floor,area,days_to_enter,num_of_payments,monthly_arnona,...,יד,ת. הילוכים,נפח,סוג מנוע,"ק""מ",טסט עד,צבע,בעלות קודמת,בעלות נוכחית,distance_from_center
0,"5,000 ₪",דירה,נוה חן,מעפילי אגוז 5,2.5,3 מתוך 4,65,מיידית,12,450,...,,,,,,,,,,
1,"7,000 ₪",דירה,לב תל אביב החלק הדרומי,מלצ'ט 8,3.0,2 מתוך 4,76,מיידית,12,450,...,,,,,,,,,,
2,"7,500 ₪",דירה,לב תל אביב החלק הדרומי,אחד עם 88,3.0,קרקע מתוך 4,70,,12,450,...,,,,,,,,,,
3,"11,000 ₪",גג/ פנטהאוז,נוה חן,מעפילי אגוז 66,5.0,7 מתוך 7,190,,12,500,...,,,,,,,,,,
4,"7,000 ₪",דירה,לב תל אביב החלק הדרומי,במנחם בגין 9,3.0,2 מתוך 4,70,מיידית,12,350,...,,,,,,,,,,


In [7]:
# Convert price column to float values
df['price'] = (
    df['price']
    .astype(str)  # Make sure all values are strings
    .str.replace(r'[^\d.]', '', regex=True)  # Remove non-numeric characters
    .replace('', np.nan)  # Replace empty strings with NaN
    .astype(float)  # Convert to float
)

# Closed list of valid property types
valid_types = {
    "דירה",
    "דירת גן",
    "בית פרטי/ קוטג'",
    "גג/ פנטהאוז",
    "מגרשים",
    "דופלקס",
    "תיירות ונופש",
    "כללי"
}

## Replace invalid values
df['property_type'] = df['property_type'].apply(
    lambda x: x if x in valid_types else "באתר מופיע ערך שלא ברשימה הסגורה"
)

# Convert room_num column to float
df['room_num'] = pd.to_numeric(df['room_num'], errors='coerce')


df.head()

Unnamed: 0,price,property_type,neighborhood,address,room_num,floor,area,days_to_enter,num_of_payments,monthly_arnona,...,יד,ת. הילוכים,נפח,סוג מנוע,"ק""מ",טסט עד,צבע,בעלות קודמת,בעלות נוכחית,distance_from_center
0,5000.0,דירה,נוה חן,מעפילי אגוז 5,2.5,3 מתוך 4,65,מיידית,12,450,...,,,,,,,,,,
1,7000.0,דירה,לב תל אביב החלק הדרומי,מלצ'ט 8,3.0,2 מתוך 4,76,מיידית,12,450,...,,,,,,,,,,
2,7500.0,דירה,לב תל אביב החלק הדרומי,אחד עם 88,3.0,קרקע מתוך 4,70,,12,450,...,,,,,,,,,,
3,11000.0,גג/ פנטהאוז,נוה חן,מעפילי אגוז 66,5.0,7 מתוך 7,190,,12,500,...,,,,,,,,,,
4,7000.0,דירה,לב תל אביב החלק הדרומי,במנחם בגין 9,3.0,2 מתוך 4,70,מיידית,12,350,...,,,,,,,,,,


In [8]:
df.dtypes

price                   float64
property_type            object
neighborhood             object
address                  object
room_num                float64
floor                    object
area                     object
days_to_enter            object
num_of_payments          object
monthly_arnona           object
building_tax             object
description              object
is_furnished              int32
ac                        int32
has_parking               int32
has_safe_room             int32
has_balcon                int32
handicap                  int32
has_bars                  int32
elevator                  int32
has_stotsge               int64
is_renovated              int32
num_of_images             int64
garden_area              object
שנה                      object
יד                       object
ת. הילוכים               object
נפח                      object
סוג מנוע                 object
ק"מ                      object
טסט עד                   object
צבע     

In [9]:
# המרת עמודות מספריות ל-Int64
int_columns = [
    'area', 'garden_area', 'days_to_enter', 'num_of_payments',
    'monthly_arnona', 'building_tax', 'num_of_images'
]

# המרת room_num ו-price ל-float
for col in ['room_num', 'price']:
    if col in df.columns:
        df[col] = pd.to_numeric(df[col], errors='coerce')

df.head()
df.columns
df.dtypes

price                   float64
property_type            object
neighborhood             object
address                  object
room_num                float64
floor                    object
area                     object
days_to_enter            object
num_of_payments          object
monthly_arnona           object
building_tax             object
description              object
is_furnished              int32
ac                        int32
has_parking               int32
has_safe_room             int32
has_balcon                int32
handicap                  int32
has_bars                  int32
elevator                  int32
has_stotsge               int64
is_renovated              int32
num_of_images             int64
garden_area              object
שנה                      object
יד                       object
ת. הילוכים               object
נפח                      object
סוג מנוע                 object
ק"מ                      object
טסט עד                   object
צבע     

In [10]:
df.head()

Unnamed: 0,price,property_type,neighborhood,address,room_num,floor,area,days_to_enter,num_of_payments,monthly_arnona,...,יד,ת. הילוכים,נפח,סוג מנוע,"ק""מ",טסט עד,צבע,בעלות קודמת,בעלות נוכחית,distance_from_center
0,5000.0,דירה,נוה חן,מעפילי אגוז 5,2.5,3 מתוך 4,65,מיידית,12,450,...,,,,,,,,,,
1,7000.0,דירה,לב תל אביב החלק הדרומי,מלצ'ט 8,3.0,2 מתוך 4,76,מיידית,12,450,...,,,,,,,,,,
2,7500.0,דירה,לב תל אביב החלק הדרומי,אחד עם 88,3.0,קרקע מתוך 4,70,,12,450,...,,,,,,,,,,
3,11000.0,גג/ פנטהאוז,נוה חן,מעפילי אגוז 66,5.0,7 מתוך 7,190,,12,500,...,,,,,,,,,,
4,7000.0,דירה,לב תל אביב החלק הדרומי,במנחם בגין 9,3.0,2 מתוך 4,70,מיידית,12,350,...,,,,,,,,,,


In [11]:
!pip install googlemaps



In [12]:
import googlemaps

In [13]:
def add_distance_from_center(df, api_key, center_address="כיכר דיזנגוף, תל אביב"):
    """
    מקבלת DataFrame עם עמודת address או neighborhood,
    מחזירה את אותו df עם עמודה חדשה: distance_from_center (במטרים, כ-float)
    """
    import requests
    import json
    import time
    import pandas as pd
    import googlemaps

    distances = []

    def format_address(addr):
        if not isinstance(addr, str) or not addr.strip():
            return None
        addr = addr.strip()
        if "תל אביב" not in addr:
            addr += ", תל אביב"
        return addr

    def get_distance(origin, destination, api_key):
        url = f"https://routes.googleapis.com/directions/v2:computeRoutes"
        headers = {
            'Content-Type': 'application/json',
            'X-Goog-Api-Key': api_key,
            'X-Goog-FieldMask': 'routes.distanceMeters'
        }
        body = {
            "origin": {"address": origin},
            "destination": {"address": destination},
            "travelMode": "DRIVE",
            "routingPreference": "TRAFFIC_AWARE"
        }

        response = requests.post(url, headers=headers, json=body)
        if response.status_code == 200:
            data = response.json()
            if 'routes' in data and data['routes']:
                return float(data['routes'][0]['distanceMeters'])  
        return None

    for i, row in df.iterrows():
        address = format_address(row.get("address", ""))
        neighborhood = format_address(row.get("neighborhood", ""))
        distance = None

        if address:
            distance = get_distance(address, center_address, api_key)
            if distance is not None:
                distances.append(distance)
                continue
            else:
                print(f"שגיאה: לא נמצאה תוצאה עבור הכתובת {address}")

           
        if neighborhood:
            distance = get_distance(neighborhood, center_address, api_key)
            if distance is not None:
                distances.append(distance)
                continue
            else:
                print(f"שגיאה: לא נמצאה תוצאה גם עבור השכונה {neighborhood}")

        distances.append(None)
        time.sleep(0.2)

    df["distance_from_center"] = pd.to_numeric(distances, errors="coerce")

    return df


In [14]:
# Put your API here
api_key = 'AIzaSyDgfvwFo7Rbsx5rCdc8ISm3k5V_xIFkWNk'
df = add_distance_from_center(df, api_key)


In [15]:
df.head()

Unnamed: 0,price,property_type,neighborhood,address,room_num,floor,area,days_to_enter,num_of_payments,monthly_arnona,...,יד,ת. הילוכים,נפח,סוג מנוע,"ק""מ",טסט עד,צבע,בעלות קודמת,בעלות נוכחית,distance_from_center
0,5000.0,דירה,נוה חן,מעפילי אגוז 5,2.5,3 מתוך 4,65,מיידית,12,450,...,,,,,,,,,,7070.0
1,7000.0,דירה,לב תל אביב החלק הדרומי,מלצ'ט 8,3.0,2 מתוך 4,76,מיידית,12,450,...,,,,,,,,,,3060.0
2,7500.0,דירה,לב תל אביב החלק הדרומי,אחד עם 88,3.0,קרקע מתוך 4,70,,12,450,...,,,,,,,,,,2796.0
3,11000.0,גג/ פנטהאוז,נוה חן,מעפילי אגוז 66,5.0,7 מתוך 7,190,,12,500,...,,,,,,,,,,6397.0
4,7000.0,דירה,לב תל אביב החלק הדרומי,במנחם בגין 9,3.0,2 מתוך 4,70,מיידית,12,350,...,,,,,,,,,,4026.0


In [16]:
df.dtypes

price                   float64
property_type            object
neighborhood             object
address                  object
room_num                float64
floor                    object
area                     object
days_to_enter            object
num_of_payments          object
monthly_arnona           object
building_tax             object
description              object
is_furnished              int32
ac                        int32
has_parking               int32
has_safe_room             int32
has_balcon                int32
handicap                  int32
has_bars                  int32
elevator                  int32
has_stotsge               int64
is_renovated              int32
num_of_images             int64
garden_area              object
שנה                      object
יד                       object
ת. הילוכים               object
נפח                      object
סוג מנוע                 object
ק"מ                      object
טסט עד                   object
צבע     

In [17]:
# המרת עמודות מספריות ל-Int64
int_columns = [
    'area', 'garden_area', 'days_to_enter', 'num_of_payments',
    'monthly_arnona', 'building_tax', 'num_of_images'
]

cols_to_convert = ['area', 'num_of_payments', 'monthly_arnona', 'building_tax', 'garden_area']
for col in cols_to_convert:
    df[col] = pd.to_numeric(df[col], errors='coerce').fillna(0).astype(int)

df["days_to_enter"] = (
    df["days_to_enter"]
    .replace("מיידית", 0)  # Replace "מיידית" with 0
    .replace("", np.nan)   # Replace empty string with NaN (optional if needed)
)

# Convert to numeric with Int64 to allow missing values
df["days_to_enter"] = pd.to_numeric(df["days_to_enter"], errors="coerce").astype("Int64")

  .replace("מיידית", 0)  # Replace "מיידית" with 0


In [18]:
df.head()

Unnamed: 0,price,property_type,neighborhood,address,room_num,floor,area,days_to_enter,num_of_payments,monthly_arnona,...,יד,ת. הילוכים,נפח,סוג מנוע,"ק""מ",טסט עד,צבע,בעלות קודמת,בעלות נוכחית,distance_from_center
0,5000.0,דירה,נוה חן,מעפילי אגוז 5,2.5,3 מתוך 4,65,0.0,12,450,...,,,,,,,,,,7070.0
1,7000.0,דירה,לב תל אביב החלק הדרומי,מלצ'ט 8,3.0,2 מתוך 4,76,0.0,12,450,...,,,,,,,,,,3060.0
2,7500.0,דירה,לב תל אביב החלק הדרומי,אחד עם 88,3.0,קרקע מתוך 4,70,,12,450,...,,,,,,,,,,2796.0
3,11000.0,גג/ פנטהאוז,נוה חן,מעפילי אגוז 66,5.0,7 מתוך 7,190,,12,500,...,,,,,,,,,,6397.0
4,7000.0,דירה,לב תל אביב החלק הדרומי,במנחם בגין 9,3.0,2 מתוך 4,70,0.0,12,350,...,,,,,,,,,,4026.0


In [19]:
df.to_csv("DATA__apartment_final.csv", index=False, encoding='utf-8-sig')

In [20]:
df.dtypes

price                   float64
property_type            object
neighborhood             object
address                  object
room_num                float64
floor                    object
area                      int32
days_to_enter             Int64
num_of_payments           int32
monthly_arnona            int32
building_tax              int32
description              object
is_furnished              int32
ac                        int32
has_parking               int32
has_safe_room             int32
has_balcon                int32
handicap                  int32
has_bars                  int32
elevator                  int32
has_stotsge               int64
is_renovated              int32
num_of_images             int64
garden_area               int32
שנה                      object
יד                       object
ת. הילוכים               object
נפח                      object
סוג מנוע                 object
ק"מ                      object
טסט עד                   object
צבע     