# Ebay webscraping

In [2]:
import pandas as pd
import requests    # for making standart html requests
from bs4 import BeautifulSoup # magical tool for parsing html data

In [31]:
import requests
from bs4 import BeautifulSoup

# URL'yi tanımlayın
url = 'https://www.kleinanzeigen.de/s-anzeige/erstbezug-ab-sofort-donau-side-modernes-studenten-apartment-mit-fitnessstudio-co-working/2732860091-203-7613'

# Sayfayı getir
response = requests.get(url)
response.raise_for_status()  # HTTP hata durumlarını kontrol et

# Sayfa içeriğini BeautifulSoup ile ayrıştır
soup = BeautifulSoup(response.content, 'html.parser')

# "addetailslist--detail" sınıfına sahip tüm elementleri bul
details = soup.find_all(class_='addetailslist--detail')

# Detayları bir sözlük olarak sakla
details_dict = {}

for detail in details:
    # İçerdeki "addetailslist--detail--value" sınıfına sahip değeri bul
    detail_value_element = detail.find('span', class_='addetailslist--detail--value')
    if detail_value_element:
        detail_value_text = detail_value_element.get_text(strip=True)  # Değer kısmı için metin çıkarma
        # Değeri metinden çıkararak sadece başlığı al
        detail_title_text = detail.get_text(strip=True).replace(detail_value_text, '').strip()
    else:
        detail_value_text = 'Değer Yok'
        detail_title_text = detail.get_text(strip=True)

    # Başlık ve değeri sözlüğe ekle
    details_dict[detail_title_text] = detail_value_text

# Sözlüğü yazdır
print(details_dict)


{'Wohnfläche': '38 m²', 'Zimmer': '1', 'Verfügbar ab': 'März 2024', 'Online-Besichtigung': 'Möglich', 'Tauschangebot': 'Kein Tausch', 'Nebenkosten': '255 €', 'Warmmiete': '980 €'}


In [4]:
import requests
from bs4 import BeautifulSoup

class ApartmentScraper:
    def __init__(self, url):
        self.url = url
        self.soup = None

    def fetch_page(self):
        """Web sayfasını çeker ve BeautifulSoup ile ayrıştırır."""
        response = requests.get(self.url)
        response.raise_for_status()  # HTTP hata durumlarını kontrol et
        self.soup = BeautifulSoup(response.content, 'html.parser')

    def extract_details(self):
        """Web sayfasından detayları çıkarır ve bir sözlük olarak döndürür."""
        if self.soup is None:
            raise ValueError("Soup nesnesi boş. Önce fetch_page() metodunu çağırın.")
        
        details = self.soup.find_all(class_='addetailslist--detail')
        details_dict = {}
        for detail in details:
            detail_value_element = detail.find('span', class_='addetailslist--detail--value')
            if detail_value_element:
                detail_value_text = detail_value_element.get_text(strip=True)
                detail_title_text = detail.get_text(strip=True).replace(detail_value_text, '').strip()
            else:
                detail_value_text = 'Değer Yok'
                detail_title_text = detail.get_text(strip=True)

            details_dict[detail_title_text] = detail_value_text
        
        # "boxedarticle--flex--container" sınıfındaki 'kaltmiete' bilgisini ekle
        kaltmiete_element = self.soup.find(class_='boxedarticle--flex--container')
        if kaltmiete_element:
            kaltmiete_value = kaltmiete_element.get_text(strip=True)
            details_dict['kaltmiete'] = kaltmiete_value
        else:
            details_dict['kaltmiete'] = 'Bilgi Bulunamadı'

        return details_dict

    def print_details(self):
        """Detayları yazdırır."""
        details = self.extract_details()
        for title, value in details.items():
            print(f"{title}: {value}")

# Kullanımı
url = 'https://www.kleinanzeigen.de/s-anzeige/erstbezug-ab-sofort-donau-side-modernes-studenten-apartment-mit-fitnessstudio-co-working/2732860091-203-7613'
scraper = ApartmentScraper(url)
scraper.fetch_page()
scraper.print_details()


Wohnfläche: 38 m²
Zimmer: 1
Verfügbar ab: März 2024
Online-Besichtigung: Möglich
Tauschangebot: Kein Tausch
Nebenkosten: 255 €
Warmmiete: 980 €
kaltmiete: 725 €


In [5]:
import requests
from bs4 import BeautifulSoup

class ApartmentScraper:
    def __init__(self, url):
        self.url = url
        self.soup = None

    def fetch_page(self):
        """Web sayfasını çeker ve BeautifulSoup ile ayrıştırır."""
        response = requests.get(self.url)
        response.raise_for_status()  # HTTP hata durumlarını kontrol et
        self.soup = BeautifulSoup(response.content, 'html.parser')

    def extract_details(self):
        """Web sayfasından detayları çıkarır ve bir sözlük olarak döndürür."""
        if self.soup is None:
            raise ValueError("Soup nesnesi boş. Önce fetch_page() metodunu çağırın.")
        
        details = self.soup.find_all(class_='addetailslist--detail')
        details_dict = {}
        for detail in details:
            detail_value_element = detail.find('span', class_='addetailslist--detail--value')
            if detail_value_element:
                detail_value_text = detail_value_element.get_text(strip=True)
                detail_title_text = detail.get_text(strip=True).replace(detail_value_text, '').strip()
            else:
                detail_value_text = 'Değer Yok'
                detail_title_text = detail.get_text(strip=True)

            details_dict[detail_title_text] = detail_value_text
        
        # "boxedarticle--flex--container" sınıfındaki 'kaltmiete' bilgisini ekle
        kaltmiete_element = self.soup.find(class_='boxedarticle--flex--container')
        if kaltmiete_element:
            kaltmiete_value = kaltmiete_element.get_text(strip=True)
            details_dict['kaltmiete'] = kaltmiete_value
        else:
            details_dict['kaltmiete'] = 'Bilgi Bulunamadı'

        return details_dict

# Kullanımı
url = 'https://www.kleinanzeigen.de/s-anzeige/erstbezug-ab-sofort-donau-side-modernes-studenten-apartment-mit-fitnessstudio-co-working/2732860091-203-7613'
scraper = ApartmentScraper(url)
scraper.fetch_page()
details = scraper.extract_details()
print(details)  # Sonuçları görmek için yazdırabilirsiniz, ancak bu satırı kaldırabilirsiniz.


{'Wohnfläche': '38 m²', 'Zimmer': '1', 'Verfügbar ab': 'März 2024', 'Online-Besichtigung': 'Möglich', 'Tauschangebot': 'Kein Tausch', 'Nebenkosten': '255 €', 'Warmmiete': '980 €', 'kaltmiete': '725 €'}


# Chatgpt ile

In [43]:
import requests
from bs4 import BeautifulSoup
import csv

def scrape_page(page_url):
    response = requests.get(page_url)
    soup = BeautifulSoup(response.content, 'html.parser')
    return soup

def get_listing_urls(base_url, soup):
    listing_urls = []
    listings = soup.select('.ad-listitem')
    for listing in listings:
        relative_url = listing.get('data-href')
        if relative_url:
            full_url = base_url + relative_url
            listing_urls.append(full_url)
    return listing_urls

def get_listing_details(listing_url):
    soup = scrape_page(listing_url)
    details = {}
    price_tag = soup.find(class_='boxedarticle--price')
    if price_tag:
        details['price'] = price_tag.text.strip()
    features = soup.find_all(class_='addetailslist--detail')
    for feature in features:
        key = feature.find(class_='addetailslist--detail--label').text.strip()
        value = feature.find(class_='addetailslist--detail--value').text.strip()
        details[key] = value
    return details

def scrape_all_pages(base_url, start_page, end_page):
    all_details = []
    for page_num in range(start_page, end_page + 1):
        page_url = f"{base_url}/seite:{page_num}"
        soup = scrape_page(page_url)
        listing_urls = get_listing_urls(base_url, soup)
        for url in listing_urls:
            details = get_listing_details(url)
            all_details.append(details)
            print(f"Detaylar çekildi: {details}")  # Debugging için eklenen print

    if all_details:  # Boş liste kontrolü
        with open('rent_listings.csv', 'w', newline='', encoding='utf-8') as file:
            writer = csv.DictWriter(file, fieldnames=all_details[0].keys())
            writer.writeheader()
            for details in all_details:
                writer.writerow(details)
    else:
        print("Detaylar listesi boş. Hiçbir veri çekilemedi.")

# Ana URL ve sayfa aralığı ayarları
BASE_URL = 'https://www.kleinanzeigen.de'
START_PAGE = 1
END_PAGE = 5  # Örnek olarak 5 sayfa veri çekilecek

scrape_all_pages(BASE_URL, START_PAGE, END_PAGE)

Detaylar listesi boş. Hiçbir veri çekilemedi.
