In [1]:
from bs4 import BeautifulSoup
import requests
import json

# EMSC web sitesi URL'si
EMSC_URL = "https://www.emsc-csem.org/Earthquake/"

def scrape_emsc_earthquake_data(output_file):
    """
    EMSC web sitesinden deprem verilerini scrape eder ve JSON dosyasına kaydeder.
    """
    try:
        # Web sitesine GET isteği gönder
        headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"}
        response = requests.get(EMSC_URL, headers=headers)
        response.raise_for_status()  # Hata kontrolü

        # HTML içeriğini ayrıştır
        soup = BeautifulSoup(response.content, "html.parser")

        # Deprem verilerini içeren tabloyu bul
        table = soup.find("table", {"id": "tbody"})  # Güncel tablo yapısını kontrol edin
        rows = table.find_all("tr")

        earthquake_data = []

        # Satırları ayrıştır
        for row in rows:
            cols = row.find_all("td")
            if len(cols) >= 6:  # Tabloda en az 6 sütun varsa
                earthquake = {
                    "date": cols[3].text.strip(),
                    "latitude": cols[4].text.strip(),
                    "longitude": cols[5].text.strip(),
                    "depth_km": cols[6].text.strip(),
                    "magnitude": cols[7].text.strip(),
                    "location": cols[8].text.strip(),
                }
                earthquake_data.append(earthquake)

        # JSON dosyasına kaydet
        with open(output_file, "w") as file:
            json.dump(earthquake_data, file, indent=4, ensure_ascii=False)

        print(f"EMSC verileri '{output_file}' dosyasına kaydedildi.")
    except Exception as e:
        print(f"Veri çekme başarısız oldu: {e}")

# Örnek kullanım
if __name__ == "__main__":
    scrape_emsc_earthquake_data("emsc_earthquake_data.json")




Veri çekme başarısız oldu: 'NoneType' object has no attribute 'find_all'


In [2]:
from bs4 import BeautifulSoup
import requests
import json

# EMSC web sitesi URL'si
EMSC_URL = "https://www.emsc-csem.org/Earthquake/"

def scrape_emsc_earthquake_data(output_file):
    """
    EMSC web sitesinden deprem verilerini scrape eder ve JSON dosyasına kaydeder.
    """
    try:
        # Web sitesine GET isteği gönder
        headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"}
        response = requests.get(EMSC_URL, headers=headers)
        response.raise_for_status()  # Hata kontrolü

        # HTML içeriğini ayrıştır
        soup = BeautifulSoup(response.content, "html.parser")

        # Tabloyu bul (tablo id'sini güncelledik)
        table = soup.find("table", {"id": "tbody"})  # Tablonun ID'sini doğrulayın
        if not table:
            raise ValueError("Tablo bulunamadı. Tablonun ID'si değişmiş olabilir.")

        rows = table.find_all("tr")

        earthquake_data = []

        # Satırları ayrıştır
        for row in rows:
            cols = row.find_all("td")
            if len(cols) >= 6:  # Tabloda en az 6 sütun varsa
                earthquake = {
                    "date": cols[3].text.strip(),
                    "latitude": cols[4].text.strip(),
                    "longitude": cols[5].text.strip(),
                    "depth_km": cols[6].text.strip(),
                    "magnitude": cols[7].text.strip(),
                    "location": cols[8].text.strip(),
                }
                earthquake_data.append(earthquake)

        # JSON dosyasına kaydet
        with open(output_file, "w") as file:
            json.dump(earthquake_data, file, indent=4, ensure_ascii=False)

        print(f"EMSC verileri '{output_file}' dosyasına kaydedildi.")
    except Exception as e:
        print(f"Veri çekme başarısız oldu: {e}")

# Örnek kullanım
if __name__ == "__main__":
    scrape_emsc_earthquake_data("emsc_earthquake_data.json")


Veri çekme başarısız oldu: Tablo bulunamadı. Tablonun ID'si değişmiş olabilir.


In [3]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
import time
import json

# Selenium için Chrome driver ayarları
options = Options()
options.add_argument("--headless")  # Arka planda çalışması için
options.add_argument("--disable-gpu")
service = Service("chromedriver_path")  # Kendi bilgisayarındaki chromedriver'ın yolunu yaz

# EMSC URL
EMSC_URL = "https://www.emsc-csem.org/Earthquake/"

def scrape_emsc_with_selenium(output_file):
    """
    Selenium kullanarak EMSC web sitesinden deprem verilerini alır ve JSON dosyasına kaydeder.
    """
    try:
        # Tarayıcı başlat
        driver = webdriver.Chrome(service=service, options=options)
        driver.get(EMSC_URL)
        time.sleep(5)  # Sayfanın tamamen yüklenmesini bekle

        # Tabloyu bul (XPath ile)
        rows = driver.find_elements(By.XPATH, "//table[@id='tbody']/tr")
        earthquake_data = []

        for row in rows:
            cols = row.find_elements(By.TAG_NAME, "td")
            if len(cols) >= 6:  # Yeterli sütun varsa
                earthquake = {
                    "date": cols[3].text.strip(),
                    "latitude": cols[4].text.strip(),
                    "longitude": cols[5].text.strip(),
                    "depth_km": cols[6].text.strip(),
                    "magnitude": cols[7].text.strip(),
                    "location": cols[8].text.strip(),
                }
                earthquake_data.append(earthquake)

        # Tarayıcı kapat
        driver.quit()

        # JSON dosyasına kaydet
        with open(output_file, "w") as file:
            json.dump(earthquake_data, file, indent=4, ensure_ascii=False)

        print(f"EMSC verileri '{output_file}' dosyasına kaydedildi.")
    except Exception as e:
        print(f"Veri çekme başarısız oldu: {e}")

# Örnek kullanım
if __name__ == "__main__":
    scrape_emsc_with_selenium("emsc_earthquake_data.json")


Veri çekme başarısız oldu: Message: Unable to obtain driver for chrome; For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors/driver_location



In [4]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# Hedef URL
url = "https://www.emsc-csem.org/Earthquake/"  # EMSC'nin deprem verileri sayfası

# HTTP isteği
response = requests.get(url)
if response.status_code == 200:
    print("Siteye başarıyla bağlanıldı.")
else:
    print("Siteye bağlanılamadı. Durum Kodu:", response.status_code)
    exit()

# HTML parse işlemi
soup = BeautifulSoup(response.text, "html.parser")

# Verilerin bulunduğu tabloyu seçmek
table = soup.find("table", class_="table")  # Tablo sınıfını kontrol edin
if not table:
    print("Veri tablosu bulunamadı!")
    exit()

# Tablo satırlarını al
rows = table.find_all("tr")

# Veri başlıklarını al
headers = [header.text.strip() for header in rows[0].find_all("th")]

# Veri satırlarını işle
data = []
for row in rows[1:]:
    cols = row.find_all("td")
    cols = [col.text.strip() for col in cols]
    if cols:  # Eğer satır boş değilse
        data.append(cols)

# Veriyi DataFrame'e dönüştür
df = pd.DataFrame(data, columns=headers)

# CSV dosyasına kaydet
df.to_csv("earthquake_data.csv", index=False)
print("Deprem verileri 'earthquake_data.csv' dosyasına kaydedildi.")


Siteye başarıyla bağlanıldı.
Veri tablosu bulunamadı!


AttributeError: 'NoneType' object has no attribute 'find_all'

: 