In [1]:
import requests
from bs4 import BeautifulSoup

def scrape_suumo(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    
    # 必要なデータを抽出
    properties = []
    for item in soup.find_all('div', class_='cassetteitem'):
        name = item.find('div', class_='cassetteitem_content-title').text.strip()
        rent = item.find('span', class_='cassetteitem_other-emphasis').text.strip()
        layout = item.find('span', class_='cassetteitem_madori').text.strip()
        area = item.find('span', class_='cassetteitem_menseki').text.strip()
        distance = item.find('li', class_='cassetteitem_detail-col3').text.strip()
        properties.append((name, rent, layout, area, distance))
    
    return properties

# SUUMOのURL例 (地域別に検索ページを設定)
url = "https://suumo.jp/chintai/tokyo/sc_shibuya/"
data = scrape_suumo(url)
print(data)

[('シャトー上原', '13万円', '10DK', '30.3m2', '築35年\n3階建'), ('ディームス渋谷本町', '23.8万円', '1LDK', '42.15m2', '築6年\n14階建'), ('ヴィオラ笹塚', '21.5万円', '2LDK', '53.2m2', '築25年\n2階建'), ('プライムガーデン恵比寿南', '21.6万円', '1LDK', '31.47m2', '新築\n13階建'), ('ＪＲ山手線 恵比寿駅 13階建 新築', '21.6万円', '1LDK', '31.47m2', '新築\n13階建'), ('ガーデン代々木参宮橋', '23万円', '2LDK', '55.97m2', '築22年\n4階建'), ('レフィール参宮橋ヒルズ', '30万円', '2LDK', '58.01m2', '築9年\n5階建'), ('ルーナ ピィエナ代々木上原', '16.5万円', '1LDK', '34.19m2', '築4年\n地下2地上3階建'), ('テラス富ヶ谷', '20万円', '2SDK', '54.65m2', '築21年\n2階建'), ('ＴＨＥ\u3000ＣＯＵＲＴ\u3000神宮外苑', '39.8万円', '2LDK', '56.77m2', '築5年\n23階建'), ('パークキューブ代々木富ヶ谷', '18.4万円', '1LDK', '34.36m2', '築18年\n9階建'), ('ソルテ千駄ヶ谷', '19.3万円', '1LDK', '33.27m2', '新築\n4階建'), ('GRAN PASEO新宿', '12.5万円', '1K', '22.9m2', '築7年\n地下1地上4階建'), ('T-HAUS 鉢山', '32.5万円', '1SLDK', '64.39m2', '築1年\n4階建'), ('京王新線 幡ヶ谷駅 3階建 築5年', '14.5万円', '1LDK', '42.23m2', '築5年\n3階建'), ('ミハス幡ヶ谷', '14.5万円', '1LDK', '42.23m2', '築5年\n3階建'), ('ラサンテ広尾', '11.8万円', '1K', '20.02m2', '築18年\n10階建'), ('パークアクシス渋谷

In [2]:
import sqlite3

def save_to_db(data, db_path='real_estate.db'):
    connection = sqlite3.connect(db_path)
    cursor = connection.cursor()

    # テーブル作成
    cursor.execute('''
    CREATE TABLE IF NOT EXISTS properties (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        name TEXT,
        rent REAL,
        layout TEXT,
        area REAL,
        distance TEXT
    )
    ''')

    # データ挿入
    cursor.executemany('''
    INSERT INTO properties (name, rent, layout, area, distance)
    VALUES (?, ?, ?, ?, ?)
    ''', data)

    connection.commit()
    connection.close()

# データ保存
save_to_db(data)