In [2]:
import requests
from bs4 import BeautifulSoup
import time
import pandas as pd

# SUUMOの特定のページのURLを指定（新宿区）
url = "https://suumo.jp/jj/chintai/ichiran/FR301FC001/?ar=030&bs=040&pc=30&smk=&po1=25&po2=99&shkr1=03&shkr2=03&shkr3=03&shkr4=03&sc=13101&sc=13102&sc=13103&sc=13104&sc=13105&sc=13113&sc=13106&sc=13107&sc=13108&sc=13118&sc=13121&sc=13122&sc=13123&sc=13109&sc=13110&sc=13111&sc=13112&sc=13114&sc=13115&sc=13120&sc=13116&sc=13117&sc=13119&ta=13&cb=0.0&ct=20.0&md=05&md=06&md=07&md=08&md=09&et=10&mb=0&mt=9999999&cn=15&tc=0400301&fw2="



# 物件情報を格納するリスト
properties = []

# セッションを開始
session = requests.Session()

# 最初のページからスタート
page = 1

while True:
    # パラメータにページ数を追加
    params = {'page': page}

    # リクエストを送信
    response = session.get(url, params=params)
    response.encoding = response.apparent_encoding

    # HTMLコンテンツを解析
    soup = BeautifulSoup(response.text, 'html.parser')

    # 物件情報の抽出
    listings = soup.find_all('div', class_='cassetteitem')
    if not listings:
        break  # リストが空なら終了

    for listing in listings:
        property_name = listing.find('div', class_='cassetteitem_content-title').text.strip()
        address = listing.find('li', class_='cassetteitem_detail-col1').text.strip()
        layout = listing.find('span', class_='cassetteitem_madori').text.strip()
        rent = listing.find('span', class_='cassetteitem_other-emphasis').text.strip()
        floor = listing.find('li', class_='cassetteitem_detail-col3').text.strip()
        access = listing.find('div', class_='cassetteitem_detail-text').text.strip()

        properties.append({
            '物件名': property_name,
            '住所': address,
            '間取り': layout,
            '家賃': rent,
            '階数': floor,
            '最寄りまでの時間': access
        })

    # 次のページへ
    page += 1

        # サーバーへの負荷を考慮して少し待機
    time.sleep(1)


# 最終的な物件情報のリストを表示
for property in properties:
    print(property)

# 'properties'リストをデータフレームに変換
properties_df = pd.DataFrame(properties)

# データフレームの表示
print(properties_df)

# CSVファイルに保存
properties_df.to_csv('suumo.csv', index=False, encoding='utf-8-sig')

{'物件名': 'ＪＲ山手線 高田馬場駅 4階建 築1年', '住所': '東京都新宿区高田馬場４', '間取り': '2K', '家賃': '11.1万円', '階数': '築1年\n4階建', '最寄りまでの時間': 'ＪＲ山手線/高田馬場駅 歩7分'}
{'物件名': 'ビルヴィオ東日暮里', '住所': '東京都荒川区東日暮里４', '間取り': '2DK', '家賃': '13.9万円', '階数': '築8年\n9階建', '最寄りまでの時間': 'ＪＲ山手線/日暮里駅 歩10分'}
{'物件名': '東京メトロ半蔵門線 押上駅 7階建 築6年', '住所': '東京都墨田区向島３', '間取り': '2LDK', '家賃': '16.7万円', '階数': '築6年\n7階建', '最寄りまでの時間': '東京メトロ半蔵門線/押上駅 歩10分'}
{'物件名': 'フェニックス板橋', '住所': '東京都板橋区板橋２', '間取り': '2DK', '家賃': '12万円', '階数': '築14年\n8階建', '最寄りまでの時間': 'ＪＲ埼京線/板橋駅 歩10分'}
{'物件名': '東京メトロ東西線 落合駅 6階建 築3年', '住所': '東京都中野区東中野３', '間取り': '2DK', '家賃': '17.8万円', '階数': '築3年\n6階建', '最寄りまでの時間': '東京メトロ東西線/落合駅 歩1分'}
{'物件名': 'ブルーシエル西新井大師', '住所': '東京都足立区西新井６', '間取り': '2LDK', '家賃': '14万円', '階数': '築7年\n7階建', '最寄りまでの時間': '東武大師線/大師前駅 歩8分'}
{'物件名': 'ツヴァイテ小竹向原', '住所': '東京都練馬区小竹町２', '間取り': '2DK', '家賃': '15万円', '階数': '新築\n4階建', '最寄りまでの時間': '東京メトロ副都心線/小竹向原駅 歩2分'}
{'物件名': 'プライムブリス蔵前', '住所': '東京都台東区蔵前３', '間取り': '2LDK', '家賃': '19万円', '階数': '新築\n13階建', '最寄りまでの時間': '都営大江戸線/蔵前駅 歩2分'}
{'物件名': 