## １ページ規模

In [None]:
import requests
from bs4 import BeautifulSoup

# 1. スクレイピング対象のURL
url = 'https://tabelog.com/tokyo/A1302/A130201/13213760/dtlrvwlst/COND-0/smp1/?smp=1&photo_count_per_review=1'

# 2. requestsを使ってURLのHTMLコンテンツを取得
try:
    response = requests.get(url)
    # HTTPエラーがあれば例外を発生させる
    response.raise_for_status()

    # 3. BeautifulSoupでHTMLを解析
    soup = BeautifulSoup(response.content, 'html.parser')

    # 4. 口コミが書かれているdivタグをすべて見つける
    # ご提示の画像から，口コミは 'rvw-item__rvw-comment' というクラス名を持つdivに含まれていることが分かります．
    review_elements = soup.find_all('div', class_='rvw-item__rvw-comment')

    # 5. 見つけた各要素からテキストを抽出して表示
    print(f"--- 取得した口コミ一覧 ({len(review_elements)}件) ---")
    for i, review in enumerate(review_elements):
        # .get_text(strip=True) で，タグを取り除いたテキストのみを取得し，余分な空白を削除します．
        review_text = review.get_text(strip=True)
        print(f"【口コミ {i+1}】")
        print(review_text)
        print("-" * 20)

except requests.exceptions.RequestException as e:
    print(f"エラーが発生しました: {e}")

--- 取得した口コミ一覧 (21件) ---
【口コミ 1】
正月の2日に、丸ビル、新丸ビルあたりならけっこうレストランもやってるだろう、との見込みでレストランフロアをうろつきながらこちらを選び入店しました。12時を過ぎたところで7割程度のお店は入店待ち...
--------------------
【口コミ 2】
平日のランチタイムに訪問。メニューはいろいろあったが、今回は和牛の切落としとタン塩ランチ(1,580円)を注文。程なくして提供されたが、これはうまい！タレが用意されますが、塩だけで食べるこ...
--------------------
【口コミ 3】
丸の内に用事あり、ランチをする事に。お肉が食べたかったので、こちらへ伺いました。黒毛和牛の五点盛りをチョイス。お昼から、しっかりとした美味しいお肉を頂き幸せです。部位ごとにお肉の旨み、...
--------------------
【口コミ 4】
東京駅を見下ろすビューが素敵な席で美味しい食事を堪能できました。お肉はどれもジューシーで柔らかくとても美味しかったです。店員さんもとても親切で気が利いて、愛想も良くてフレンドリーでした。メニューが文字...
--------------------
【口コミ 5】
平日のお昼に当日電話して伺いました。窓側は眺めが良く人気で賑わっていました。今回で2回目ですが、黒毛和牛のすき焼き御膳にしました。サラダや漬物、スープが付いています。お一人の利用やカップルなど様々...
--------------------
【口コミ 6】
東京駅直結、新丸ビル6階にある高級焼肉屋さんにランチでうかがいました。お値打ちのランチセットは焼き肉系は売り切れで、すき焼き丼かカレーがあり、すき焼き丼1380円にしました。甘めのタレで美味しくいただ...
--------------------
【口コミ 7】
丸の内の新丸ビル４階にある焼肉店でディナー飲み放題付きのイノセントコース　18000円をオーダー焼肉はすべてお店のかたが焼いてくれます。洗練されたサービススタッフは丸の内ならではなのか...
--------------------
【口コミ 8】
東京駅が見下ろせる景色の良いお店。料理も一つづつ丁寧に焼いてくれて提供してくれる。肉の質も良く、味も美味しい。ただ選んだコースが悪

## １店舗規模

In [6]:
import requests
from bs4 import BeautifulSoup
import time

# --- 設定 ---
# 1ページ目のURLをベースにする
base_url = 'https://tabelog.com/tokyo/A1302/A130201/13213760/dtlrvwlst/COND-0/smp1/?smp=1&lc=0&rvw_part=all'

# --- スクレイピング実行 ---
all_reviews = [] # 全ての口コミテキストを格納していくリスト
page_num = 1     # 1ページ目からスタート

while True:

    if page_num == 1:
        # 1ページ目はベースURLをそのまま
        target_url = base_url
    else:
        # 2ページ目以降は末尾に「&PG=ページ番号」を追加する
        target_url = f"{base_url}&PG={page_num}"
    # ★★★ 修正はここまで ★★★

    print(f"{page_num}ページ目の口コミを収集中")

    try:
        response = requests.get(target_url)
        response.raise_for_status()
        soup = BeautifulSoup(response.content, 'html.parser')

        review_elements = soup.find_all('div', class_='rvw-item__rvw-comment')

        if not review_elements:
            print("口コミが見つかりませんでした．収集を終了します．")
            break

        for review in review_elements:
            all_reviews.append(review.get_text(strip=True))

        page_num += 1
        time.sleep(1)

    except requests.exceptions.RequestException as e:
        print(f"エラーが発生したため，処理を中断します: {e}")
        break

# --- 最終結果の表示 ---
print("\n" + "="*40)
print("全ての口コミ収集が完了しました．")
print(f"合計口コミ件数: {len(all_reviews)} 件")
print("="*40 + "\n")

# 取得した口コミの最初の5件だけ確認のため表示
print("--- 取得した口コミの先頭5件 ---")
for i, review_text in enumerate(all_reviews[:5]):
    print(f"【口コミ {i+1}】")
    print(review_text)
    print("-" * 20)

1ページ目の口コミを収集中
2ページ目の口コミを収集中
3ページ目の口コミを収集中
4ページ目の口コミを収集中
5ページ目の口コミを収集中
6ページ目の口コミを収集中
7ページ目の口コミを収集中
8ページ目の口コミを収集中
9ページ目の口コミを収集中
10ページ目の口コミを収集中
11ページ目の口コミを収集中
12ページ目の口コミを収集中
13ページ目の口コミを収集中
14ページ目の口コミを収集中
15ページ目の口コミを収集中
16ページ目の口コミを収集中
17ページ目の口コミを収集中
18ページ目の口コミを収集中
19ページ目の口コミを収集中
エラーが発生したため，処理を中断します: 404 Client Error: Not Found for url: https://tabelog.com/tokyo/A1302/A130201/13213760/dtlrvwlst/COND-0/smp1/?smp=1&lc=0&rvw_part=all&PG=19

全ての口コミ収集が完了しました．
合計口コミ件数: 292 件

--- 取得した口コミの先頭5件 ---
【口コミ 1】
東京駅を見渡せる焼肉レストラン。西麻布の人気店が展開するだけあって、和牛の質は折り紙付き。店内に入ると、まず目を引くのがガラス張りの熟成肉セラー。眺めるだけで気分が上がる。ランチ訪問。席につく...
--------------------
【口コミ 2】
前の会社の同僚が出向解除で元の親会社に戻るとのことで、送別会を兼ねて焼肉ランチを企画。どうせなら良いところにしてみようと色々探して初来店。周りはカップルとか女子しかいないところにおっさん達だけで行きま...
--------------------
【口コミ 3】
焼肉のプラチナ的なお店？？Webで予約して伺ってみました。2万円超えの高額メニューをチョイス全てお店の方が焼いてくれるので一般的な焼肉屋より贅沢で良い雰囲気で夕食を楽しめま...
--------------------
【口コミ 4】
コース料理を選択しました。お値段以上で、目の前でお肉を説明そして焼いてくれるのは助かりました。コースの提供時間もちょうど良く、定員さんも明るい方が多いと思いました。誕生日のお祝いに適した場...
--------------------
【

## お台場ごと

In [5]:
import requests
from bs4 import BeautifulSoup
import time
import csv

# --- ステップ1：お台場の全店舗URLを取得する関数（★この部分を修正しました） ---
def get_odaiba_shop_urls():
    """お台場エリアの店舗一覧を巡回し，全店舗のURLと店名を取得する"""
    
    odaiba_shops = []
    page = 1
    base_url = 'https://tabelog.com/tokyo/A1313/A131306/'
    
    while True:
        # ★★★ ご指摘に合わせてURLの組み立て方を修正 ★★★
        if page == 1:
            list_url = base_url
        else:
            # 2ページ目以降は 'rstLst/' を間に入れる
            list_url = f"{base_url}rstLst/{page}/"
        # ★★★ 修正はここまで ★★★
            
        print(f"店舗一覧の{page}ページ目を収集中... URL: {list_url}")
        
        response = requests.get(list_url)
        if response.status_code != 200:
            print("店舗一覧ページが見つかりませんでした．店舗URLの収集を完了します．")
            break
        
        soup = BeautifulSoup(response.content, 'html.parser')
        
        shop_tags = soup.select('a.list-rst__rst-name-target')
        
        if not shop_tags:
            print("このページに店舗情報がありませんでした．店舗URLの収集を完了します．")
            break

        for tag in shop_tags:
            shop_name = tag.text
            shop_url = tag['href']
            odaiba_shops.append({'name': shop_name, 'url': shop_url})

        page += 1
        time.sleep(1)
        
    return odaiba_shops


In [None]:
# --- ステップ2：1店舗の全口コミを取得する関数（変更なし） ---

def get_all_reviews_from_shop(shop_url):
    """1つの店舗URLから，全ての口コミ本文を取得する"""
    
    shop_reviews = []
    page_num = 1
    review_base_url = f"{shop_url}dtlrvwlst/COND-0/smp1/?smp=1&lc=0&rvw_part=all"

    while True:
        if page_num == 1:
            target_url = review_base_url
        else:
            target_url = f"{review_base_url}&PG={page_num}"
        
        print(f"  -> 口コミの{page_num}ページ目を収集中...")
        
        try:
            response = requests.get(target_url)
            response.raise_for_status()
            soup = BeautifulSoup(response.content, 'html.parser')
            review_elements = soup.find_all('div', class_='rvw-item__rvw-comment')
            if not review_elements:
                break
            for review in review_elements:
                shop_reviews.append(review.get_text(strip=True))
            page_num += 1
            time.sleep(1)
        except requests.exceptions.RequestException as e:
            print(f"    口コミ取得中にエラー: {e}")
            break
            
    return shop_reviews




In [None]:
# --- メインの実行処理（変更なし） ---

if __name__ == '__main__':
    print("--- ステップ1：お台場の店舗リスト収集開始 ---")
    shops_in_odaiba = get_odaiba_shop_urls()
    print(f"\n収集完了．お台場エリアで {len(shops_in_odaiba)}軒の店舗が見つかりました．\n")
    
    print("--- ステップ2：各店舗の口コミ収集開始 ---")
    output_filename = 'odaiba_reviews.csv'
    
    with open(output_filename, 'w', encoding='utf-8-sig', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(['shop_name', 'shop_url', 'review_text'])
        
        for shop in shops_in_odaiba:
            shop_name = shop['name']
            shop_url = shop['url']
            print(f"\n【{shop_name}】の口コミを取得します...")
            
            reviews = get_all_reviews_from_shop(shop_url)
            
            print(f"  -> {len(reviews)}件の口コミを取得しました．CSVに書き込みます．")
            
            for review_text in reviews:
                writer.writerow([shop_name, shop_url, review_text])
            
            time.sleep(3)

    print(f"\n全ての処理が完了しました．「{output_filename}」を確認してください．

## お台場の店舗ごとの口コミ取得

In [None]:
import requests
from bs4 import BeautifulSoup
import time
import csv

# --- 関数1：エリア内の全店舗URLを取得する ---
def get_all_shop_urls_from_area(area_top_url):
    """
    指定されたエリアの店舗一覧を全ページ巡回し，
    全店舗のURLと店名をリストで返す関数
    """
    shop_list = []
    page = 1
    
    while True:
        if page == 1:
            target_url = area_top_url
        else:
            target_url = f"{area_top_url.rstrip('/')}/rstLst/{page}/"
            
        print(f"店舗一覧の{page}ページ目を収集中...")
        
        try:
            response = requests.get(target_url)
            if response.status_code != 200:
                print("-> 店舗一覧の次のページが見つかりませんでした．")
                break
            
            soup = BeautifulSoup(response.content, 'html.parser')
            shop_tags = soup.select('a.list-rst__rst-name-target')
            
            if not shop_tags:
                print("-> このページに店舗情報がありませんでした．")
                break

            for tag in shop_tags:
                shop_list.append({
                    'name': tag.get_text(strip=True),
                    'url': tag['href']
                })

            page += 1
            time.sleep(1)
        except requests.exceptions.RequestException as e:
            print(f"エラーが発生しました: {e}")
            break
            
    return shop_list

# --- 関数2：1店舗の全口コミを取得する ---
def get_all_reviews_from_shop(shop_url):
    """1つの店舗URLから，全ての口コミ本文を取得する"""
    
    shop_reviews = []
    page_num = 1
    review_base_url = f"{shop_url}dtlrvwlst/COND-0/smp1/?smp=1&lc=0&rvw_part=all"

    while True:
        if page_num == 1:
            target_url = review_base_url
        else:
            target_url = f"{review_base_url}&PG={page_num}"
        
        print(f"  -> 口コミの{page_num}ページ目を収集中...")
        
        try:
            response = requests.get(target_url)
            response.raise_for_status()
            soup = BeautifulSoup(response.content, 'html.parser')
            review_elements = soup.find_all('div', class_='rvw-item__rvw-comment')

            if not review_elements:
                break

            for review in review_elements:
                shop_reviews.append(review.get_text(strip=True))

            page_num += 1
            time.sleep(1)
        except requests.exceptions.RequestException as e:
            print(f"    口コミ取得中にエラー: {e}")
            break
            
    return shop_reviews

# --- メインの実行処理 ---
if __name__ == '__main__':
    
    # 1. お台場エリアのトップページのURLを指定
    odaiba_area_url = 'https://tabelog.com/tokyo/A1313/A131306/'
    
    # 2. 関数1を呼び出し，お台場の全店舗リストを取得
    print("--- ステップ1：お台場の店舗リスト収集開始 ---")
    all_shops_in_odaiba = get_all_shop_urls_from_area(odaiba_area_url)
    print(f"\n収集完了．お台場エリアで {len(all_shops_in_odaiba)}軒の店舗が見つかりました．\n")
    
    # 3. CSVファイルを用意し，各店舗の口コミを収集・保存
    print("--- ステップ2：各店舗の口コミ収集開始 ---")
    output_filename = 'odaiba_reviews.csv'
    
    with open(output_filename, 'w', encoding='utf-8-sig', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(['shop_name', 'shop_url', 'review_text'])
        
        # 4. 取得した店舗リストでループを開始
        for shop in all_shops_in_odaiba:
            shop_name = shop['name']
            shop_url = shop['url']
            print(f"\n【{shop_name}】の口コミを取得します...")
            
            # 5. 関数2を呼び出し，その店の全口コミを取得
            reviews = get_all_reviews_from_shop(shop_url)
            
            print(f"  -> {len(reviews)}件の口コミを取得しました．CSVに書き込みます．")
            
            # 6. 取得した口コミを1行ずつCSVに書き込み
            for review_text in reviews:
                writer.writerow([shop_name, shop_url, review_text])
            
            # 7. 次の店舗に移る前に長めに待機（重要！）
            print("  -> 3秒待機します...")
            time.sleep(3)

    print(f"\n全ての処理が完了しました．「{output_filename}」を確認してください．")

--- ステップ1：お台場の店舗リスト収集開始 ---
店舗一覧の1ページ目を収集中...
店舗一覧の2ページ目を収集中...
店舗一覧の3ページ目を収集中...
店舗一覧の4ページ目を収集中...
店舗一覧の5ページ目を収集中...
店舗一覧の6ページ目を収集中...
店舗一覧の7ページ目を収集中...
店舗一覧の8ページ目を収集中...
店舗一覧の9ページ目を収集中...
店舗一覧の10ページ目を収集中...
店舗一覧の11ページ目を収集中...
店舗一覧の12ページ目を収集中...
店舗一覧の13ページ目を収集中...
店舗一覧の14ページ目を収集中...
店舗一覧の15ページ目を収集中...
店舗一覧の16ページ目を収集中...
店舗一覧の17ページ目を収集中...
店舗一覧の18ページ目を収集中...
店舗一覧の19ページ目を収集中...
店舗一覧の20ページ目を収集中...
店舗一覧の21ページ目を収集中...
店舗一覧の22ページ目を収集中...
店舗一覧の23ページ目を収集中...
店舗一覧の24ページ目を収集中...
店舗一覧の25ページ目を収集中...
店舗一覧の26ページ目を収集中...
店舗一覧の27ページ目を収集中...
店舗一覧の28ページ目を収集中...
店舗一覧の29ページ目を収集中...
店舗一覧の30ページ目を収集中...
店舗一覧の31ページ目を収集中...
店舗一覧の32ページ目を収集中...
店舗一覧の33ページ目を収集中...
店舗一覧の34ページ目を収集中...
店舗一覧の35ページ目を収集中...
店舗一覧の36ページ目を収集中...
店舗一覧の37ページ目を収集中...
店舗一覧の38ページ目を収集中...
店舗一覧の39ページ目を収集中...
店舗一覧の40ページ目を収集中...
店舗一覧の41ページ目を収集中...
店舗一覧の42ページ目を収集中...
店舗一覧の43ページ目を収集中...
店舗一覧の44ページ目を収集中...
店舗一覧の45ページ目を収集中...
店舗一覧の46ページ目を収集中...
店舗一覧の47ページ目を収集中...
店舗一覧の48ページ目を収集中...
店舗一覧の49ページ目を収集中...
店舗一覧の50ページ目を収集中...
店舗一覧の51ページ目を収集中...
店舗一覧の52ページ目を