<a href="https://colab.research.google.com/github/ilovesylus/computer/blob/main/hw02.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# HW02 Web Crawler

## 題目

爬取 kkday東京燒烤資料

## 摘要

本報告旨在透過網路爬蟲技術，收集 KKday 網站上東京燒烤的推薦資料，為旅遊提供參考。


## 引言

隨著旅遊需求的增加，選擇合適的住宿成為旅遊規劃中的重要環節。KKday 作為知名的旅遊平台，提供多樣的美食選擇。

本次爬蟲的目標是獲取 KKday 平台上東京燒烤的推薦，分析其價格、地理位置、評價等資訊，為旅遊者提供決策支持。

## 方法

- 目標網站描述
  - 目標網站：KKday 東京住宿推薦頁面。  
  https://www.kkday.com/zh-tw/category/jp-tokyo/accommodation
  - 頁面結構：包含住宿名稱、圖片、價格、評價等資訊。

- 工具與技術
  - 使用 Python 的 `requests` 庫發送 HTTP 請求。
  - 使用 `BeautifulSoup` 解析 HTML。
  - 使用 Google Chrome 開發者工具取得 AJAX 資料。

## 結果


In [68]:
import requests
from bs4 import BeautifulSoup

url = 'https://www.kkday.com/zh-tw/promo/japan-foodie'
headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36'}
response = requests.get(url, headers = headers)
soup = BeautifulSoup(response.text, 'lxml')
soup.title

<title>日本美食通 - KKday</title>

In [83]:
import requests
url = 'https://www.kkday.com/zh-tw/category/ajax_get_top_products?productCategory=CATEGORY_079&destination=D-JP-3261'
headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36'}
response = requests.get(url, headers = headers)
foodie = response.json()


In [84]:
foodie['data']

[{'prod_mid': 141701,
  'prod_oid': 141701,
  'name': '日本東京|肉屋台所 A5和牛燒肉吃到飽|東京新宿・澀谷・上野等',
  'introduction': '東京都內的肉屋台所有上野店、上野公園店、新宿店、澀谷宮益坂店、道玄坂店、飯田橋店、五反田店等分店。本店一次大量採購精選A4和A5等級的和牛,搭配肉料理職人的肉品區塊分解,來降低中間加工費用,實現了高 CP 值的料理。提供您用合理價格享受和牛臀肉和芯玉等稀少部位的吃到飽服務。',
  'rating_count': 342,
  'rating_star': 4.21,
  'show_order_count': '2K+',
  'earliest_sale_date': '20250615',
  'sale_status': 1,
  'purchase_type': None,
  'purchase_date': None,
  'is_tourism_product': True,
  'readable_url': 'all-you-can-eat-japanese-wagyu-beef-bbq-yakiniku-butchers-kitchen-ueno-park-branch-tokyo-gourmet',
  'product_category': {'main': 'CATEGORY_079', 'sub': []},
  'display_tags': ['4天前可免費取消', '即買即用', '立即確認'],
  'img_url_list': ['https://image.kkday.com/image/get/w_600%2Cc_fit/s1.kkday.com/product_141701/20230330082655_bw4ZN/jpg',
   'https://image.kkday.com/image/get/w_600%2Cc_fit/s1.kkday.com/product_141701/20230330082653_I4Mei/png',
   'https://image.kkday.com/image/get/w_600%2Cc_fit/s1.kkday.com/product_141701/202303

- 數據存儲方式
  - 將數據存儲為 CSV 格式，方便後續分析。

In [85]:
# 展示資料程式碼
from IPython.display import Image, display

for foodie in foodie['data']:
  print(foodie['name'], foodie['rating_star'], foodie['official_price'])
  print(foodie['introduction'])
  img_list = foodie.get('img_url_list', [])
  if img_list:
      # 顯示第一張圖片
      display(Image(url=img_list[0], width=300))
  else:
      print('[無圖片]')
  print('-' * 40)
print()


日本東京|肉屋台所 A5和牛燒肉吃到飽|東京新宿・澀谷・上野等 4.21 922
東京都內的肉屋台所有上野店、上野公園店、新宿店、澀谷宮益坂店、道玄坂店、飯田橋店、五反田店等分店。本店一次大量採購精選A4和A5等級的和牛,搭配肉料理職人的肉品區塊分解,來降低中間加工費用,實現了高 CP 值的料理。提供您用合理價格享受和牛臀肉和芯玉等稀少部位的吃到飽服務。


----------------------------------------
日本・東京|百年老店しゃぶ禅・日式涮鍋・壽喜燒|銀座店 4.64 2321
老字號日本火鍋餐廳—しゃぶ禪,國產和牛、黑毛和牛 2 小時吃到飽,就算分店眾多仍是一位難求!極薄的牛肉片在高湯和壽喜鍋湯汁中輕涮,帶出日本高級牛肉原有的滋味和芳香。KKday和交通方便的銀座店合作,一邊品嚐新鮮軟嫩的和牛之餘還能欣賞東京灣的風景!


----------------------------------------
日本東京|燒肉房家 A5和牛套餐|西日暮里本店・日暮里店・上野六丁目店・日本橋店・東京車站店 4.47 1125
距離車站步行2分鐘,交通便利的好位置。使用的是採購整頭牛的A5等級日本和牛的道地燒肉店。因所採購的是一整頭牛,您可享受難能可貴的用餐體驗。在此可享用每天更換的各種部位的牛肉拼盤及新鮮製作的冷面。無論吃什麼、喝什麼,盡是美味。也請務必參考谷歌等等的網站介紹。房家等候您的光臨。


----------------------------------------
日本人氣河豚餐廳 | 河豚料理名店・玄品河豚 4.62 1086
線上訂購日本人氣河豚餐廳,東京、大阪、京都、北海道各種分店自由選擇,創業 33 年銷售量及店鋪數量日本第一的「 玄品河豚 」每年到訪人數達 81 萬人,「 虎河豚 」被視為最高級的品種。為了以更加美味的狀態提供虎河豚,玄品河豚的獨家技術獲得了國際專利!通過 KKday 預訂免排隊,用餐更方便!


----------------------------------------
東京新宿| 燒肉新宿烤肉牛舌檸檬(新宿烤肉牛舌檸檬本店)|僅座位預訂 4.69 90
厚切牛舌味道鮮美! 「新宿烤肉牛舌的檸檬」的總店。唯一直營店在大阪難波開幕。如果您想在之前去, 11:30 或 17:00 是最佳時間! !您也可以透過電話預訂!
此外,即使Tabelog線上預訂已滿,透過Instagram預訂也可能有空位!
轉到下面的 URL。
我們還提供免費座位,因此您當天可以來,無需預約。

備註:對於已預訂的顧客
若您遲到5分鐘以上且沒有聯絡我們,我們將讓等候的顧客先入。
請等到下一個座位空出來。
週五、六至 22:30
備註:套餐限60分鐘。
注意:無法指定座位類型


----------------------------------------
日本美食|連鎖鐵板燒品牌・Sublime|東京・大阪・名古屋餐廳預約 0 4753
用KKday輕鬆訂購被收錄於東京米其林指南的鐵板燒名店Sublime。


----------------------------------------
日本東京|江戶前屋形船|文字燒吃到飽及飲品暢飲 4.33 1952
江戶前汽船是個「業界最便宜」的以「安全・乾淨・高CP值」為原則,且以「由娛樂擴展屋形船」為願景的文字燒屋形船。可周遊象徵了東京的進化的「台場」及「彩虹大橋」等非日常的水上體驗。可享受以東京美食「月島文字燒」為主的「創作鐵板料理」吃到飽&喝到飽。


----------------------------------------
日本東京|京橋 天婦羅和壽司 ishii(天冨良と鮨いしい) 0 4999
邀請您盡情享受由主廚精選食材製作的美味壽司和天婦羅套餐。


----------------------------------------
日本東京|淺草うな鐵  站前本店・國際通店|鹽味・醬汁鰻魚飯 0 1342
淺草鰻魚飯發源店精選鰻魚,從頭到尾不浪費一絲一毫,盡享美味。精選新鮮活鰻,由店內的職人親自開割、穿串、烤製,全程手工完成。


----------------------------------------
日本美食|人氣壽司餐廳 鮨まつもと Matsumoto|線上預訂 4 4405
「鮨まつもとMatsumoto」提供由經驗豐富的廚師精心製作的精緻小吃與傳統江戶前壽司。請盡情品嚐江戶前壽司。


----------------------------------------



## 問題與挑戰

- 技術挑戰  
    需透過 AJAX 取得資料
- 資料限制  
    部分住宿資訊可能不完整，影響分析結果。

## 結論


- 成功獲取並分析了 KKday 推薦的東京燒烤資訊，為旅遊提供了有價值的參考。
- 未來可擴展至其他旅遊平台，進行跨平台比較分析。

## 參考文獻

* [KKDay](https://www.kkday.com/)