In [None]:
import os
import time
from datetime import date, datetime

import geopandas as gpd
import googlemaps
import numpy as np
import pandas as pd
from bs4 import BeautifulSoup
from shapely.geometry import Point

from mods import gmap

In [None]:
# E_取得gml檔案，並轉換成gdf物件
folder = r"C:\Users\Bevis\Documents\Python_project\sample\TW_loc"
file = "COUNTY_MOI_1140318.gml"
target = os.path.join(folder, file)

gdf = gpd.read_file(target)

# 列出目標縣市（台北市被包含在新北市中），並設定英文代號
today = date.today().strftime("%Y/%m/%d")
target_city = ["新北市", "桃園市", "臺中市", "臺南市", "高雄市"]
city_eng = ["TPE", "TYU", "TCH", "TNA", "KSH"]
target_index = []
city_dict = {
    "新北市":"TPE",
    "桃園市":"TYU",
    "臺中市":"TCH",
    "臺南市":"TNA",
    "高雄市":"KSH"
}

# 將目標縣市的索引加入列表中
for city in target_city:
    target_index.append(gdf[gdf["名稱"] == city].index)

In [None]:
def gmap_nearby_search(key, lat, lon, radius, keyword):
    """提供api_key，經緯度和關鍵字，回傳搜尋結果的列表，資訊包括名稱、place_id和地址"""
    # 使用gmap連線並搜尋，取得搜尋結果
    gmaps = googlemaps.Client(key=key)
    search_result = gmaps.places_nearby(location=(lat, lon), radius=radius, keyword=keyword)
    result = search_result.get("results", [])
    page = 1
    
    # 取出第一頁搜尋結果的名稱、place_id和地址，存成字典後加入list
    result_data = []
    for place in result:
        place_dict = {
            "name":place.get("name", None),
            "place_id":place.get("place_id", None),
            "buss_status":place.get("business_status", None)
        }
        result_data.append(place_dict)


    # 進入迴圈判斷是否有下一頁，如果沒有直接停止，若有則迴圈
    time.sleep(2.5)
    next_page = search_result.get("next_page_token", None)
    
    while next_page:
        page += 1
        max_tries = 3
        for tries in range(1, max_tries+1):
            try:
                print(f"正在取得第{page}頁資訊...")
                time.sleep(2.5)
                next_page_search = gmaps.places_nearby(page_token=next_page)
                next_page_result = next_page_search.get("results", [])
                for place in next_page_result:
                    place_dict = {
                        "name":place.get("name", None),
                        "place_id":place.get("place_id", None),
                        "buss_status":place.get("business_status", None)
                    }
                    result_data.append(place_dict)
                time.sleep(2.5)
                next_page = next_page_search.get("next_page_token", None)
                break

            except Exception as e:
                if tries >= max_tries:
                    print("已達最大嘗試次數")
                    next_page = None
                    break
                else:
                    print(f"第{tries}次嘗試失敗：{e}\n等待3秒後重試...")
                    time.sleep(3)
    
    return result_data

In [None]:
## E_透過gmap API遍尋六督資料

# 建立一個元資料列表
metadate = []

# 根據存取的索引列表去取出每一個縣市的多邊形資料
for idx in target_index:
    name = city_dict[gdf.loc[idx]["名稱"].values[0]]
    city_geo_data = gdf.loc[idx].geometry.values[0]

    # 取得四極點
    min_x, min_y, max_x, max_y = city_geo_data.bounds

    # 設定搜尋半徑及步長
    radius_m = 4000
    step_m = 3000

    # 將距離換算成經緯度
    lat_step = step_m / 111000
    lon_step = step_m / (111000 * np.cos(np.radians((min_y + max_y) / 2)))

    # 產生在範圍內的所有座標點
    lat_point = np.arange(min_y, max_y, lat_step)
    lon_point = np.arange(min_x, max_x, lon_step)

    print(f"lat個數：{len(lat_point)}")
    print(f"lon個數：{len(lon_point)}")
    
    # 將所有取得的經緯度組合成所有座標點，並形成一個list
    points = []

    for lat_p in lat_point:
        for lon_p in lon_point:
            loc = (lon_p, lat_p)
            points.append(loc)

    print(f"座標點個數：{len(points)}")
    
    # 開始進行gmap資料爬取
    data = []
    key = "AIzaSyAKD_bSB7Z26zBK1JN2yVdTXOxDNEfznQo"
    keyword = "寵物旅館"
    count = 1

    for loc in points:
        loc_p = Point(loc[0], loc[1])
        
        if city_geo_data.contains(loc_p):
            lat = loc[1]
            lon = loc[0]
            result_list = gmap.gmap_nearby_search(key=key, lat=lat, lon=lon, radius=radius_m, keyword=keyword)
            for i in result_list:
                data.append(i)
            
            print(f"完成{name}第{count}個座標點（{round(float(loc[1]), 7)}, {round(float(loc[0]), 7)}）的搜尋，共有{len(result_list)}筆店家資料")
            count += 1
            time.sleep(1)

    city_metadata = {
        "city":name,
        "coord_count":count,
        "data_count":len(data),
        "type":"lodging",
        "update_date":today
    }
    metadate.append(city_metadata)
    print(f"完成{name}的{keyword}資料搜尋，總共搜尋{count}個座標點")
    
    # 將結果轉換成df並建立更新時間欄位
    df = pd.DataFrame(data=data)
    df["update_time"] = datetime.now().strftime("%Y/%m/%d %H:%M:%S")
    
    # 將檔案儲存為csv
    save = r"C:\Users\Bevis\Documents\Python_project\sample\output\gmap_search"
    file_name = f"gmap_lodging_{name}.csv"
    save_path = os.path.join(save, file_name)
    df.to_csv(save_path, index=False)
    
    print(f"已完成{name}資料儲存")
    time.sleep(3)

lat個數：24
lon個數：25
座標點個數：600
完成TPE第1個座標點（24.7002191, 121.4914128）的搜尋，共有0筆店家資料
完成TPE第2個座標點（24.7002191, 121.5212306）的搜尋，共有0筆店家資料
完成TPE第3個座標點（24.7272462, 121.4615949）的搜尋，共有0筆店家資料
完成TPE第4個座標點（24.7272462, 121.4914128）的搜尋，共有0筆店家資料
完成TPE第5個座標點（24.7272462, 121.5212306）的搜尋，共有0筆店家資料
完成TPE第6個座標點（24.7272462, 121.5510484）的搜尋，共有0筆店家資料
完成TPE第7個座標點（24.7272462, 121.5808662）的搜尋，共有0筆店家資料
完成TPE第8個座標點（24.7542732, 121.4317771）的搜尋，共有0筆店家資料
完成TPE第9個座標點（24.7542732, 121.4615949）的搜尋，共有0筆店家資料
完成TPE第10個座標點（24.7542732, 121.4914128）的搜尋，共有0筆店家資料
完成TPE第11個座標點（24.7542732, 121.5212306）的搜尋，共有0筆店家資料
完成TPE第12個座標點（24.7542732, 121.5510484）的搜尋，共有0筆店家資料
完成TPE第13個座標點（24.7542732, 121.5808662）的搜尋，共有0筆店家資料
完成TPE第14個座標點（24.7813002, 121.4615949）的搜尋，共有0筆店家資料
完成TPE第15個座標點（24.7813002, 121.4914128）的搜尋，共有0筆店家資料
完成TPE第16個座標點（24.7813002, 121.5212306）的搜尋，共有0筆店家資料
完成TPE第17個座標點（24.7813002, 121.5510484）的搜尋，共有0筆店家資料
完成TPE第18個座標點（24.7813002, 121.5808662）的搜尋，共有0筆店家資料
完成TPE第19個座標點（24.8083272, 121.4615949）的搜尋，共有0筆店家資料
完成TPE第20個座標點（24.8083272, 121.49

In [None]:
# E_儲存元數據報告
df_meta = pd.DataFrame(metadate)

today = date.today().strftime("%Y%m%d")

meta_save = r"C:\Users\Bevis\Documents\Python_project\sample\output\gmap_search"
meta_name = f"{today}_lodging_metadata.csv"
save_path = os.path.join(meta_save, meta_name)

df_meta.to_csv(save_path, index=False)