In [2]:
import osmnx as ox
import pandas as pd  # 雖然 osmnx 返回的是 GeoDataFrame，但底層依賴 pandas

PLACE_NAME = 'Yixing, Wuxi, Jiangsu, China' 
tags = {
    "amenity": True,   # 便利設施 (POI)
    "shop": True,      # 商店 (POI)
    "building": True   # 建築物 (輪廓)
}

try:
    # 1. 抓取數據
    print(f"正在下載 {PLACE_NAME} 的數據... (數據量可能較大，請耐心等待)")
    gdf = ox.features_from_place(PLACE_NAME, tags)
    
    # 2. 查看結果
    print(f"成功抓取 {len(gdf)} 筆數據！")
    print(gdf.head())
    
    # 3. 處理欄位中的列表數據 (非必須，但強烈建議)
    # OSMnx 下載的某些欄位可能是 list 類型 (例如 tags)，直接存 CSV 有時會報錯或格式混亂
    # 這行程式碼會把所有 list 類型的欄位轉成字串
    for col in gdf.columns:
        if gdf[col].apply(lambda x: isinstance(x, list)).any():
            gdf[col] = gdf[col].astype(str)

    # 4. 存成 CSV 檔案
    # encoding='utf-8-sig' 是為了確保用 Excel 打開時中文不會變亂碼
    gdf.to_csv("yixing_data.csv", encoding='utf-8-sig')
    
    print("檔案已成功保存為 'yixing_data.csv'")

except Exception as e:
    print(f"發生錯誤: {e}")
    print("提示：如果因為數據量太大導致 Memory Error 或 Timeout，請嘗試縮小範圍或分開抓取。")

正在下載 Yixing, Wuxi, Jiangsu, China 的數據... (數據量可能較大，請耐心等待)
成功抓取 11892 筆數據！
                                    name         shop  \
element_type osmid                                      
node         1731924698             华润超市  supermarket   
             1731932091              大统华  supermarket   
             4698565580           古榉阁农家菜          NaN   
             4920073523              NaN          NaN   
             6333788012  Wujing Hospital          NaN   

                                           geometry addr:city  \
element_type osmid                                              
node         1731924698  POINT (119.85005 31.25368)       NaN   
             1731932091  POINT (119.84467 31.26091)       NaN   
             4698565580  POINT (119.75123 31.19599)    宜兴市湖父镇   
             4920073523  POINT (119.79809 31.26057)       NaN   
             6333788012  POINT (119.79507 31.36135)       NaN   

                        addr:housenumber addr:street     amenity capaci

In [4]:
# 挑出 "amenity" 欄位不為空或 NaN 的列
amenity_filtered = gdf[gdf['amenity'].notna()]

print(f"原始數據：{len(gdf)} 筆")
print(f"含有 amenity 的數據：{len(amenity_filtered)} 筆")
print(f"\n前幾筆含有 amenity 的數據：")
print(amenity_filtered.head())

# 將過濾出來的資料保存為新的 CSV 檔案
amenity_filtered.to_csv("yixing_amenity.csv", encoding='utf-8-sig')
print("\n過濾後的資料已保存為 'yixing_amenity.csv'")

原始數據：11892 筆
含有 amenity 的數據：266 筆

前幾筆含有 amenity 的數據：
                                    name shop                    geometry  \
element_type osmid                                                          
node         4698565580           古榉阁农家菜  NaN  POINT (119.75123 31.19599)   
             4920073523              NaN  NaN  POINT (119.79809 31.26057)   
             6333788012  Wujing Hospital  NaN  POINT (119.79507 31.36135)   
             6356896686           兴隆广德火锅  NaN  POINT (119.79779 31.36148)   
             6356896687             盛世桃园  NaN  POINT (119.79796 31.36374)   

                        addr:city addr:housenumber addr:street     amenity  \
element_type osmid                                                           
node         4698565580    宜兴市湖父镇                2       洑西村龙山  restaurant   
             4920073523       NaN              NaN         NaN  restaurant   
             6333788012       NaN              NaN         NaN    hospital   
             635