In [3]:
import pandas as pd
import os

print("開始進行資料合併 (Data Merge)")

# --- 設定路徑 ---
raw_path = '../data/raw'
processed_path = '../data/processed'
os.makedirs(processed_path, exist_ok=True)

# 1. 讀取資料 (加入 sep='\t' 解決分隔符號問題)
print(" 讀取原始 CSV")
try:
    df_status = pd.read_csv(f'{raw_path}/station_status.csv', sep='\t')
    except:
        # 如果讀取失敗，就用預設的
        df_info = pd.read_csv(f'{raw_path}/station_info.csv')

    # 讀取天氣資料 (這個是我們剛剛檢查過的，確定是逗號分隔，不用改)
    df_weather = pd.read_csv(f'{raw_path}/taipei_weather_hourly.csv') 
    
    print(" 原始資料讀取成功")
    print(f"  - Status 欄位: {list(df_status.columns)}") # 印出來確認有沒有切開
    
except FileNotFoundError as e:
    print(f" 錯誤：找不到檔案，詳細資訊：{e}")
    raise

# 2. 標準化欄位名稱 (避免 sno, StationUID 混亂)
def standardize_columns(df):
    rename_map = {
        'sno': 'station_no', 
        'StationUID': 'station_no', 
        'station_id': 'station_no',
        'SNO': 'station_no'
    }
    return df.rename(columns=rename_map)

df_status = standardize_columns(df_status)
df_info = standardize_columns(df_info)

# 3. 合併 YouBike (Status + Info)
print(" 合併 YouBike (Status + Info)...")
# 確保是字串格式以免無法對齊
df_status['station_no'] = df_status['station_no'].astype(str)
df_info['station_no'] = df_info['station_no'].astype(str)

df_youbike = pd.merge(df_status, df_info, on='station_no', how='left')

# 4. 處理時間格式
print(" 處理時間格式...")
df_youbike['record_time'] = pd.to_datetime(df_youbike['record_time'])
df_youbike['hour_key'] = df_youbike['record_time'].dt.floor('h') 

# 處理天氣資料
df_weather['record_time'] = pd.to_datetime(df_weather['record_time'])
df_weather = df_weather.rename(columns={'record_time': 'hour_key'})

# 5. 合併天氣資料
print(" 合併天氣資料...")
df_final = pd.merge(df_youbike, df_weather, on='hour_key', how='left')

# 6. 存檔
output_file = f'{processed_path}/youbike_weather_merged.csv'
df_final.to_csv(output_file, index=False)

print(f"\n 最終資料已產生，位置在：{output_file}")
print(f"   資料筆數：{len(df_final)}")

開始進行資料合併 (Data Merge)
 讀取原始 CSV
 原始資料讀取成功
  - Status 欄位: ['id', 'station_no', 'bikes_available', 'spaces_available', 'record_time', 'created_at']
 合併 YouBike (Status + Info)...
 處理時間格式...
 合併天氣資料...

✅ 最終資料已產生，位置在：../data/processed/youbike_weather_merged.csv
   資料筆數：4377102
