In [41]:
#　https://www.tpex.org.tw/www/zh-tw/emerging/historical?type=Monthly&date=2025/01/01&code=7709&response=json　　興櫃個股歷史行情


import requests as req
import pandas as pd
import os
import time
import random

In [42]:
# 投標開始日前
cols = [
    "證券代號",
    "投標開始日",
    "前一日平均成交價",
    "前十日內平均成交價",
    "前十日內漲幅",
    "前一日成交金額",
    "前十日內平均成交金額",
    "前一日最高成交價",
    "前一日最低成交價",
    "前一日成交筆數",
    "前一日成交股數",
    "前十日內平均成交筆數",
    "前十日內平均成交股數",
    #"近五次競拍股票漲幅"                    # 目標標的前五個競拍股票其上市首日((收盤-投標日前一日股價)/投標日前一日股價)*100之平均
]


In [43]:
import time
import random
import requests as req
import pandas as pd

def get_price_table(code, y, m, headers):
    y2 = y if m > 1 else y - 1
    m2 = m - 1 if m > 1 else 12
    url_curr = f"https://www.tpex.org.tw/www/zh-tw/emerging/historical?type=Monthly&date={y}/{m:02d}/01&code={code}&response=json"
    url_prev = f"https://www.tpex.org.tw/www/zh-tw/emerging/historical?type=Monthly&date={y2}/{m2:02d}/01&code={code}&response=json"

    # 設定最多嘗試 5 次
    for attempt in range(1, 6):
        try:
            r1 = req.get(url_curr, headers=headers, timeout=10)
            r2 = req.get(url_prev, headers=headers, timeout=10)

            # 檢查是否兩者都成功連線
            if r1.status_code == 200 and r2.status_code == 200:
                json1 = r1.json()
                json2 = r2.json()

                # 確保 JSON 內真的有 tables 數據 (櫃買中心有時會回傳空資料)
                if "tables" in json1 and "tables" in json2:
                    df1 = pd.DataFrame(json1["tables"][0]["data"], columns=json1["tables"][0]["fields"])
                    df2 = pd.DataFrame(json2["tables"][0]["data"], columns=json2["tables"][0]["fields"])
                    df_combi = pd.concat([df1, df2], ignore_index=True)
                    return df_combi
                else:
                    print(f"第 {attempt} 次嘗試：代碼 {code} 格式正確但無資料內容。")
            else:
                print(f"第 {attempt} 次嘗試：代碼 {code} 連線失敗 (Status: {r1.status_code}, {r2.status_code})")

        except Exception as e:
            print(f"第 {attempt} 次嘗試：發生意外錯誤 -> {e}")

        # 失敗後的等待，隨次數增加等待時間 (Exponential Backoff)
        if attempt < 5:
            wait_time = attempt * 3 + random.uniform(1, 3)
            print(f"等待 {wait_time:.1f} 秒後重新嘗試...")
            time.sleep(wait_time)

    print(f"已達最大嘗試次數，無法取得代碼 {code} 的資料。")
    return None

def fix_date(date_str):
    parts = date_str.split('/')
    year = int(parts[0]) + 1911
    date_s = f"{year}/{parts[1]}/{parts[2]}"
    date = pd.to_datetime(date_s)
    return date

def data_output(df):
    re = {}
    # --- 單日指標 (前一日，即最後一列) ---
    re['前一日平均成交價'] = df['成交均價'].iloc[-1]
    re['前一日成交金額'] = df['成交金額(元)'].iloc[-1]
    re['前一日最高成交價'] = df['成交最高'].iloc[-1]
    re['前一日最低成交價'] = df['成交最低'].iloc[-1]
    re['前一日成交筆數'] = df['筆數'].iloc[-1]
    re['前一日成交股數'] = df['成交股數'].iloc[-1]

    # --- 十日平均指標 (最後 10 列) ---
    re['前十日內平均成交價'] = df['成交均價'].iloc[-10:].mean().round(3)
    re['前十日內平均成交金額'] = df['成交金額(元)'].iloc[-10:].mean().round(0) # 金額通常不計小數
    re['前十日內平均成交筆數'] = df['筆數'].iloc[-10:].mean().round(0)
    re['前十日內平均成交股數'] = df['成交股數'].iloc[-10:].mean().round(0)

    # --- 計算指標 ---
    # 前十日內漲幅：公式通常是 (今日均價 - 十日前均價) / 十日前均價
    # 這裡依照你原先寫法：(平均價 - 前一日價) / 前一日價
    first_price_in_window = df['成交均價'].iloc[-10] if len(df) >= 10 else df['成交均價'].iloc[0]
    re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)

    return re





In [44]:

def main():
    url = "https://www.tpex.org.tw/www/zh-tw/emerging/historical?type=Monthly&date=2016/1/01&code=6026&response=json"
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/144.0.0.0 Safari/537.36'}

    save_folder = "/content/drive/MyDrive/Colab Notebooks/stock_auction_pred_project/csv"
    raw_data_path = f'{save_folder}/bid_info.csv'
    history_price_info_path = f'{save_folder}/history_price_info.csv'
    raw_data = pd.read_csv(raw_data_path, encoding="utf-8", index_col=['證券代號', '投標開始日'])

    if os.path.exists(history_price_info_path):
        price_df = pd.read_csv(history_price_info_path, encoding="utf-8", index_col=['證券代號', '投標開始日'])
        if not os.path.exists(raw_data_path):
            print("can not find rawdata")
            return
    else:
        price_df = pd.DataFrame(columns=cols).set_index(['證券代號', '投標開始日'])

    diff_index = raw_data.index.difference(price_df.index)
    new_df = pd.DataFrame(index=diff_index, columns=price_df.columns)
    price_df.reset_index(inplace=True)
    new_df.reset_index(inplace=True)
    new_df['投標開始日'] = pd.to_datetime(new_df['投標開始日'], format='mixed')

    for code, date in diff_index:
        print(f"Processing 股號 : {code} and 投標時間 : {date}")
        try:
            date = pd.to_datetime(date)
            y = date.year
            m = date.month
            df = get_price_table(code, y, m, headers=headers)
            df = df.iloc[:, 0:7]
            new_cols = df.columns[1:7]
            for col in new_cols:
                df[col] = df[col].astype(str).str.replace(',', '').astype(float)
            df["日期"] = df["日期"].apply(fix_date)
            df = df[df["日期"] < date]
            df.sort_values(by='日期', ascending=True, inplace=True)
            df = df.reset_index(drop=True)

            re = data_output(df)
            print(re)
            new_df.loc[(new_df["證券代號"] == code) & (new_df["投標開始日"] == date), list(re.keys())] = list(re.values())
            new_df[list(re.keys())] = new_df[list(re.keys())].apply(pd.to_numeric, errors='coerce')     # 欄位格式由str轉float
            print("-" * 50)
            time.sleep(random.uniform(3, 5))
        except Exception as e:
            print(f"Error occurred for code {code} and date {date}: {e}")
            print("-" * 50)
            continue
    result = pd.concat([price_df, new_df])
    result.to_csv(history_price_info_path, index=False, encoding="utf-8")
    print("DONE")

if __name__ == "__main__":
    main()


Processing 股號 : 6026 and 投標時間 : 2016-01-07
{'前一日平均成交價': np.float64(10.09), '前一日成交金額': np.float64(926280.0), '前一日最高成交價': np.float64(10.2), '前一日最低成交價': np.float64(9.99), '前一日成交筆數': np.float64(24.0), '前一日成交股數': np.float64(91786.0), '前十日內平均成交價': np.float64(10.314), '前十日內平均成交金額': np.float64(1085682.0), '前十日內平均成交筆數': np.float64(34.0), '前十日內平均成交股數': np.float64(104929.0), '前十日內漲幅': np.float64(-0.019)}
--------------------------------------------------
Processing 股號 : 6510 and 投標時間 : 2016-03-04
{'前一日平均成交價': np.float64(483.31), '前一日成交金額': np.float64(18999076.0), '前一日最高成交價': np.float64(489.99), '前一日最低成交價': np.float64(479.0), '前一日成交筆數': np.float64(44.0), '前一日成交股數': np.float64(39310.0), '前十日內平均成交價': np.float64(490.617), '前十日內平均成交金額': np.float64(56827055.0), '前十日內平均成交筆數': np.float64(114.0), '前十日內平均成交股數': np.float64(115707.0), '前十日內漲幅': np.float64(-0.008)}
--------------------------------------------------
Processing 股號 : 2739 and 投標時間 : 2016-04-28
{'前一日平均成交價': np.float64(58.71), '前一日成交金額': np.float6

  re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)


{'前一日平均成交價': np.float64(33.41), '前一日成交金額': np.float64(367590.0), '前一日最高成交價': np.float64(34.0), '前一日最低成交價': np.float64(33.1), '前一日成交筆數': np.float64(11.0), '前一日成交股數': np.float64(11003.0), '前十日內平均成交價': np.float64(26.746), '前十日內平均成交金額': np.float64(1087205.0), '前十日內平均成交筆數': np.float64(17.0), '前十日內平均成交股數': np.float64(32433.0), '前十日內漲幅': np.float64(inf)}
--------------------------------------------------
Processing 股號 : 6497 and 投標時間 : 2017-05-10
Error occurred for code 6497 and date 2017-05-10 00:00:00: single positional indexer is out-of-bounds
--------------------------------------------------
Processing 股號 : 2897 and 投標時間 : 2017-04-14
{'前一日平均成交價': np.float64(8.95), '前一日成交金額': np.float64(25746443.0), '前一日最高成交價': np.float64(9.38), '前一日最低成交價': np.float64(8.54), '前一日成交筆數': np.float64(572.0), '前一日成交股數': np.float64(2878126.0), '前十日內平均成交價': np.float64(9.164), '前十日內平均成交金額': np.float64(18046761.0), '前十日內平均成交筆數': np.float64(369.0), '前十日內平均成交股數': np.float64(1971150.0), '前十日內漲幅': np.float64(0.049)}
-

  re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)


{'前一日平均成交價': np.float64(47.34), '前一日成交金額': np.float64(1372860.0), '前一日最高成交價': np.float64(49.0), '前一日最低成交價': np.float64(46.0), '前一日成交筆數': np.float64(14.0), '前一日成交股數': np.float64(29000.0), '前十日內平均成交價': np.float64(34.583), '前十日內平均成交金額': np.float64(234203.0), '前十日內平均成交筆數': np.float64(3.0), '前十日內平均成交股數': np.float64(4858.0), '前十日內漲幅': np.float64(inf)}
--------------------------------------------------
Processing 股號 : 4767 and 投標時間 : 2018-10-08
{'前一日平均成交價': np.float64(22.88), '前一日成交金額': np.float64(114400.0), '前一日最高成交價': np.float64(23.0), '前一日最低成交價': np.float64(22.8), '前一日成交筆數': np.float64(2.0), '前一日成交股數': np.float64(5000.0), '前十日內平均成交價': np.float64(23.013), '前十日內平均成交金額': np.float64(486436.0), '前十日內平均成交筆數': np.float64(11.0), '前十日內平均成交股數': np.float64(21215.0), '前十日內漲幅': np.float64(-0.021)}
--------------------------------------------------
Processing 股號 : 6654 and 投標時間 : 2018-10-02
{'前一日平均成交價': np.float64(83.84), '前一日成交金額': np.float64(5677890.0), '前一日最高成交價': np.float64(85.24), '前一日最低成交價': np.fl

  re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)


{'前一日平均成交價': np.float64(79.74), '前一日成交金額': np.float64(238410.0), '前一日最高成交價': np.float64(80.0), '前一日最低成交價': np.float64(79.5), '前一日成交筆數': np.float64(11.0), '前一日成交股數': np.float64(2990.0), '前十日內平均成交價': np.float64(71.781), '前十日內平均成交金額': np.float64(853736.0), '前十日內平均成交筆數': np.float64(9.0), '前十日內平均成交股數': np.float64(10631.0), '前十日內漲幅': np.float64(inf)}
--------------------------------------------------
Processing 股號 : 4572 and 投標時間 : 2019-08-21
{'前一日平均成交價': np.float64(166.85), '前一日成交金額': np.float64(30139996.0), '前一日最高成交價': np.float64(168.01), '前一日最低成交價': np.float64(165.0), '前一日成交筆數': np.float64(126.0), '前一日成交股數': np.float64(180646.0), '前十日內平均成交價': np.float64(164.833), '前十日內平均成交金額': np.float64(30748806.0), '前十日內平均成交筆數': np.float64(145.0), '前十日內平均成交股數': np.float64(185723.0), '前十日內漲幅': np.float64(0.074)}
--------------------------------------------------
Processing 股號 : 4576 and 投標時間 : 2019-08-15
{'前一日平均成交價': np.float64(99.91), '前一日成交金額': np.float64(6234420.0), '前一日最高成交價': np.float64(102.6), '前一日

  re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)


{'前一日平均成交價': np.float64(19.46), '前一日成交金額': np.float64(351325.0), '前一日最高成交價': np.float64(19.57), '前一日最低成交價': np.float64(19.3), '前一日成交筆數': np.float64(7.0), '前一日成交股數': np.float64(18050.0), '前十日內平均成交價': np.float64(17.881), '前十日內平均成交金額': np.float64(525198.0), '前十日內平均成交筆數': np.float64(13.0), '前十日內平均成交股數': np.float64(26434.0), '前十日內漲幅': np.float64(inf)}
--------------------------------------------------
Processing 股號 : 2756 and 投標時間 : 2021-12-24
{'前一日平均成交價': np.float64(133.22), '前一日成交金額': np.float64(4050202.0), '前一日最高成交價': np.float64(134.5), '前一日最低成交價': np.float64(131.5), '前一日成交筆數': np.float64(30.0), '前一日成交股數': np.float64(30403.0), '前十日內平均成交價': np.float64(136.946), '前十日內平均成交金額': np.float64(4221840.0), '前十日內平均成交筆數': np.float64(32.0), '前十日內平均成交股數': np.float64(30477.0), '前十日內漲幅': np.float64(-0.067)}
--------------------------------------------------
Processing 股號 : 6719 and 投標時間 : 2021-12-23
{'前一日平均成交價': np.float64(841.74), '前一日成交金額': np.float64(287286923.0), '前一日最高成交價': np.float64(859.0), '前一日最

  re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)


{'前一日平均成交價': np.float64(130.18), '前一日成交金額': np.float64(4650437.0), '前一日最高成交價': np.float64(131.0), '前一日最低成交價': np.float64(128.5), '前一日成交筆數': np.float64(33.0), '前一日成交股數': np.float64(35723.0), '前十日內平均成交價': np.float64(113.998), '前十日內平均成交金額': np.float64(5633327.0), '前十日內平均成交筆數': np.float64(49.0), '前十日內平均成交股數': np.float64(44115.0), '前十日內漲幅': np.float64(inf)}
--------------------------------------------------
Processing 股號 : 6789 and 投標時間 : 2022-06-10
{'前一日平均成交價': np.float64(407.36), '前一日成交金額': np.float64(130056720.0), '前一日最高成交價': np.float64(415.0), '前一日最低成交價': np.float64(404.5), '前一日成交筆數': np.float64(603.0), '前一日成交股數': np.float64(319268.0), '前十日內平均成交價': np.float64(428.828), '前十日內平均成交金額': np.float64(147046261.0), '前十日內平均成交筆數': np.float64(606.0), '前十日內平均成交股數': np.float64(344923.0), '前十日內漲幅': np.float64(-0.006)}
--------------------------------------------------
Processing 股號 : 4577 and 投標時間 : 2022-05-24


  re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)


{'前一日平均成交價': np.float64(38.63), '前一日成交金額': np.float64(3892257.0), '前一日最高成交價': np.float64(40.75), '前一日最低成交價': np.float64(38.0), '前一日成交筆數': np.float64(72.0), '前一日成交股數': np.float64(100750.0), '前十日內平均成交價': np.float64(36.369), '前十日內平均成交金額': np.float64(2186976.0), '前十日內平均成交筆數': np.float64(35.0), '前十日內平均成交股數': np.float64(53599.0), '前十日內漲幅': np.float64(inf)}
--------------------------------------------------
Processing 股號 : 6550 and 投標時間 : 2022-05-16
{'前一日平均成交價': np.float64(108.43), '前一日成交金額': np.float64(205233751.0), '前一日最高成交價': np.float64(113.5), '前一日最低成交價': np.float64(103.0), '前一日成交筆數': np.float64(1404.0), '前一日成交股數': np.float64(1892836.0), '前十日內平均成交價': np.float64(119.193), '前十日內平均成交金額': np.float64(253141509.0), '前十日內平均成交筆數': np.float64(1699.0), '前十日內平均成交股數': np.float64(2164704.0), '前十日內漲幅': np.float64(-0.152)}
--------------------------------------------------
Processing 股號 : 6796 and 投標時間 : 2022-05-12
{'前一日平均成交價': np.float64(66.15), '前一日成交金額': np.float64(6651671.0), '前一日最高成交價': np.float64(

  re['前十日內漲幅'] = round((re['前一日平均成交價'] - first_price_in_window) / first_price_in_window, 3)


{'前一日平均成交價': np.float64(29.05), '前一日成交金額': np.float64(130754.0), '前一日最高成交價': np.float64(29.05), '前一日最低成交價': np.float64(29.05), '前一日成交筆數': np.float64(5.0), '前一日成交股數': np.float64(4501.0), '前十日內平均成交價': np.float64(20.814), '前十日內平均成交金額': np.float64(411162.0), '前十日內平均成交筆數': np.float64(8.0), '前十日內平均成交股數': np.float64(13679.0), '前十日內漲幅': np.float64(inf)}
--------------------------------------------------
Processing 股號 : 6585 and 投標時間 : 2022-04-29
{'前一日平均成交價': np.float64(84.92), '前一日成交金額': np.float64(4357266.0), '前一日最高成交價': np.float64(86.3), '前一日最低成交價': np.float64(83.3), '前一日成交筆數': np.float64(35.0), '前一日成交股數': np.float64(51313.0), '前十日內平均成交價': np.float64(83.527), '前十日內平均成交金額': np.float64(3643709.0), '前十日內平均成交筆數': np.float64(26.0), '前十日內平均成交股數': np.float64(43578.0), '前十日內漲幅': np.float64(0.022)}
--------------------------------------------------
Processing 股號 : 6799 and 投標時間 : 2022-04-21
{'前一日平均成交價': np.float64(174.52), '前一日成交金額': np.float64(38304678.0), '前一日最高成交價': np.float64(177.0), '前一日最低成交價': 

  result = pd.concat([price_df, new_df])
