## LAB-18-03 產生交易測試資料(Gemini)
由 Gemini 生成  

[提示詞](https://g.co/gemini/share/98c8f58be3a6)：  
```
請提供 Python 範例程式產生測試資料，並儲存為 CSV 檔，測試資料欄位有["交易時間","交易主機","交易代碼","交易延遲","回傳碼"]，各欄位說明如下：
1. "交易時間"：格式為 "YYYY-MM-DD hh:mm:ss.SSS" 
2. "交易主機"：值清單為 ["AP1","AP2"]
3. "交易代碼"：值清單為 ["A001","B002","C003","D004"]
4. "交易延遲"：數值格式為 int ，值介於 100 - 9999999
5. "回傳碼"：值清單為 ["0000","X999"]。
請產出 500000 測試資料，其中 
* "交易主機"為亂數分佈
* "交易代碼"之"A001"佔比45%，其他為亂數分佈
* "交易時間"為 "2025-03-12 06:00:00.000" 至 "2025-03-12 18:00:00.000" 
* "交易延遲" 的平均值約為 500 ，中間值約為1000     
* "回傳碼" 為 "0000" 佔比約為 99%
```


In [None]:
import csv
import random
import datetime

In [None]:
# 測試資料生成筆數
num_rows = 500_000

In [None]:
# 測試資料欄位條件
data = []
transaction_hosts = ["AP1", "AP2"]
transaction_codes = ["A001", "B002", "C003", "D004"]
return_codes = ["0000", "X999"]

start_time = datetime.datetime(2025, 3, 12, 6, 0, 0, 0)
end_time = datetime.datetime(2025, 3, 12, 18, 0, 0, 0)
time_delta = (end_time - start_time).total_seconds()

In [None]:
# 產生測試資料

for _ in range(num_rows):
    # 交易時間
    random_seconds = random.uniform(0, time_delta)
    transaction_time = start_time + datetime.timedelta(seconds=random_seconds)
    transaction_time_str = transaction_time.strftime("%Y-%m-%d %H:%M:%S.%f")[:-3]  # Remove last 3 digits to get milliseconds

    # 交易主機
    transaction_host = random.choice(transaction_hosts)

    # 交易代碼（A001 佔比 45%）
    if random.random() < 0.45:
        transaction_code = "A001"
    else:
        transaction_code = random.choice(transaction_codes[1:])

    # 交易延遲（平均值約 500，中間值約 1000）
    transaction_delay = int(random.expovariate(1/500) + random.expovariate(1/1000)) #用 expovariate() 產生指數分佈的隨機數後，再加總得到一個符合需求的延遲
    transaction_delay = min(transaction_delay, 9999999) # 限制上限

    # 回傳碼（0000 佔比約 99%）
    if random.random() < 0.99:
        return_code = "0000"
    else:
        return_code = "X999"

    data.append([transaction_time_str, transaction_host, transaction_code, transaction_delay, return_code])

In [None]:
# 寫入 CSV 檔案
fname = "test_data3.csv"

with open(fname, 'w', newline='', encoding='utf-8') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(["交易時間", "交易主機", "交易代碼", "交易延遲", "回傳碼"])  # 寫入標題
    writer.writerows(data)

print(f"測試資料已產生並儲存至 {fname}")

In [None]:
#檢視資料內容

# Windows 
#!dir {fname}
#!more -n 20 {fname} 

# Mac OSX
!ls -ltr {fname} 
!head {fname}

In [None]:
# TODO
# 修改提示詞，將 "交易時間" 排序後再儲存