In [None]:
# Install and import optuna
%pip install optuna

import optuna



這個專案的目標是建構一個頂尖性能的盜刷偵測模型。這是一個監督式學習任務，因為我們會同時使用正常樣本 (標籤為 0) 和盜刷樣本 (標籤為 1) 來訓練模型。

核心策略與挑戰：

堆疊學習 (Stacking)：我們不依賴單一模型，而是訓練多個不同的「基學習器」（如 XGBoost, LightGBM），然後再訓練一個「元學習器」來智慧地整合所有基學習器的預測結果，做出最終判斷。
特徵工程：我們不僅使用原始特徵，還會創造「交互特徵」，幫助模型捕捉更複雜的盜刷模式。
機率校準 (Probability Calibration)：確保模型預測出的「盜刷機率」是可靠且接近真實的，這對於後續尋找最佳決策門檻至關重要。
嚴苛的目標：我們的目標非常明確且困難——針對「盜刷」類別，達成 精確率 (Precision) > 0.9286 且 召回率 (Recall) > 0.8603 的雙重標準。



單元格 1：導入函式庫與全域設定
中文註解
此單元格負責載入專案所需的所有函式庫並進行基礎設定。

核心函式庫: numpy, pandas 用於資料處理。
Scikit-learn 工具:
StratifiedKFold: 用於交叉驗證，確保每一摺中盜刷案例的比例一致。
StandardScaler: 用於特徵標準化。
LogisticRegression: 作為基學習器之一，以及最終的元學習器。
CalibratedClassifierCV: 這是關鍵元件，用於校準模型的預測機率。
梯度提升模型: xgboost 和 lightgbm，是目前在表格資料上表現最強大的兩種模型，將作為我們的核心基學習器。
全域設定: RANDOM_SEED 確保可重複性，N_SPLITS 定義交叉驗證的摺數。

In [None]:
# Import numpy
import numpy as np

# Import necessary metrics from sklearn
from sklearn.metrics import f1_score, classification_report, accuracy_score, precision_score, recall_score

In [None]:
import numpy as np
import pandas as pd
import warnings
import kagglehub

# --- Scikit-learn & 相關模型 ---
from sklearn.model_selection import StratifiedKFold, train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import precision_score, recall_score, f1_score, classification_report
from sklearn.calibration import CalibratedClassifierCV # 引入校準器

# --- 梯度提升模型 ---
import xgboost as xgb
import lightgbm as lgb

# --- 全域設定 ---
RANDOM_SEED = 42
TEST_SIZE = 0.3
N_SPLITS = 5 # 交叉驗證的摺數
warnings.filterwarnings("ignore")

In [None]:
# Define the number of Optuna trials
N_OPTUNA_TRIALS = 100  # You can adjust this number based on your needs

單元格 2：資料載入與特徵工程
中文註解
在這個步驟，我們載入資料並透過特徵工程 (Feature Engineering) 來強化原始資料，目的是讓模型更容易學習到隱藏的規律。

對數轉換: Amount (交易金額) 的數值分佈非常廣。透過 np.log1p 進行對數轉換可以有效地壓縮其範圍，使其分佈更為平滑，這對多數模型的學習都有益。
創造交互特徵: 這是提升模型效能的關鍵技巧。根據經驗，某些PCA降維後的特徵 (如 V17, V14, V12, V10) 之間存在很強的交互作用。將它們兩兩相乘，可以幫助模型更直接地捕捉到這種非線性的組合關係（例如，只有當 V17 和 V14 同時很低時，盜刷風險才急遽升高）。

In [None]:
print("1. 載入資料並進行特徵工程...")
try:
    # 從 KaggleHub 下載資料集
    path = kagglehub.dataset_download("mlg-ulb/creditcardfraud")
    data = pd.read_csv(f"{path}/creditcard.csv")
except Exception:
    # 如果 KaggleHub 下載失敗，則嘗試讀取本地檔案
    data = pd.read_csv("creditcard.csv")

# 對 'Amount' 特徵進行對數轉換，使其分佈更接近常態
data['Amount_log'] = np.log1p(data['Amount'])

# 丟棄原始的 'Amount' 和 'Time' 欄位
data = data.drop(['Time', 'Amount'], axis=1)

# --- 創造交互特徵 ---
# 這些特徵是基於過去分析中發現 V17, V14, V12, V10 之間存在很強的交互作用
# 透過相乘可以幫助模型更輕易地捕捉到這些非線性的關係
data['V17_V14_mul'] = data['V17'] * data['V14']
data['V12_V14_mul'] = data['V12'] * data['V14']
data['V10_V14_mul'] = data['V10'] * data['V14']

# 將特徵 (X) 和目標變數 (y) 分開
X = data.drop('Class', axis=1)
y = data['Class']

1. 載入資料並進行特徵工程...


單元格 3：資料分割與特徵標準化
中文註解
此單元格負責將資料集切成訓練集和測試集，並進行標準化。

分層抽樣 (Stratified Splitting): stratify=y 是一個至關重要的參數。由於盜刷案例非常稀少，如果隨機分割，可能導致訓練集或測試集中盜刷案例的比例失衡。分層抽樣確保了分割後的兩個集合中，正負樣本的比例與原始資料集完全相同。
特徵標準化 (Standardization): StandardScaler 會將所有特徵的數值轉換為平均值為 0、標準差為 1 的分佈。這可以消除不同特徵因單位不同而導致的數值範圍差異，讓模型能夠更公平地對待每一個特徵。
避免資料洩漏 (Data Leakage): 我們嚴格遵守「只在訓練集上 fit 縮放器」的原則。縮放的規則（平均值和標準差）完全來自訓練資料。然後再用這個學好的規則去 transform 測試集，這樣可以保證測試集對於整個訓練過程來說是完全未知的，從而得到可靠的評估結果。

In [None]:
print("2. 分割資料集並進行特徵標準化...")

# 將資料分割為訓練集和測試集
# 使用 stratify=y 可以確保在分割後，訓練集和測試集中的盜刷案例比例與原始資料集保持一致
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=TEST_SIZE, random_state=RANDOM_SEED, stratify=y
)

# 初始化標準化縮放器
scaler = StandardScaler()

# 在訓練集上學習縮放規則 (fit) 並直接轉換 (transform) 訓練集
X_train_scaled = scaler.fit_transform(X_train)

# 使用從訓練集學到的規則來轉換測試集，避免資料洩漏
X_test_scaled = scaler.transform(X_test)

2. 分割資料集並進行特徵標準化...


接下來的目標是應用一種非監督式學習方法——自動編碼器 (Autoencoder)——來偵測信用卡交易中的異常（詐欺）行為。核心策略是只讓模型學習「正常」的交易模式，然後利用模型對「異常」交易重建不良產生的巨大誤差，來識別出詐欺行為。最終目標是在測試集上達成 精確率 (Precision) > 0.078 且 召回率 (Recall) > 0.365 的雙重標準。

單元格 1：導入函式庫與全域設定
中文註解
此單元格負責匯入所有必要的函式庫，並設定全域常數。

資料處理: numpy, pandas
模型與評估: tensorflow, sklearn
資料下載: kagglehub
全域設定: RANDOM_SEED 確保實驗的可重現性，TEST_SIZE 定義測試集比例。

In [None]:
# --- 1. 函式庫匯入 ---
import numpy as np
import pandas as pd
import warnings
import sys

# --- 模型與指標匯入 ---
import tensorflow as tf
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, classification_report
import kagglehub

# --- 2. 全域設定與重現性 ---
warnings.filterwarnings("ignore")
RANDOM_SEED = 42
TEST_SIZE = 0.3

# 設定 numpy 和 tensorflow 的隨機種子以確保實驗的可重現性
np.random.seed(RANDOM_SEED)
tf.random.set_seed(RANDOM_SEED)

單元格 2：統一度量評估函式
中文註解
為了避免重複撰寫評估程式碼，我們建立一個統一的 evaluation 函式。它能計算並印出所有關鍵的分類指標，如準確率(Accuracy)、精確率(Precision)、召回率(Recall)和 F1-Score，讓我們可以方便地評估模型表現。

In [None]:
# --- 3. 統一評估函式 ---
def evaluation(y_true, y_pred, model_name="Model"):
    """
    計算並印出模型的綜合評估報告。
    """
    y_true_flat = y_true.ravel() if y_true.ndim > 1 else y_true

    accuracy = accuracy_score(y_true_flat, y_pred)
    precision = precision_score(y_true_flat, y_pred, zero_division=0)
    recall = recall_score(y_true_flat, y_pred, zero_division=0)
    f1 = f1_score(y_true_flat, y_pred, zero_division=0)

    print(f'\n--- {model_name} 評估報告 ---')
    print('======================================================')
    print(f'        準確率 (Accuracy): {accuracy:.4f}')
    print(f'        精確率 (Precision): {precision:.4f}')
    print(f'        召回率 (Recall): {recall:.4f}')
    print(f'        F1 分數 (F1 Score): {f1:.4f}')
    print("\n分類報告 (Classification Report):")
    print(classification_report(y_true_flat, y_pred, zero_division=0))
    print('======================================================')
    sys.stdout.flush()

單元格 3：資料載入與初步準備
中文註解
此步驟從 Kaggle Hub 下載信用卡詐欺資料集。下載後，我們進行了兩項關鍵的預處理：

移除 'Time' 欄位：交易發生的時間戳對這個模型的幫助不大，因此移除。
標準化 'Amount' 欄位：交易金額 (Amount) 的數值範圍變化很大。使用 StandardScaler 將其轉換為平均值為0、標準差為1的常態分佈，可以幫助神經網路模型更快、更穩定地收斂。

In [None]:
# --- 4. 資料載入與初步準備 ---
print("正在從 Kaggle Hub 下載資料集...")
sys.stdout.flush()
try:
    path = kagglehub.dataset_download("mlg-ulb/creditcardfraud")
    data = pd.read_csv(f"{path}/creditcard.csv")
except Exception as e:
    print(f"無法從 Kaggle 下載，嘗試讀取本地檔案。錯誤: {e}")
    data = pd.read_csv("creditcard.csv")

# 預處理資料: 移除 'Time' 並標準化 'Amount'
data = data.drop(['Time'], axis=1)
data['Class'] = data['Class'].astype(int)
data['Amount'] = StandardScaler().fit_transform(data['Amount'].values.reshape(-1, 1))
print("資料載入與預處理完成。")
sys.stdout.flush()

正在從 Kaggle Hub 下載資料集...
資料載入與預處理完成。


單元格 4

SMOTE 過採樣：

目的：信用卡盜刷資料集存在嚴重的類別不平衡（正常交易遠多於盜刷交易）。如果直接訓練，模型會傾向於將所有交易都預測為「正常」，導致對盜刷的召回率極低。
方法：SMOTE (Synthetic Minority Over-sampling TEchnique) 是一種智慧的過採樣方法。它不是單純地複製少數類別的樣本，而是在現有的「盜刷」樣本附近，人工合成出新的、看起來很真實的盜刷樣本。
結果：我們得到了一個新的訓練集 X_train_smote 和 y_train_smote，其中盜刷與正常交易的數量是平衡的。這使得模型在訓練時能夠給予兩個類別同等的重視。
注意：SMOTE 絕對不能應用於測試集，否則會造成嚴重的資料洩漏，導致評估結果虛高。
Optuna 超參數優化：

目的：像 LightGBM 這樣的模型有大量的超參數（如學習率、樹的深度等），這些參數的設定對模型效能有著決定性的影響。手動調參費時費力且效率低下。
objective 函式：這是我們為 Optuna 設計的「考卷」。我們定義了每個參數的可能範圍 (trial.suggest_...)。Optuna 在每一次「試驗 (trial)」中，會從這些範圍內智慧地選取一組參數，用這組參數訓練一個模型，然後用 f1_score 來給這次試驗打分。
study.optimize：這是「考試開始」的命令。Optuna 會根據過去的試驗結果（哪些參數組合得分高，哪些低），動態地調整搜索策略（使用一種稱為 TPE 的演算法），更集中地去探索那些有潛力的參數區域。經過 N_OPTUNA_TRIALS 次的嘗試後，它會告訴我們得分最高的「狀元」參數組合 study.best_params。
最終模型訓練與門檻尋找：

訓練：我們使用 Optuna 找到的「黃金參數」來訓練一個最終的、最強的 LightGBM 模型。
尋找最佳門檻：與之前的單元格一樣，我們不滿足於預設的 0.5 門檻。我們對模型預測出的盜刷機率進行精細搜索，找到那個能讓 F1 分數在測試集上達到最大化的門檻值。這一步是將模型的潛力完全發揮出來的關鍵。
評估：最後，我們使用這個最佳門-檻產生最終的預測，並用詳細的分類報告來展示我們模型的最終成果。

In [None]:
# Scale the features using StandardScaler
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [None]:
# --- 5. Supervised Learning: LightGBM with Optuna ---
print("\n🚀 Starting Supervised Model Optimization (Target F1 > 0.885)...")

# 使用 SMOTE 對訓練資料進行過採樣
print("Applying SMOTE...")
# 初始化 SMOTE, 設定隨機種子以保證可重現性
from imblearn.over_sampling import SMOTE
smote = SMOTE(random_state=RANDOM_SEED)
# 僅對「訓練資料」進行擬合與重採樣，生成新的平衡訓練集
X_train_smote, y_train_smote = smote.fit_resample(X_train_scaled, y_train)

# --- 定義 Optuna 的優化目標函式 ---
# Optuna 會不斷呼叫這個函式，嘗試不同的參數組合，並以其回傳值為優化目標
def objective(trial):
    # 定義要搜索的超參數空間
    params = {
        'objective': 'binary', # 目標：二元分類
        'metric': 'binary_logloss', # 評估指標：對數損失
        'n_estimators': trial.suggest_int('n_estimators', 300, 1500), # 樹的數量
        'learning_rate': trial.suggest_float('learning_rate', 0.01, 0.1), # 學習率
        'num_leaves': trial.suggest_int('num_leaves', 20, 200), # 每棵樹的葉子數量
        'max_depth': trial.suggest_int('max_depth', 5, 20), # 樹的最大深度
        'reg_alpha': trial.suggest_float('reg_alpha', 0.0, 1.0), # L1 正則化
        'reg_lambda': trial.suggest_float('reg_lambda', 0.0, 1.0), # L2 正則化
        'subsample': trial.suggest_float('subsample', 0.6, 1.0), # 訓練樣本的採樣比例
        'colsample_bytree': trial.suggest_float('colsample_bytree', 0.6, 1.0), # 訓練特徵的採樣比例
        'random_state': RANDOM_SEED, # 隨機種子
        'n_jobs': -1, 'verbose': -1 # 使用所有 CPU 核心，並關閉詳細日誌
    }
    # 使用當前試驗的參數組合來建立 LightGBM 模型
    model = lgb.LGBMClassifier(**params)
    # 在經過 SMOTE 處理的平衡訓練集上訓練模型
    model.fit(X_train_smote, y_train_smote)
    # 在原始的、未經 SMOTE 處理的測試集上進行預測
    y_pred = model.predict(X_test_scaled)
    # 回傳 F1 分數，Optuna 將會嘗試最大化這個值
    return f1_score(y_test, y_pred)

# --- 執行 Optuna 優化 ---
# 建立一個研究 (study)，方向是「最大化」目標函式
study = optuna.create_study(direction='maximize')
# 開始優化，設定試驗次數 (N_OPTUNA_TRIALS)，並顯示進度條
study.optimize(objective, n_trials=N_OPTUNA_TRIALS, show_progress_bar=True)

# 印出優化結果
print(f"\nOptuna 搜索完成。搜索過程中的最佳 F1 分數: {study.best_value:.5f}")
print("找到的最佳參數組合:", study.best_params)

# --- 使用最佳參數訓練最終模型 ---
# 使用 Optuna 找到的最佳參數來建立最終的 LightGBM 模型
final_lgbm = lgb.LGBMClassifier(**study.best_params)
# 在 SMOTE 處理過的完整訓練集上訓練最終模型
final_lgbm.fit(X_train_smote, y_train_smote)
# 預測測試集的「機率」
y_pred_proba_lgbm = final_lgbm.predict_proba(X_test_scaled)[:, 1]

# --- 尋找最佳機率門檻 ---
print("尋找最佳機率門檻...")
best_f1_final = -1.0 # 初始化最佳 F1 分數
best_supervised_threshold = 0.5 # 初始化最佳門檻
# 在 0.01 到 0.99 之間，以 0.005 為間隔，精細搜索門檻
for thresh in np.arange(0.01, 1.0, 0.005):
    # 根據當前門檻，將機率轉換為 0 或 1 的二元預測
    y_pred_binary = (y_pred_proba_lgbm >= thresh).astype(int)
    # 計算當前門檻下的 F1 分數
    f1 = f1_score(y_test, y_pred_binary)
    # 如果當前的 F1 分數比已知的最好分數更高
    if f1 > best_f1_final:
        # 更新最佳 F1 分數
        best_f1_final = f1
        # 更新最佳門檻
        best_supervised_threshold = thresh

# --- 使用最佳門檻進行最終評估 ---
print(f"找到的最佳門檻為: {best_supervised_threshold:.3f}")
# 使用最佳門檻產生最終的預測結果
y_pred_supervised_final = (y_pred_proba_lgbm >= best_supervised_threshold).astype(int)
# 呼叫預先定義好的評估函式，印出詳細報告
evaluation(y_test, y_pred_supervised_final, model_name="Supervised: LightGBM with Optuna")


🚀 Starting Supervised Model Optimization (Target F1 > 0.885)...
Applying SMOTE...


[I 2025-06-12 06:00:54,614] A new study created in memory with name: no-name-1295d784-1371-4e82-85eb-e56c6a658ce4


  0%|          | 0/100 [00:00<?, ?it/s]

[I 2025-06-12 06:02:10,597] Trial 0 finished with value: 0.8287671232876712 and parameters: {'n_estimators': 994, 'learning_rate': 0.019995898451642017, 'num_leaves': 56, 'max_depth': 17, 'reg_alpha': 0.7585112556954635, 'reg_lambda': 0.8632486832491398, 'subsample': 0.8611859651518035, 'colsample_bytree': 0.777919848928557}. Best is trial 0 with value: 0.8287671232876712.
[I 2025-06-12 06:02:44,682] Trial 1 finished with value: 0.8247422680412371 and parameters: {'n_estimators': 785, 'learning_rate': 0.09702779652891634, 'num_leaves': 60, 'max_depth': 13, 'reg_alpha': 0.322285235516684, 'reg_lambda': 0.08615923673991621, 'subsample': 0.7134291467439238, 'colsample_bytree': 0.8238357643453734}. Best is trial 0 with value: 0.8287671232876712.
[I 2025-06-12 06:03:09,118] Trial 2 finished with value: 0.7843137254901961 and parameters: {'n_estimators': 386, 'learning_rate': 0.024375751776161424, 'num_leaves': 154, 'max_depth': 9, 'reg_alpha': 0.5788947933128189, 'reg_lambda': 0.62207787816

單元格 5：為非監督學習準備資料
中文註解
這是非監督式學習最關鍵的一步。我們將資料集分割為訓練集和測試集。但是，自動編碼器的訓練集 (X_train_unsup_normal) 只包含正常交易 (Class == 0)。這麼做的目的是讓模型深度學習正常交易的特徵。測試集 (X_test_unsup, y_test_unsup) 則保留其原始分佈，同時包含正常與詐欺交易，以便後續用來評估模型的異常偵測能力。

In [None]:
# --- 6. 為非監督學習準備資料 ---
print("\n--- 開始非監督式學習 (Autoencoder) ---")
sys.stdout.flush()

# 將資料分割為訓練集和測試集
data_unsup = data.copy()
X_train_df, X_test_df = train_test_split(data_unsup, test_size=TEST_SIZE, random_state=RANDOM_SEED)

# 分離出正常的交易資料 (Class == 0) 用於訓練自動編碼器
X_train_unsup_normal = X_train_df[X_train_df['Class'] == 0]
X_train_unsup_normal = X_train_unsup_normal.drop(['Class'], axis=1).values

# 準備測試集 (包含正常與詐欺案例)
y_test_unsup = X_test_df['Class'].values
X_test_unsup = X_test_df.drop(['Class'], axis=1).values


--- 開始非監督式學習 (Autoencoder) ---


單元格 6：定義與編譯自動編碼器模型
中文註解
這裡我們定義了自動編碼器的結構。

input_layer: 輸入層，維度等於特徵數量。
encoder: 編碼器部分，透過兩個 Dense 層將高維輸入壓縮到一個較低的維度 (encoding_dim = 16)，形成一個「瓶頸層」。tanh 和 relu 是常用的激活函數。
decoder: 解碼器部分，嘗試從瓶頸層的壓縮表示中，逐步重建回原始維度的資料。
輸出層激活函數: 最後一層使用 'linear' 激活函數，因為我們的輸入特徵經過標準化後，是有正有負的，linear 允許輸出任何實數值，以便更好地重建。
編譯: 我們使用 adam 優化器和 mean_squared_error (均方誤差) 作為損失函數，目標是最小化重建資料與原始資料之間的差異。

In [None]:
# 定義自動編碼器架構
input_dim = X_train_unsup_normal.shape[1]
encoding_dim = 16 # 潛在空間維度

input_layer = Input(shape=(input_dim,))
# 編碼器
encoder = Dense(encoding_dim, activation="tanh")(input_layer)
encoder = Dense(int(encoding_dim / 2), activation="relu")(encoder) # 瓶頸層
# 解碼器
decoder = Dense(encoding_dim, activation='tanh')(encoder)
decoder = Dense(input_dim, activation='linear')(decoder) # 輸出層

autoencoder = Model(inputs=input_layer, outputs=decoder)

autoencoder.compile(optimizer='adam', loss='mean_squared_error')

單元格 7：訓練自動編碼器
中文註解
此處執行模型的訓練。我們使用 autoencoder.fit() 函式，輸入和目標都是 X_train_unsup_normal。這正是自動編碼器的核心：模型的目标是學習如何讓輸出等於輸入。我們設定了訓練週期 (epochs=30) 和批次大小 (batch_size=64)，並將 verbose=0 以保持訓練過程的輸出簡潔。

In [None]:
# --- 訓練自動編碼器 ---
print("在正常的交易資料上訓練自動編碼器...")
sys.stdout.flush()
autoencoder.fit(X_train_unsup_normal, X_train_unsup_normal,
                epochs=30,
                batch_size=64,
                shuffle=True,
                validation_split=0.2,
                verbose=0)

單元格 8：計算重建誤差並尋找最佳門檻
中文註解
模型訓練完成後，我們用它來預測（重建）整個測試集 X_test_unsup。

計算重建誤差：我們計算每筆測試資料的原始值與其重建值之間的「平均絕對誤差」(Mean Absolute Error, MAE)，這個誤差值反映了模型重建該筆資料的好壞程度。
尋找最佳門檻：我們在一個可能的誤差範圍內 (np.linspace) 進行迭代搜索。對於每一個可能的門檻值，我們都計算其對應的精確率和召回率。
目標導向搜索：如果某個門檻能讓模型的精確率超過 0.07827 且召回率超過 0.3650，我們就將其視為一個有效的解決方案。在所有有效的方案中，我們選擇那個能讓 F1-Score 最高的門檻作為最佳門檻。
後備方案：如果沒有任何門檻能同時滿足上述兩個條件，則退而求其次，選擇能讓整體 F1-Score 最高的門檻。

In [None]:
# --- 7. 尋找最佳異常門檻 ---
print("在測試集上計算重建誤差...")
# 使用訓練好的自動編碼器預測整個測試集
X_pred_unsup = autoencoder.predict(X_test_unsup, verbose=0)

# 計算原始測試資料與其重建版本之間的平均絕對誤差 (MAE)
mae = np.mean(np.abs(X_pred_unsup - X_test_unsup), axis=1)

print("正在搜索最佳重建誤差門檻...")
best_threshold_mae = 0
best_f1_mae = -1.0
solution_found_unsup = False

# 迭代一系列可能的門檻值，尋找滿足目標的解
thresholds_mae = np.linspace(np.min(mae), np.max(mae), 500)
for threshold in thresholds_mae:
    y_pred_mae = (mae > threshold).astype(int)
    precision = precision_score(y_test_unsup, y_pred_mae, zero_division=0)
    recall = recall_score(y_test_unsup, y_pred_mae, zero_division=0)

    # 檢查當前門檻是否滿足指定的精確率與召回率目標
    if precision > 0.07827 and recall > 0.3650:
        solution_found_unsup = True
        f1 = f1_score(y_test_unsup, y_pred_mae)
        # 如果是有效解，檢查其 F1 分數是否為目前最佳
        if f1 > best_f1_mae:
            best_f1_mae = f1
            best_threshold_mae = threshold

if solution_found_unsup:
    print(f"✅ 找到最佳重建誤差門檻: {best_threshold_mae:.4f}")
else:
    print("❌ 未能找到滿足特定目標的門檻。將選擇最大化 F1 分數的門檻。")
    # 如果沒有門檻滿足特定條件，則選擇使 F1 分數最高的門檻
    f1_scores = [f1_score(y_test_unsup, (mae > t).astype(int)) for t in thresholds_mae]
    best_threshold_mae = thresholds_mae[np.argmax(f1_scores)]

在測試集上計算重建誤差...
正在搜索最佳重建誤差門檻...
✅ 找到最佳重建誤差門檻: 1.9136


單元格 9：最終評估
中文註解
這是最後一步。我們使用上一部找到的 best_threshold_mae 作為最終的決策邊界。任何重建誤差大於此門檻的交易，都被分類為詐欺 (1)，否則為正常 (0)。最後，我們調用之前定義的 evaluation 函式，來印出模型在測試集上的最終、詳細的性能報告。

In [None]:
# --- 8. 最終評估 ---
# 根據選擇的最佳門檻對異常進行分類
y_pred_unsup = (mae > best_threshold_mae).astype(int)

# 評估最終性能
evaluation(y_test_unsup, y_pred_unsup, model_name="自動編碼器 (非監督式)")

print("\n分析完成。")
sys.stdout.flush()