# 📘 SECOM Smart Fault Predictor - Notebook 導覽總覽


歡迎使用 SECOM 製造資料異常預測專案，本導覽筆記將依照分析階段提供各階段 Notebook 的說明與連結，方便你快速切換流程並了解專案脈絡。


## 🔍 01. 資料探索與理解


[`01_data_exploration.ipynb`](01_data_exploration.ipynb)

- 讀取 SECOM 原始資料與標籤
- 觀察欄位分佈與缺失值情形
- 執行特徵剪裁、標準化與資料整合


## 🧪 02. 資料不平衡處理與傳統機器學習模型訓練


[`02_Traditional_ML_Models.ipynb`](02_Traditional_ML_Models.ipynb)

- 使用 SMOTEENN 合成資料 + 降低過擬合
- 建立多種模型（LogisticRegression、LightGBM、CatBoost）
- 對不平衡類別設定 class_weight
- 選出 Recall 最低的模型


## 🌲 03. LightGBM 變體模型訓練


[`03_Enhance_lightgbm_pipeline.ipynb`](03_Enhance_lightgbm_pipeline.ipynb)

- 建立分類模型預測是否異常
- 強化 LightGBM 建模與預測
    - LightGBM + `class_weight=balanced`
    - LightGBM + CalibratedClassifierCV（機率校準）
    - LightGBM + PCA 降維後加強特徵表現力
- 找出最佳 Threshold（最大化 F1）
- PR AUC / ROC AUC / F1 曲線視覺化
- 自動選出最佳版本（PR AUC 達標再比 Recall）


## ⚠️ 04. 異常分數建構 + SHAP 解釋


[`04_anomaly_scores.ipynb`](04_anomaly_scores.ipynb)

- 使用 AutoEncoder / IsolationForest 建立異常分數
- 建立 hybrid_score + PU 標記策略
- SHAP 分析找出主導異常的重要特徵


## 🚨 05. 即時預測模擬 + 可視化


[`05_realtime_simulation.ipynb`](05_realtime_simulation.ipynb)

- 模擬即時樣本流入並分類
- 顯示異常趨勢與異常率變化
- 提供雙層異常標記 + SHAP 解釋資訊


---
🛠 若你準備部署此專案，請先確認已安裝 `requirements.txt` 套件依賴。


```mermaid
graph TD
    A[載入 SECOM 資料] --> B[補值與標準化]
    B --> C[LightGBM 模型訓練]
    C --> D[模型評估（F1, AUC, Confusion Matrix）]
    B --> E[Isolation Forest 計算異常分數]
    E --> F[SHAP 解釋與異常標記]
    D --> G[結果視覺化與儀表板展示]
    F --> G
```

