📈 Predicting Cost with XGBoost Regressor — 模擬數據回歸模型實作 這是一個使用 XGBoost 進行迴歸分析的小型專案,透過模擬數據 (data資料夾中),預測與製程參數相關的成本(Cost)。此專案練習了資料處理、特徵工程、模型訓練與視覺化,適合做為學習機器學習模型開發的起點。
📂 專案內容
- 使用XGBoost回歸模型預測成本
- 進行特徵解析與派生特徵建構
- 訓練/測試資料切分與模型訓練
- 預測結果視覺化(真實值 vs 預測值)
- 特徵重要性繪圖
🛠 使用方式
- 安裝必要套件
pip install -r requirements.txt
- 確保你有以下檔案 --> sum10gen.csv / P=1000.csv / P=100.csv/ P=10.csv/ FI.csv:模擬數據檔(包含如 [N1, N1f, N1e] 等欄位) --> XGboost.ipynb:主程式
- 執行主程式
- 看結果 執行後,終端機會輸出模型評估指標(RMSE),並顯示以下兩張圖: --> 預測 vs 真實值散佈圖 --> 特徵重要性視覺化圖
🔁 專案流程
-
資料載入與前處理 --> 解析類似 "[N1, N1f, N1e]" 的欄位為獨立數值欄 --> 處理 inf / NaN
-
派生特徵建構 --> 計算 N1f_ratio, N2f_ratio, N1f_plus_e 等有意義的比例與差值
-
模型訓練 --> 使用 XGBRegressor 搭配基本參數訓練模型
-
模型評估 --> 使用 RMSE 評估預測誤差 --> 顯示真實與預測值關係圖 --> 顯示特徵重要性圖