Skip to content

Tina54322/Python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Python

📈 Predicting Cost with XGBoost Regressor — 模擬數據回歸模型實作 這是一個使用 XGBoost 進行迴歸分析的小型專案,透過模擬數據 (data資料夾中),預測與製程參數相關的成本(Cost)。此專案練習了資料處理、特徵工程、模型訓練與視覺化,適合做為學習機器學習模型開發的起點。

📂 專案內容

  1. 使用XGBoost回歸模型預測成本
  2. 進行特徵解析與派生特徵建構
  3. 訓練/測試資料切分與模型訓練
  4. 預測結果視覺化(真實值 vs 預測值)
  5. 特徵重要性繪圖

🛠 使用方式

  1. 安裝必要套件
pip install -r requirements.txt
  1. 確保你有以下檔案 --> sum10gen.csv / P=1000.csv / P=100.csv/ P=10.csv/ FI.csv:模擬數據檔(包含如 [N1, N1f, N1e] 等欄位) --> XGboost.ipynb:主程式
  2. 執行主程式
  3. 看結果 執行後,終端機會輸出模型評估指標(RMSE),並顯示以下兩張圖: --> 預測 vs 真實值散佈圖 --> 特徵重要性視覺化圖

🔁 專案流程

  1. 資料載入與前處理 --> 解析類似 "[N1, N1f, N1e]" 的欄位為獨立數值欄 --> 處理 inf / NaN

  2. 派生特徵建構 --> 計算 N1f_ratio, N2f_ratio, N1f_plus_e 等有意義的比例與差值

  3. 模型訓練 --> 使用 XGBRegressor 搭配基本參數訓練模型

  4. 模型評估 --> 使用 RMSE 評估預測誤差 --> 顯示真實與預測值關係圖 --> 顯示特徵重要性圖

About

20241015 python

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published