In [None]:
# 題：生產參數優化
# 使用 Scikit-Learn 的回歸模型來分析不同工藝參數組合對生產的影響，並找到最佳的參數組合。
# 1. 數據準備
# 使用 Pandas 將數據導入，並準備特徵和目標變數。

import pandas as pd
from sklearn.model_selection import train_test_split

# 加載數據
data = pd.read_csv('production_parameters.csv')

# 假設 'param1', 'param2', 'param3' 是工藝參數，'yield' 是目標良率
X = data[['param1', 'param2', 'param3']]
y = data['yield']

# 拆分數據集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
# 2. 訓練模型
# 使用線性回歸模型來擬合生產參數和良率之間的關係。

from sklearn.linear_model import LinearRegression

# 初始化線性回歸模型
model = LinearRegression() ##

# 訓練模型
model.fit(X_train, y_train)

In [None]:
# 3. 模型評估與參數影響分析
# 使用均方誤差（MSE）評估模型的預測效果，並分析各參數的影響。

from sklearn.metrics import mean_squared_error

# 預測
y_pred = model.predict(X_test)

# 計算均方誤差
mse = mean_squared_error(y_test, y_pred)
print("Mean Squared Error:", mse)

# 查看各工藝參數的權重（係數）
print("Model coefficients:", model.coef_) ##


In [None]:
# 4. 找到最佳參數組合
# 通過模型找到工藝參數的最佳組合，以最大化良率或最小化缺陷率。

import numpy as np

# 根據模型係數和數據範圍生成參數組合進行測試
param_grid = np.array([[param1, param2, param3] for param1 in range(1, 10) for param2 in range(1, 10) for param3 in range(1, 10)]) ##

# 預測每組參數的良率
yields = model.predict(param_grid) ##
# predict 方法用於讓模型對新數據進行預測。

# 找到最大良率的參數組合
best_params = param_grid[np.argmax(yields)] ##
print("Best parameters for maximum yield:", best_params)
# param_grid 是網格搜索（Grid Search）中的參數選擇範圍，用來指定一組參數的候選值，從而讓模型自動測試每種組合的效果。
# argmax 是用於找到最大值的索引的函數，用於確定概率分佈中最可能的類別。
