# Classic Stacking

"Classic Stacking" 是一種 Ensemble Learning 方法，旨在提高機器學習模型的預測性能。該方法使用一個組合的方式，將多個基本模型的預測結果結合起來，從而產生一個更強大的預測模型。(簡單來說就是基本的 stacking)

Classic Stacking 的主要思想在於結合多種模型，充分利用每個模型的優勢，以提高整體的預測能力。然而，Classic Stacking 也需要注意避免過度擬合，並且在設計時需要更多的調參和實驗。

## 執行步驟

1. 資料分割： 將訓練資料分為多個不重疊的部分，通常使用交叉驗證來實現。

2. Base Models 訓練： 對每個部分的訓練資料，使用多種不同的基本模型（如決策樹、隨機森林、支持向量機等）進行訓練。

3. Base Models 預測： 使用訓練好的基本模型來預測測試資料。

4. Meta Model 訓練： 將每個基本模型的預測結果作為新的特徵，並使用真實的目標變數（原始訓練資料的目標值）作為標籤，訓練一個高階模型，稱為 Meta Model 或 Stacking Model。

5. 預測： 使用 Meta Model 對測試資料進行預測。這個步驟將涉及使用每個基本模型的預測結果作為輸入，然後通過 Meta Model 進行最終預測。

## 優缺點

### 優點：

* 提高預測性能：通過結合多種模型的優勢，可以獲得更好的預測結果。
* 增強泛化能力：減少個別模型的局限性，提高模型的泛化能力。

### 缺點：

* 複雜性：Classic Stacking 需要管理多個基本模型和 Meta Model，訓練和調參需要額外的工作。
* 資源需求：需要更多的計算資源和時間，特別是當基本模型較多時。

In [1]:
import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 生成隨機數據
X, y = make_classification(n_samples=1000, n_features=5, random_state=42)

# 分割訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 創建基本模型
base_model1 = DecisionTreeClassifier(random_state=42)
base_model2 = RandomForestClassifier(random_state=42)

# 訓練基本模型
base_model1.fit(X_train, y_train)
base_model2.fit(X_train, y_train)

# 使用基本模型進行預測
pred1 = base_model1.predict(X_test)
pred2 = base_model2.predict(X_test)

# 創建 Meta Model
meta_model = LogisticRegression()

# 使用基本模型的預測結果作為特徵，訓練 Meta Model
meta_features = np.column_stack((pred1, pred2))
meta_model.fit(meta_features, y_test)

# 使用 Meta Model 進行最終預測
meta_pred = meta_model.predict(meta_features)

# 計算最終預測的準確性
accuracy = accuracy_score(y_test, meta_pred)
print("Final Accuracy:", accuracy)


Final Accuracy: 0.885
