# Stacking(堆疊)
是一種集成學習（Ensemble Learning）技術，將多個不同的基學習器（Base Learners）組合在一起，藉由它們的預測結果來訓練一個元學習器（Meta Learner），從而提高模型的表現。

In [2]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import StackingClassifier
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 載入 iris 資料集
data = load_iris()  # 這是 sklearn 提供的著名 Iris 花卉資料集
X = pd.DataFrame(data.data, columns=data.feature_names)  # 特徵矩陣
y = pd.Series(data.target)  # 目標變數 (類別)

# 將資料集分為訓練集和測試集，80%訓練，20%測試
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 定義基學習器，這些是將用於 Stacking 的子模型
base_learners = [
    ('rf', RandomForestClassifier(n_estimators=10, random_state=42)),  # 隨機森林
    ('svc', SVC(probability=True, random_state=42)),  # 支援向量機，probability=True 以便於後續堆疊的預測機率
    ('gb', GradientBoostingClassifier(random_state=42))  # 梯度提升機
]

# 定義元學習器，這是最終用來組合基學習器預測結果的模型
meta_learner = LogisticRegression()

# 建立 StackingClassifier，這是將基學習器和元學習器組合的堆疊模型
stack_clf = StackingClassifier(estimators=base_learners, final_estimator=meta_learner, cv=5)

# 訓練堆疊模型
stack_clf.fit(X_train, y_train)

# 預測測試集的類別
y_pred = stack_clf.predict(X_test)

# 評估模型準確度
accuracy = accuracy_score(y_test, y_pred)
print(f"Stacking Classifier Accuracy: {accuracy:.2f}")  # 顯示模型的準確度

Stacking Classifier Accuracy: 1.00


In [3]:
import datetime

current_date = datetime.datetime.now().strftime("%Y年%m月%d日")
print(f"更新日期: {current_date}")

更新日期: 2024年12月01日
