# Simple Averaging 

Stacking的Simple Averaging是一種簡單且直觀的集成方法，它的思想是將多個基本模型的預測結果進行平均來得到最終的預測結果。

## 步驟

1. 基本模型訓練：訓練多個不同的基本模型，每個模型都使用相同的訓練數據。

2. 基本模型預測：對測試數據使用每個基本模型進行預測，得到一系列不同的預測結果。

3. 預測結果平均：將各個基本模型的預測結果進行簡單平均，得到最終的預測結果。

## 優缺點

### Stacking with Simple Averaging 的優點：

* 簡單直觀：這是一種簡單且容易實現的方法，不需要太多複雜的技術。

* 平滑預測：平均化不同模型的預測可以減少單一模型的預測變異，有助於更穩定的預測。

* 適應不同模型：可以結合多個不同性能和特點的模型，從而獲得更好的整體預測性能。

### Stacking with Simple Averaging 的缺點：

* 忽略模型關聯性：這種簡單的平均方法忽略了模型之間可能存在的複雜關聯性，無法最大程度地捕捉不同模型的優點。

* 相同權重平均：每個模型的預測在平均時都被賦予相同的權重，忽略了不同模型可能在不同情況下的表現差異。

* 可能過於保守：由於所有模型的預測都被平均，可能會導致整體預測的保守性，無法充分利用某些模型的高質量預測。

## python

In [1]:
import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 生成模擬數據
X, y = make_classification(n_samples=1000, n_features=5, random_state=42)

# 分割數據集為訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 創建五個基本模型
model1 = RandomForestClassifier(random_state=42)
model2 = GradientBoostingClassifier(random_state=42)
model3 = LogisticRegression(random_state=42)
model4 = RandomForestClassifier(max_depth=3, random_state=42)
model5 = GradientBoostingClassifier(max_depth=3, random_state=42)

# 訓練基本模型
model1.fit(X_train, y_train)
model2.fit(X_train, y_train)
model3.fit(X_train, y_train)
model4.fit(X_train, y_train)
model5.fit(X_train, y_train)

# 得到基本模型的預測結果
pred1 = model1.predict(X_test)
pred2 = model2.predict(X_test)
pred3 = model3.predict(X_test)
pred4 = model4.predict(X_test)
pred5 = model5.predict(X_test)

# 將基本模型的預測結果進行平均
ensemble_pred = np.round((pred1 + pred2 + pred3 + pred4 + pred5) / 5)

# 計算集成模型的準確度
ensemble_accuracy = accuracy_score(y_test, ensemble_pred)
print("Ensemble Accuracy:", ensemble_accuracy)


Ensemble Accuracy: 0.9
