## 複数の弱学習機を組み合わせたアンサンブル手法：スタッキング
ここのカーネルを参考にしたので、困ったら個々に戻るのが良い
https://www.kaggle.com/serigne/stacked-regressions-top-4-on-leaderboard

In [2]:
from sklearn.linear_model import ElasticNet, Lasso,  BayesianRidge, LassoLarsIC
from sklearn.ensemble import RandomForestRegressor,  GradientBoostingRegressor
from sklearn.kernel_ridge import KernelRidge
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import RobustScaler
from sklearn.base import BaseEstimator, TransformerMixin, RegressorMixin, clone
from sklearn.model_selection import KFold, cross_val_score, train_test_split
from sklearn.metrics import mean_squared_error
import xgboost as xgb
import lightgbm as lgb

最も単純なスタッキング。各モデルの予測を平均した値を用いるというもの

In [3]:
# classに引数を入れると継承ができる
class AveraginModels(BaseEstimator,RegressorMixin,TransformerMixin):
    def __init__(self,models):
        self.models=models
    
    def fit(self,X,y):
        # clone モデルの複製
        self.models_=[clone(x) for x in self.models]
        
        for model in self.models_:
            model.fit(X,y)
        
        # selfはクラスなので、もう一度自分自身を呼び出す
        return self

    def predict(self,X):
        
        predictions=np.column_stack([model.predict(X) for model in self.models_])
        
        return np.mean(predictions,axis=1)


すでに作成済みの弱学習器を入れることで、スタッキングモデルのインスタンスを作成する。

In [None]:
averaged_models = AveragingModels(models = (ENet, GBoost, KRR, lasso))

In [5]:
# StackingAverageModelsではモデルを返す

class StackingAverageModels(BaseEstimator,RegressorMixin,TransformerMixin):
    
    def __init__(self,base_models,meta_model,n_folds=5):
        self.base_models=base_models
        self.meta_model=meta_model
        self.n_folds=n_folds
        
        
    def fit(self,X,y):
        # base_modelを入れるための空の配列を作成
        self.base_models_ = [list() for x in self.base_models]
        # meta_modelをclone
        self.meta_model_ = clone(self.meta_model)
        # k交差分割
        kfold=KFold(n_splits=self.n_folds,shuffle=True,random_state=156)
        
        # k交差分割で検証用に選ばれたデータで予測した値を格納
        out_of_fold_predictions=np.zeros((X.shape[0],len(self.base_models)))
        
        # base_modelごとにおこなう
        for i,model in enumerate(self.base_models):
            # k交差分割を各モデルごと行う
            for train_index,holdout_index in kfold.split(X,y):
                # 元のモデルに影響がないようにcloneする
                instance=clone(model)
                # base_models_に使用したベースモデルを追加
                self.base_models_[i].append(instance)
                # 学習
                instance.fit(X[train_index],y[train_index])
                # 学習したモデルで検証用データを予測
                y_pred=instance.predict(X[holdout_index])
                # 予測した値を格納
                out_of_fold_predictions[holdout_index,i]=y_pred
            
       # メタモデルでベースモデルが検証用データで予測した値で学習 
        self.meta_model_.fit(out_of_fold_predictions,y)
        
        return self
    
    def predict(self, X):
        meta_features = np.column_stack([
            np.column_stack([model.predict(X) for model in base_models]).mean(axis=1)
            for base_models in self.base_models_ ])
        return self.meta_model_.predict(meta_features)

In [None]:
stacked_averaged_models = StackingAveragedModels(base_models = (ENet, GBoost, KRR),
                                                 meta_model = lasso)