# モデルの中身を覗く

ここでは変数の重要度の取得方法とPDPの作図法を学びます。

##### サンプルデータの読み込み
データはボストン住宅価格データを用います。

In [None]:
import pandas as pd
from sklearn.datasets import load_boston

dataset = load_boston()
X = pd.DataFrame(dataset.data,columns=dataset.feature_names)
y = pd.Series(dataset.target,name='y')
display(X.join(y).head(5))

##### モデルの学習
変数の重要度とPDP作図の元となる学習器を構築します。

In [None]:
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.pipeline import Pipeline

pipe_gbr = Pipeline([('scl',StandardScaler()),
                     ('est',GradientBoostingRegressor(random_state=0))])
pipe_gbr.fit(X,y)

##### 変数の重要度の取得
変数の重要度を取得するには、`feature_importances_`属性にアクセスします。

In [None]:
imp = pipe_gbr.named_steps['est'].feature_importances_
imp = pd.Series(imp,index=dataset.feature_names)
display(imp)

##### PDP(Partial Dependent Plot)の作図
PDPの作図には以下のパラメータを指定します。
- 学習済みモデル：パイプライン全体ではなく分類/回帰の部分
- PDP作図のためのデータセット：訓練データ
- データセットのカラムリスト（feature_names)
- 作図したい変数（features)

In [None]:
from sklearn.ensemble.partial_dependence import plot_partial_dependence
import matplotlib.pyplot as plt

fig,axs= plot_partial_dependence(pipe_gbr.named_steps['est'],
                                 pipe_gbr.named_steps['scl'].transform(X),
                                 feature_names=dataset.feature_names,
                                 features=['RM','LSTAT'])
plt.show()