# Microsoft Interpret ML のよる決定木モデリング

[Microsoft Interpret ML](https://github.com/microsoft/interpret) に内蔵されている Linear Regression (線形回帰) のモデリングを行います。

## 1. データ準備

### データインポート

In [1]:
import pandas as pd
from sklearn import datasets
from sklearn.model_selection import train_test_split

# sklearn の糖尿病のサンプルデータをロード
diabetes = datasets.load_diabetes()
X = pd.DataFrame(diabetes.data, columns=("age", "sex", "bmi", "map", "tc", "ldl", "hdl", "tch", "ltg", "glu"))
y = pd.DataFrame(diabetes.target, columns=["y"])

In [2]:
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.1,random_state=100)

### データ探索

In [3]:
from interpret import show
from interpret.data import Marginal

marginal = Marginal().explain_data(X_train, y_train, name = 'Train Data')
show(marginal)

## 2. モデル学習

In [4]:
from interpret.glassbox import LinearRegression

seed=1234

lr = LinearRegression(random_state=seed)
lr.fit(X_train, y_train)

<interpret.glassbox.linear.LinearRegression at 0x12056ae10>

## 3. モデルの解釈

### 精度の確認

In [5]:
from interpret import show
from interpret.perf import RegressionPerf

lr_perf = RegressionPerf(lr.predict).explain_perf(X_test, y_test, name='Linear Regression')
show(lr_perf)

### Global なモデル解釈

In [6]:
lr_global = lr.explain_global(name='Tree')
show(lr_global)