# 13章　線形回帰 
## レシピ13.1　直線によるフィッティング 


In [None]:
# ライブラリをロード
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression

# 特徴量行列とターゲットベクトルを作成
features, target = make_regression(n_samples = 100,
                                   n_features = 3,
                                   n_informative = 2,
                                   n_targets = 1,
                                   noise = 0.2,
                                   coef = False,
                                   random_state = 1)
# 線形回帰器を作成
regression = LinearRegression()

# 線形回帰器を訓練
model = regression.fit(features, target)

In [None]:
# 切片（intercept）を表示
model.intercept_

In [None]:
# 特徴量の係数（coefficient）を表示
model.coef_

In [None]:
# ターゲットベクトルの最初の値
target[0]

In [None]:
# 最初の観測値に対するターゲットの予測値
model.predict(features)[0]

In [None]:
# 訓練データに対するモデルのスコアを表示
print(model.score(features, target))

## レシピ13.2　交互作用の影響の取り扱い 


In [None]:
# ライブラリをロード
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.datasets import make_regression

# データをロードし、特徴量を2つに制限
features, target = make_regression(n_samples = 100,
                                   n_features = 2,
                                   n_informative = 2,
                                   n_targets = 1,
                                   noise = 0.2,
                                   coef = False,
                                   random_state = 1)

# 交互作用の項を作成
interaction = PolynomialFeatures(
    degree=3, include_bias=False, interaction_only=True)
features_interaction = interaction.fit_transform(features)

# 線形回帰器を作成
regression = LinearRegression()

# 線形回帰器を訓練
model = regression.fit(features_interaction, target)

In [None]:
# 最初の観測値の特徴量の値を表示
features[0]

In [None]:
# ライブラリをロード
import numpy as np

# 個々の観測値に対して、最初の特徴量値と2つ目の特徴量値を掛け合わせる
interaction_term = np.multiply(features[:, 0], features[:, 1])

In [None]:
# 最初の観測値の交互作用項を表示
interaction_term[0]

In [None]:
# 最初の観測値の値を表示
features_interaction[0]

## レシピ13.3　非線形な関係の学習 


In [None]:
# ライブラリをロード
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.datasets import make_regression

# データをロードして特徴量を1つだけ残す
features, target = make_regression(n_samples = 100,
                                   n_features = 1,
                                   n_informative = 2,
                                   n_targets = 1,
                                   noise = 0.2,
                                   coef = False,
                                   random_state = 1)

# 多項式特徴量x^2とx^3を作成
polynomial = PolynomialFeatures(degree=3, include_bias=False)
features_polynomial = polynomial.fit_transform(features)

# 線形回帰器を作成
regression = LinearRegression()

# 線形回帰器を訓練
model = regression.fit(features_polynomial, target)


In [None]:
# 最初の観測値を表示
features[0]

In [None]:
# 最初の観測値を2乗して得たx^2を表示
features[0]**2

In [None]:
# 最初の観測値を3乗して得たx^3を表示
features[0]**3

In [None]:
# 最初の観測値のx、x^2、x^3の値を表示
features_polynomial[0]

## レシピ13.4　正則化によるバリアンスの低減 


In [None]:
# ライブラリをロード
from sklearn.linear_model import Ridge
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import make_regression

# 特徴量行列とターゲットベクトルを作成
features, target = make_regression(n_samples = 100,
                                   n_features = 3,
                                   n_informative = 2,
                                   n_targets = 1,
                                   noise = 0.2,
                                   coef = False,
                                   random_state = 1)

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# alphaを指定してリッジ回帰器を作成
regression = Ridge(alpha=0.5)

# リッジ回帰を訓練
model = regression.fit(features_standardized, target)

In [None]:
# ライブラリをロード
from sklearn.linear_model import RidgeCV

# 3つのalpha値を指定してリッジ回帰器を作成
regr_cv = RidgeCV(alphas=[0.1, 1.0, 10.0])

# リッジ回帰器を訓練
model_cv = regr_cv.fit(features_standardized, target)

# 係数を表示
model_cv.coef_

In [None]:
# alphaを表示
model_cv.alpha_

## レシピ13.5　Lasso回帰による特徴量削減 


In [None]:
# ライブラリをロード
from sklearn.linear_model import Lasso
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import make_regression

# 特徴量行列とターゲットベクトルを作成
features, target = make_regression(n_samples = 100,
                                   n_features = 3,
                                   n_informative = 2,
                                   n_targets = 1,
                                   noise = 0.2,
                                   coef = False,
                                   random_state = 1)

# 特徴量を標準化
scaler = StandardScaler()
features_standardized = scaler.fit_transform(features)

# alphaを指定してLasso回帰器を作成
regression = Lasso(alpha=0.5)

# Lasso回帰器を訓練
model = regression.fit(features_standardized, target)


In [None]:
# 係数を表示
model.coef_

In [None]:
# alphaを大きくしてLasso回帰器を作成
regression_a10 = Lasso(alpha=10)
model_a10 = regression_a10.fit(features_standardized, target)
model_a10.coef_