In [None]:
# ライブラリのインストール
!pip install mglearn

In [1]:
# 線形回帰モデルの実装

# ①必要なライブラリのインポート
from sklearn import linear_model
from sklearn.model_selection import train_test_split
from mglearn.datasets import load_extended_boston

# ②データを読み込み、特徴量Xと目的変数yに分ける
X, y = load_extended_boston()

# ③データセットを訓練データとテストデータに分割(default設定で25%がテストに)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

# ④線形回帰モデルを適用する
lm = linear_model.LinearRegression()
lm.fit(X_train, y_train)
print(f'coef: {lm.coef_[:4]}') # 先頭4個の重みパラメータの表示
print(f'intercept: {lm.intercept_:.2f}') # バイアスパラメータの表示

# ⑤訓練データとテストデータでモデルを評価
print(f'Train score: {lm.score(X_train, y_train):.2f}')
print(f'Test score: {lm.score(X_test, y_test):.2f}')

coef: [-402.75223586  -50.07100112 -133.31690803  -12.00210232]
intercept: 31.65
Train score: 0.95
Test score: 0.61


In [2]:
# L2正則化(Ridge回帰)の実装

# ①必要なライブラリのインポート
from sklearn import linear_model
from sklearn.model_selection import train_test_split
from mglearn.datasets import load_extended_boston

# ②データを読み込み、特徴量Xと目的変数yに分ける
X, y = load_extended_boston()

# ③データセットを訓練データとテストデータに分割(default設定で25%がテストに)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

# ④L2正則化（Ridge回帰）を適用する
ridge = linear_model.Ridge()
ridge.fit(X_train, y_train)
print(f'coef: {ridge.coef_[:4]}') # 先頭4個の重みパラメータの表示
print(f'intercept: {ridge.intercept_:.2f}') # バイアスパラメータの表示

# ⑤訓練データとテストデータでモデルを評価
print(f'Train score: {ridge.score(X_train, y_train):.2f}')
print(f'Test score: {ridge.score(X_test, y_test):.2f}')

coef: [-1.45195306 -1.55625501 -1.45850339 -0.12825304]
intercept: 21.42
Train score: 0.89
Test score: 0.75


In [3]:
# L1正則化(Lasso)の実装

# ①必要なライブラリのインポート
import numpy as np
from sklearn import linear_model
from sklearn.model_selection import train_test_split
from mglearn.datasets import load_extended_boston

# ②データを読み込み、特徴量Xと目的変数yに分ける
X, y = load_extended_boston()

# ③データセットを訓練データとテストデータに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

# ④L1正則化(Lasso)モデルを適用する
lasso = linear_model.Lasso(alpha=0.01, max_iter=10000)
lasso.fit(X_train, y_train)
print(f'Number of nonzero parameters: {np.count_nonzero(lasso.coef_)}')

# ⑤訓練データとテストデータでモデルを評価
print(f'Train score:{lasso.score(X_train, y_train):.2f}')
print(f'Test score:{lasso.score(X_test, y_test):.2f}')

Number of nonzero parameters: 33
Train score:0.90
Test score:0.77
