In [7]:
import mglearn
import numpy as np

In [5]:
from sklearn.model_selection import train_test_split
X, y = mglearn.datasets.load_extended_boston()
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

In [8]:
'''
Lasso
・L1正規化を行い、リッジ回帰同様係数が０になるように制約する。
・特徴量の中のいくつかの係数が０になるのが特徴。
　→その特徴量を完全に無視することを意味する。自動的に特徴量が選択されていると言える。
 →どの特徴量が重要なのかがわかるため、モデルを理解しやすい。
'''

# 訓練セットとテストセットどちらに対しても性能が悪い→適合不足

from sklearn.linear_model import Lasso

lasso = Lasso().fit(X_train, y_train)
print("Training set score: {:.2f}".format(lasso.score(X_train, y_train)))
print("Test set score: {:.2f}".format(lasso.score(X_test, y_test)))

# 傾きがゼロでない→特徴量として使用したということ
print("Number of feature used: {}".format(np.sum(lasso.coef_ != 0)))

Training set score: 0.29
Test set score: 0.21
Number of feature used: 4


In [9]:
# リッジ同様alphaパラメータがある
# 適合不足を修正するために、alphaを小さくする（その場合、仕様上max_iterパラメータを増やす必要がある）

lasso001 = Lasso(alpha=0.01, max_iter=100000).fit(X_train, y_train)
print("Training set score: {:.2f}".format(lasso001.score(X_train, y_train)))
print("Test set score: {:.2f}".format(lasso001.score(X_test, y_test)))
print("Number of features used: {}".format(np.sum(lasso001.coef_ != 0)))

Training set score: 0.90
Test set score: 0.77
Number of features used: 33


In [10]:
# alphaを小さくしすぎると、リッジと同様に正規化の効果が薄れ、過剰適合となる。

lasso00001 = Lasso(alpha=0.0001, max_iter=100000).fit(X_train, y_train)
print("Training set score: {:.2f}".format(lasso00001.score(X_train, y_train)))
print("Test set score: {:.2f}".format(lasso00001.score(X_test, y_test)))
print("Number of features used: {}".format(np.sum(lasso00001.coef_ != 0)))

Training set score: 0.95
Test set score: 0.64
Number of features used: 96
