# スパース学習

## ライブラリなど読み込み

In [None]:
import numpy as np               
import matplotlib.pyplot as plt  

## スパース回帰分析

## データ生成

In [None]:
n = 30       # データ数
d = 50       # パラメータの次元
s = 10       # パラメータの非ゼロ要素数

# データ生成
w = np.r_[np.ones(s), np.zeros(d-s)]
X = np.random.randn(n,d)
y = np.dot(X,w) + np.random.normal(scale=0.1,size=n)

In [None]:
# 係数ベクトル w のプロット
plt.bar(np.arange(d),w); plt.show()

## Lasso(ラッソ)
sklearn.linear_model.Lasso

In [None]:
# モジュール読み込み
from sklearn import linear_model

In [None]:
# Lasso
la = linear_model.Lasso(alpha=1/n)
la.fit(X,y)

In [None]:
# プロット：ラッソによる推定結果
plt.bar(np.arange(d),la.coef_); plt.ylim(-0.5, 1.2); plt.show()

## 参考：リッジ回帰

In [None]:
# リッジ回帰
ri = linear_model.Ridge(alpha=1)
ri.fit(X,y)

In [None]:
# プロット：リッジ回帰による推定結果
plt.bar(np.arange(d),ri.coef_); plt.ylim(-0.5, 1.2); plt.show()

## ラッソの交差検証法
sklearn.linear_model.LassoCV

In [None]:
cvl = linear_model.LassoCV(cv=5)
cvl.fit(X, y)

In [None]:
# 選択された alpha
cvl.alpha_

In [None]:
# プロット：推定された回帰係数 (coef_)
plt.bar(np.arange(d),cvl.coef_); plt.ylim(-0.5, 1.2); plt.show()

## エラスティック・ネット

## データ生成

In [None]:
n, d, s = 100, 200, 20     # 設定：データ数， 次元
w = np.r_[np.ones(s), np.zeros(d-s)] + np.random.normal(scale=0.2,size=d)
# データ生成
X = np.random.randn(n,d)
y = np.dot(X, w) + np.random.normal(scale=0.01,size=n)

In [None]:
# 係数ベクトル w のプロット
plt.bar(np.arange(d), w); plt.ylim(-0.5, 2); plt.show()

## エラスティックネット
- sklearn.linear_model.ElasticNet

In [None]:
er = linear_model.ElasticNet(alpha=0.1, l1_ratio=0.5)    # モデル設定 
er.fit(X,y)               # データを学習

## 推定結果

In [None]:
print("非ゼロ要素数/d： ",np.sum(er.coef_ != 0)/d)
plt.bar(np.arange(d), er.coef_); plt.ylim(-0.5, 2); plt.show()

## 参考：ラッソ  (l1_ratio=1)

In [None]:
er = linear_model.ElasticNet(alpha=0.1, l1_ratio=1).fit(X,y)    # モデル設定・学習

print("非ゼロ要素数/d： ",np.sum(er.coef_ != 0)/d)
plt.bar(np.arange(d), er.coef_); plt.ylim(-0.5, 2); plt.show()

##  エラスティックネットの交差検証法
- sklearn.linear_model.ElasticNetCV

In [None]:
# l1_ratio の候補
rs = np.arange(0.05,1,0.05)
rs
# alpha の候補は自動的に設定

In [None]:
# エラスティックネットの交差検証法
cver = linear_model.ElasticNetCV(cv=5, l1_ratio=rs) 
cver.fit(X,y)

## 最適な正則化パラメータ

In [None]:
cver.l1_ratio_

In [None]:
cver.alpha_

## プロット：推定された回帰係数

In [None]:
print("非ゼロ要素数/d： ",np.sum(cver.coef_ != 0)/d)
plt.bar(np.arange(d), cver.coef_); plt.ylim(-0.5, 2); plt.show()

## 参考：ラッソの結果

In [None]:
cvl = linear_model.LassoCV(cv=5).fit(X,y)  # alphaを適当に設定．CVで選択

print("非ゼロ要素数/d： ", np.sum(cvl.coef_ != 0)/d)
plt.bar(np.arange(d), cvl.coef_); plt.ylim(-0.5, 2); plt.show()