# 座標降下法
## 参考文献
- スパース推定法による統計モデリング　共立出版 川野秀一・松井秀俊・廣瀬慧　著

## データ
- https://web.stanford.edu/~hastie/StatLearnSparsity_files/DATA/crime.txt

In [296]:
import numpy as np
import scipy.stats
# データの準備
data = np.loadtxt("crime.txt")
X = data[:,2:7]
y = data[:,0]
X = scipy.stats.zscore(X) # 標準化（平均を０、分散を１）
y = y - np.mean(y) # 平均化（平均を０）
# パラメータの準備
lamb = 20.0
beta = np.zeros(len(X[0])) # 回帰係数
n = len(y) # データの個数
p = len(X[0]) #　説明変数の個数（平均化しているので切片は０となっており、数には含めない）

In [297]:
# ソフト閾値関数
def soft_th(x, lamb):
    return np.sign(x) * np.maximum(np.abs(x) - lamb, 0.0)

In [298]:
# アルゴリズム開始
rx = np.zeros(p)
r  = np.zeros((n,p))
for itr in range(1000):
    err = 0.0
    for j in range(p):
        sums = 0.0
        for k in range(p):
            if j != k:
                sums = sums + X[:,k]*beta[k]
        r[:,j] = y - sums
        rx = r[:,j].dot(X[:,j])
        b = soft_th(rx/n,lamb)        
        err = err + (beta[j]-b)**2
        beta[j] = b
    if err < 10**(-15):
        print('繰り返し回数：',itr)
        break
print(beta)

繰り返し回数： 27
[ 132.1489732   -24.95569475   19.27490243    0.            0.        ]
