## [作業重點]
使用 Sklearn 中的 Lasso, Ridge 模型，來訓練各種資料集，務必了解送進去模型訓練的**資料型態**為何，也請了解模型中各項參數的意義。

機器學習的模型非常多種，但要訓練的資料多半有固定的格式，確保你了解訓練資料的格式為何，這樣在應用新模型時，就能夠最快的上手開始訓練！

## 練習時間
試著使用 sklearn datasets 的其他資料集 (boston, ...)，來訓練自己的線性迴歸模型，並加上適當的正則化來觀察訓練情形。

## [Summary]

1. 以下程式碼使用sklearn的boston資料集，進行Lasso(L1)與Ridge(L2) regression。
2. 若比較當alpha變大時的狀況，可以看到lasso regression有的特徵係數已經變成0，達到feature selection。Ridge regression則沒有辦法，係數只能趨近於0，無法變成0。

### [Load data]

In [1]:
# 使用 sklearn 資料集 boston
from sklearn.datasets import load_boston
X, y = load_boston(return_X_y=True)
B = load_boston()
# print(B.DESCR)

### [Split data]

In [2]:
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
x_train, x_test, y_train, y_test = train_test_split(X,y,test_size=0.2)

### [Lasso regression]

In [3]:
from sklearn.linear_model import Lasso
reg = Lasso(alpha=0.1)
reg.fit(x_train, y_train)
# 印出訓練後的模型參參數
#print(reg.coef_) 
print(reg.sparse_coef_)

  (0, 0)	-0.12296255264994245
  (0, 1)	0.051911007670823565
  (0, 2)	-0.024591611526973332
  (0, 3)	2.484234237281261
  (0, 5)	3.969787003963485
  (0, 6)	-0.01309451414128302
  (0, 7)	-1.2225384262298624
  (0, 8)	0.28172736308884605
  (0, 9)	-0.012986018297284874
  (0, 10)	-0.7767531411965006
  (0, 11)	0.007436980820442175
  (0, 12)	-0.5679983002571402


In [4]:
# 將測試資料丟進模型得到預測結果
y_pred = reg.predict(x_test)
# 預測值與實際值的差距，使用 MSE
print("Mean squared error: %.2f"
      % mean_squared_error(y_test, y_pred))

Mean squared error: 29.52


In [5]:
reg2 = Lasso(alpha=1)
reg2.fit(x_train, y_train)
print(reg2.sparse_coef_)

  (0, 0)	-0.07973996086206857
  (0, 1)	0.050855659580565316
  (0, 5)	1.1374365417359775
  (0, 6)	0.01990775166593389
  (0, 7)	-0.701510822488798
  (0, 8)	0.2625365800210538
  (0, 9)	-0.013625887893413027
  (0, 10)	-0.7449746454515753
  (0, 11)	0.004891295186663083
  (0, 12)	-0.7612429256651633


In [6]:
y_pred = reg2.predict(x_test)
print("Mean squared error: %.2f"
      % mean_squared_error(y_test, y_pred))

Mean squared error: 28.39


### [Ridge regression]

In [7]:
from sklearn.linear_model import Ridge
reg = Ridge(alpha=0.1)
reg.fit(x_train, y_train)
# 印出訓練後的模型參參數
print(reg.coef_)

[-1.28044089e-01  5.02583562e-02  2.11813311e-02  3.93638054e+00
 -1.47936336e+01  4.11854021e+00 -4.80943974e-03 -1.50166019e+00
  3.12793670e-01 -1.14349411e-02 -9.17502746e-01  7.08820711e-03
 -5.30541525e-01]


In [8]:
# 將測試資料丟進模型得到預測結果
y_pred = reg.predict(x_test)
# 預測值與實際值的差距，使用 MSE
print("Mean squared error: %.2f"
      % mean_squared_error(y_test, y_pred))

Mean squared error: 29.08


In [9]:
reg2 = Ridge(alpha=1)
reg2.fit(x_train, y_train)
print(reg2.coef_)

[-1.27127266e-01  5.09295663e-02 -3.98551887e-03  3.86588991e+00
 -8.66106227e+00  4.14465948e+00 -1.02770762e-02 -1.41145313e+00
  2.96419458e-01 -1.17775650e-02 -8.56268074e-01  7.22725766e-03
 -5.37006440e-01]


In [10]:
y_pred = reg2.predict(x_test)
print("Mean squared error: %.2f"
      % mean_squared_error(y_test, y_pred))

Mean squared error: 29.65
