## [作業重點]
使用 Sklearn 中的 Lasso, Ridge 模型，來訓練各種資料集，務必了解送進去模型訓練的**資料型態**為何，也請了解模型中各項參數的意義。

機器學習的模型非常多種，但要訓練的資料多半有固定的格式，確保你了解訓練資料的格式為何，這樣在應用新模型時，就能夠最快的上手開始訓練！

## 練習時間
試著使用 sklearn datasets 的其他資料集 (boston, ...)，來訓練自己的線性迴歸模型，並加上適當的正則化來觀察訓練情形。

In [1]:
# import套件
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets,linear_model
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error,mean_squared_error,r2_score

In [2]:
# 讀取boston房價資料集
boston = datasets.load_boston()
print(boston.data.shape)
print(type(boston.data))
print(boston.target.shape)
print(type(boston.target))

(506, 13)
<class 'numpy.ndarray'>
(506,)
<class 'numpy.ndarray'>


In [3]:
# 切分資料集:
x_train, x_test, y_train, y_test = train_test_split(boston.data,boston.target,test_size=0.3,random_state=42)

## Lasso

In [4]:
# alpha值設定
n_alphas =21
alphas = np.logspace(-10,10,n_alphas)
print(alphas)

[1.e-10 1.e-09 1.e-08 1.e-07 1.e-06 1.e-05 1.e-04 1.e-03 1.e-02 1.e-01
 1.e+00 1.e+01 1.e+02 1.e+03 1.e+04 1.e+05 1.e+06 1.e+07 1.e+08 1.e+09
 1.e+10]


In [5]:
# 初始化一個Lasso regression
Lare = linear_model.Lasso(fit_intercept=False)
# 參數矩陣
coefs = []
# 根據不同的alphas訓練出不同的參數模型
for i in alphas:
    Lare.set_params(alpha=i)
    Lare.fit(x_train,y_train)
    coefs.append(Lare.coef_)
    print("alpha 為 {} mse:{}".format(i,mean_squared_error(y_test,Lare.predict(x_test))))
print(coefs)

alpha 為 1e-10 mse:24.868110456723876
alpha 為 1e-09 mse:24.868110460990795
alpha 為 1e-08 mse:24.868110503659725
alpha 為 1e-07 mse:24.868110930352003
alpha 為 1e-06 mse:24.868115197575683
alpha 為 1e-05 mse:24.868157899872603
alpha 為 0.0001 mse:24.868587928895426
alpha 為 0.001 mse:24.873229801566133
alpha 為 0.01 mse:24.927746524719755
alpha 為 0.1 mse:24.988183059861107
alpha 為 1.0 mse:28.1802936885828
alpha 為 10.0 mse:57.07563498676674
alpha 為 100.0 mse:75.47642312786566
alpha 為 1000.0 mse:76.31172051697722
alpha 為 10000.0 mse:532.811052631579
alpha 為 100000.0 mse:532.811052631579
alpha 為 1000000.0 mse:532.811052631579
alpha 為 10000000.0 mse:532.811052631579
alpha 為 100000000.0 mse:532.811052631579
alpha 為 1000000000.0 mse:532.811052631579
alpha 為 10000000000.0 mse:532.811052631579
[array([-0.1198444 ,  0.03835321,  0.03804869,  3.05965051, -2.09541141,
        5.8434006 , -0.01508115, -0.91904701,  0.11697476, -0.00608493,
       -0.42826635,  0.01663971, -0.46638625]), array([-0.1198444 

  positive)
  positive)
  positive)
  positive)
  positive)
  positive)
  positive)


alpha 越大，就有越多項係數變成0的趨勢，但不一定模型會越好，可以看到mse變大，可能就是underfitting。

## Ridge

In [6]:
# alpha設定
n_alphas= 21 
alphas = np.logspace(-10,10,n_alphas)
alphas

array([1.e-10, 1.e-09, 1.e-08, 1.e-07, 1.e-06, 1.e-05, 1.e-04, 1.e-03,
       1.e-02, 1.e-01, 1.e+00, 1.e+01, 1.e+02, 1.e+03, 1.e+04, 1.e+05,
       1.e+06, 1.e+07, 1.e+08, 1.e+09, 1.e+10])

In [7]:
# 初始化模型
Rire = linear_model.Ridge()
# 係數矩陣
coefs =[]

for i in alphas:
    Rire.set_params(alpha=i)
    Rire.fit(x_train,y_train)
    coefs.append(Rire.coef_)
    print("alpha 為 {} MSE:{}".format(i,mean_squared_error(y_test,Rire.predict(x_test))))
print(coefs)

alpha 為 1e-10 MSE:21.5174442312449
alpha 為 1e-09 MSE:21.517444231853542
alpha 為 1e-08 MSE:21.517444237939976
alpha 為 1e-07 MSE:21.517444298804364
alpha 為 1e-06 MSE:21.517444907448233
alpha 為 1e-05 MSE:21.517450993893338
alpha 為 0.0001 MSE:21.51751185896815
alpha 為 0.001 MSE:21.518120571402402
alpha 為 0.01 MSE:21.524213182006534
alpha 為 0.1 MSE:21.585115915024293
alpha 為 1.0 MSE:22.044053089861002
alpha 為 10.0 MSE:22.69533504291413
alpha 為 100.0 MSE:23.46836921620301
alpha 為 1000.0 MSE:27.100378166370252
alpha 為 10000.0 MSE:34.71267667283183
alpha 為 100000.0 MSE:47.3287998907359
alpha 為 1000000.0 MSE:53.62046702111352
alpha 為 10000000.0 MSE:60.23335134980916
alpha 為 100000000.0 MSE:73.12123067045427
alpha 為 1000000000.0 MSE:76.644574738863
alpha 為 10000000000.0 MSE:77.0524818542377
[array([-1.33470103e-01,  3.58089136e-02,  4.95226452e-02,  3.11983512e+00,
       -1.54170609e+01,  4.05719923e+00, -1.08208352e-02, -1.38599824e+00,
        2.42727340e-01, -8.70223437e-03, -9.10685208e-01,

alpha 越大，就有越多項係數逼近0但不是0，但不一定模型會越好，可以看到mse變大，可能就是underfitting。