# 2. Ridge Regression

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_regression
from sklearn.linear_model import Ridge
# Ridge모델은 linear_model에서 Ridge로 불러올 수 있습니다.

In [None]:
X_multi, y_multi = make_regression(n_samples = 1000, n_features = 30, bias = 10, noise = 50)
X_train, X_test, y_train, y_test = train_test_split(X_multi, y_multi, test_size = 0.3, shuffle = True)

In [None]:
model_Ridge = Ridge().fit(X_train, y_train)

In [None]:
print('weight : \n{}\n\n'.format(model_Ridge.coef_))
print('bias : \n{}'.format(model_Ridge.intercept_))

In [None]:
from sklearn.linear_model import LinearRegression
model_Linear = LinearRegression().fit(X_train, y_train)
model_Linear.coef_

weight를 살펴보면 0에 가깝게 변한 값들을 볼 수 있다.

In [None]:
print('train score : {:.2f}'.format(model_Ridge.score(X_train, y_train)))
print('test score : {:.2f}'.format(model_Ridge.score(X_test, y_test)))

Ridge는 alpha라는 파라미터를 가지고 있다. 기본값은 1.0
최적의 alpha값은 정해진 것이 없고 데이터셋마다 다르다.

In [None]:
model_ridge500 = Ridge(alpha = 500).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ridge500.coef_))
print('bias : \n{}'.format(model_ridge500.intercept_))

In [None]:
print('train score : {:.2f}'.format(model_ridge500.score(X_train, y_train)))
print('test score : {:.2f}'.format(model_ridge500.score(X_test, y_test)))

alpha값을 높이면 0에 가깝게 만들어 훈련 셋의 성능은 나빠지지만 일반화에 도움을 준다.

In [None]:
model_ridge005 = Ridge(alpha = 0.005).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ridge005.coef_))
print('bias : \n{}'.format(model_ridge005.intercept_))

In [None]:
print('train score : {:.2f}'.format(model_ridge005.score(X_train, y_train)))
print('test score : {:.2f}'.format(model_ridge005.score(X_test, y_test)))

반대로 alpha값을 낮추게 되면 제한을 하지 않으므로 선형회귀와 비슷해진다.

In [None]:
# 선형회귀와 비교
from sklearn.linear_model import LinearRegression
hypothesis_multi = LinearRegression()
model_linear_multi = hypothesis_multi.fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_linear_multi.coef_))
print('bias : \n{}'.format(model_linear_multi.intercept_))

In [None]:
print('학습 데이터 점수 : {:.2f}'.format(model_linear_multi.score(X_train, y_train)))
print('검증 데이터 점수 : {:.2f}'.format(model_linear_multi.score(X_test, y_test)))

# 3. Lasso Regression

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_regression
from sklearn.linear_model import Lasso
import numpy as np
# Lasso모델은 linear_model에서 Lasso로 불러올 수 있습니다.

In [None]:
model_lasso = Lasso(alpha=10).fit(X_train, y_train)

In [None]:
print('weight : \n{}\n\n'.format(model_lasso.coef_))
print('bias : \n{}'.format(model_lasso.intercept_))

Lasso의 weight를 살펴보면 Ridge와는 다르게 0으로 가까워지다 못해 0이 되어버린 값들을 살펴볼 수 있다.
lasso에서 alpha의 기본값은 1.0으로 설정되어있다.

In [None]:
print('사용된 특성 수 : {}개'.format(np.sum(model_lasso.coef_ != 0)))
# 100개의 특성중 몇개의 특성을 사용했는지 확인해볼 수 있다.

In [None]:
print('train score : {:.2f}'.format(model_ridge005.score(X_train, y_train)))
print('test score : {:.2f}'.format(model_ridge005.score(X_test, y_test)))

In [None]:
model_lasso005 = Lasso(alpha = 0.05, max_iter = 100000).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_lasso005.coef_))
print('bias : \n{}'.format(model_lasso005.intercept_))

- alpha를 줄이게 되면 가장 낮은 오차를 찾아가는 반복횟수가 늘어야 한다. 그러므로 max_iter라는 파라미터를 증가시켜주면 된다.

In [None]:
print('train score : {:.2f}'.format(model_lasso005.score(X_train, y_train)))
print('test score : {:.2f}'.format(model_lasso005.score(X_test, y_test)))

In [None]:
print('사용된 특성 수 : {}개'.format(np.sum(model_lasso005.coef_ != 0)))

In [None]:
model_lasso50 = Lasso(alpha = 50, max_iter = 1000).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_lasso50.coef_))
print('bias : \n{}'.format(model_lasso50.intercept_))

In [None]:
print('사용된 특성 수 : {}개'.format(np.sum(model_lasso50.coef_ != 0)))

In [None]:
print('train score : {:.2f}'.format(model_lasso50.score(X_train, y_train)))
print('test score : {:.2f}'.format(model_lasso50.score(X_test, y_test)))

- train, test 둘 다 점수가 좋지 않은것을 확인할 수 있다. underfiting되었다고 볼 수 있다.

# 4. Elastic Net

- Elastic Net은 Ridge와 Lasso를 절충한 모델이다.

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_regression
from sklearn.linear_model import ElasticNet

In [None]:
model_ela = ElasticNet().fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ela.coef_))
print('bias : \n{}'.format(model_ela.intercept_))

In [None]:
print('사용된 특성 수 : {}개'.format(np.sum(model_ela.coef_ != 0)))

In [None]:
print('train score : {:.2f}'.format(model_ela.score(X_train, y_train)))
print('test score : {:.2f}'.format(model_ela.score(X_test, y_test)))

In [None]:
model_ela = ElasticNet(alpha = 0.1, l1_ratio = 0.1).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ela.coef_))
print('bias : {}\n\n'.format(model_ela.intercept_))
print('사용된 특성 수 : {}개'.format(np.sum(model_ela.coef_ != 0)))

- alpha = l1(lasso) + l2(ridge)
- l1_ratio = 0 이면 ridge 1 이면 lasso, lasso의 비율을 정해준다.

In [None]:
model_ela = ElasticNet(alpha = 0.1, l1_ratio = 0.9).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ela.coef_))
print('bias : {}\n\n'.format(model_ela.intercept_))
print('사용된 특성 수 : {}개'.format(np.sum(model_ela.coef_ != 0)))

In [None]:
model_ela = ElasticNet(alpha = 1, l1_ratio = 0.1).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ela.coef_))
print('bias : {}\n\n'.format(model_ela.intercept_))
print('사용된 특성 수 : {}개'.format(np.sum(model_ela.coef_ != 0)))

In [None]:
model_ela = ElasticNet(alpha = 1, l1_ratio = 0.9).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ela.coef_))
print('bias : {}\n\n'.format(model_ela.intercept_))
print('사용된 특성 수 : {}개'.format(np.sum(model_ela.coef_ != 0)))

In [None]:
model_ela = ElasticNet(alpha = 10, l1_ratio = 0.1).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ela.coef_))
print('bias : {}\n\n'.format(model_ela.intercept_))
print('사용된 특성 수 : {}개'.format(np.sum(model_ela.coef_ != 0)))

In [None]:
model_ela = ElasticNet(alpha = 10, l1_ratio = 0.9).fit(X_train, y_train)
print('weight : \n{}\n\n'.format(model_ela.coef_))
print('bias : {}\n\n'.format(model_ela.intercept_))
print('사용된 특성 수 : {}개'.format(np.sum(model_ela.coef_ != 0)))

#### 보스턴 주택데이터 예측하기

In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.datasets import load_boston

In [None]:
boston_data = load_boston()

In [None]:
X_data, y_data = boston_data['data'], boston_data['target']

In [None]:
Ridge?

In [None]:
model_linear = LinearRegression()
model_ridge = Ridge(alpha=100)
model_lasso = Lasso(alpha=100)
model_elastic = ElasticNet(alpha=100, l1_ratio=0)

In [None]:
model_linear.fit(X_data, y_data)

In [None]:
model_ridge.fit(X_data, y_data) #alpha = 규제항의 파라미터

In [None]:
model_lasso.fit(X_data, y_data)

In [None]:
model_elastic.fit(X_data, y_data)

In [None]:
model_linear.coef_, model_linear.intercept_
np.sum(np.square(model_linear.coef_))

In [None]:
model_ridge.coef_, model_ridge.intercept_
np.sum(np.square(model_ridge.coef_))

In [None]:
model_lasso.coef_, model_lasso.intercept_

In [None]:
model_elastic.coef_, model_elastic.intercept_