## 규제가 있는 회귀 모델 : boston housing 예제로 간단히 장점을 살펴보자 

* 릿지는 산등성이라는 뜻 : 회귀계수 값을 줄여준다
* 라소는 올가미라는 뜻 : 대부분 0으로 만들어, 유의한 피처를 확실히 구분지어 준다 
* 출처 : 만화로 쉽게 배우는 머신러닝, 27쪽

In [0]:
import pandas as pd 

from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression, Ridge, Lasso, ElasticNet
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.model_selection import train_test_split

In [0]:
boston = load_boston()
X = boston.data
y = boston.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

In [0]:
def model_evaluation(model):
  model.fit(X_train, y_train) 
  y_pred = model.predict(X_test)
  mse = mean_squared_error(y_test, y_pred)
  r2 = r2_score(y_test, y_pred)
  coef_sum = sum(model.coef_**2)
  
  for f, w in zip(boston.feature_names, model.coef_):
    print("{0:7s}: {1:6.2f}".format(f, w))
  print("coef sum : {0:4.2f}".format(coef_sum))
  print("MSE : {0:4.2f}".format(mse))
  print("R^2 : {0:4.2f}".format(r2))
  
  return [coef_sum, mse, r2]

In [0]:
results = []

In [6]:
# 선형회귀
results.append(model_evaluation(LinearRegression()))

CRIM   :  -0.13
ZN     :   0.04
INDUS  :   0.06
CHAS   :   3.24
NOX    : -16.17
RM     :   3.90
AGE    :  -0.01
DIS    :  -1.42
RAD    :   0.23
TAX    :  -0.01
PTRATIO:  -0.93
B      :   0.01
LSTAT  :  -0.55
coef sum : 290.44
MSE : 20.72
R^2 : 0.73


In [7]:
# 릿지 회귀
# model_evaluation(Ridge(alpha=10))
results.append(model_evaluation(Ridge(alpha=1.0)))

CRIM   :  -0.12
ZN     :   0.04
INDUS  :   0.02
CHAS   :   3.03
NOX    :  -8.05
RM     :   3.91
AGE    :  -0.02
DIS    :  -1.30
RAD    :   0.22
TAX    :  -0.01
PTRATIO:  -0.84
B      :   0.01
LSTAT  :  -0.57
coef sum : 92.03
MSE : 21.16
R^2 : 0.72


In [8]:
# 라소 회귀
#model_evaluation(Lasso(alpha=2.0))
results.append(model_evaluation(Lasso(alpha=0.1)))

CRIM   :  -0.12
ZN     :   0.04
INDUS  :  -0.00
CHAS   :   1.63
NOX    :  -0.00
RM     :   3.73
AGE    :  -0.02
DIS    :  -1.14
RAD    :   0.21
TAX    :  -0.01
PTRATIO:  -0.75
B      :   0.01
LSTAT  :  -0.61
coef sum : 18.86
MSE : 22.00
R^2 : 0.71


In [9]:
results.append(model_evaluation(ElasticNet(alpha=0.1, l1_ratio=0.7)))

CRIM   :  -0.12
ZN     :   0.04
INDUS  :  -0.00
CHAS   :   1.44
NOX    :  -0.00
RM     :   3.46
AGE    :  -0.02
DIS    :  -1.15
RAD    :   0.22
TAX    :  -0.01
PTRATIO:  -0.77
B      :   0.01
LSTAT  :  -0.63
coef sum : 16.42
MSE : 22.05
R^2 : 0.71


In [10]:
idx = ['LinearRegression', 'Ridge', 'Lasso', 'ElasticNet']
col = ['회귀계수제곱합', 'MSE', 'R_Square']
df = pd.DataFrame(results, columns=col, index=idx)
df

Unnamed: 0,회귀계수제곱합,MSE,R_Square
LinearRegression,290.439793,20.724023,0.726157
Ridge,92.028855,21.159333,0.720405
Lasso,18.857107,22.002099,0.709269
ElasticNet,16.420694,22.045195,0.708699


## 릿지, 라소, 엘라스틱넷 등 규제가 있는 회귀의 장점

* 회귀계수 값을 작게 하여, 입력 피처의 작은 변동으로도 결과값이 크게 변하는 요소를 줄여줌 : 학습데이터의 오버피팅을 줄여주는 효과
* 타겟값에 영향이 큰 피처로 압축하는 효과 : 설명력 
* boston housing 데이터 결론 : 규제가 있는 회귀는 선형회귀 대비 회귀계수 값을 대폭 줄여주는 반면, MSE와 R Square는 큰 차이를 보이지 않았음