# 라쏘 회귀, 릿지 회귀(선형 모델을 이용한 지도 학습)

## Regularization: SGDRegressor, LogisticRegression의 penalty(정규화 텀) -> 과대 적합 방지, 성능 개선
### 과대 적합(오차 = 편향 + 분산): 편향은 낮고 분산은 크다
- 편향(bias): 학습된 모델의 예측값이 평균적으로 얼마나 틀린지
- 분산(variance): 학습된 모델의 예측값이 얼마나 다른지

### L1 정규화
- norm: 좌표 평면의 원점으로부터의 거리를 나타내어 벡터의 크기 측정
- 학습 모델이 복잡해지지 않도록 가설 함수의 L1 norm을 손실 함수에 추가 -> 복잡도가 커지지 않도록 함
### L2 정규화
- 학습 모델이 복잡해지지 않도록 가설 함수의 L2 norm을 손실 함수에 추가 -> 복잡도가 커지지 않도록 함

### 라쏘 회귀
- 선형 회귀 + L1 정규화
- 가설 함수(선형)의 계수에 대해 L1 norm을 추가하여 복잡해지지 않도록 함
- penalty 정도를 조절해주어야 함 (하이퍼파라미터)

### 릿지 회귀
- 선형 회귀 + L2 정규화
- 가설 함수(선형)의 계수에 대해 L2 norm을 추가하여 복잡해지지 않도록 함
- penalty 정도를 조절해주어야 함 (하이퍼파라미터)

In [1]:
from sklearn.linear_model import SGDRegressor
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_diabetes

### diabete 데이터, 선형 회귀 분석

In [None]:
X, y = load_diabetes(return_X_y=True, as_frame=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=1234)
reg = SGDRegressor(penalty=None, max_iter=10000, learning_rate='constant', eta0=0.1, random_state=1234)
reg = reg.fit(X_train, y_train)
print('테스트 데이터셋 R2', reg.score(X_test, y_test))

테스트 데이터셋 R2 0.4824207771430502


### diabete 데이터, Lasso 회귀 분석

In [None]:
X, y = load_diabetes(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=1234)
reg = SGDRegressor(penalty='l1', max_iter=10000, learning_rate='constant', eta0=0.1, alpha=0.001, random_state=1234)
reg = reg.fit(X_train, y_train)
print('테스트 데이터셋 R2', reg.score(X_test, y_test))

테스트 데이터셋 R2 0.4644556121085929


### diabete 데이터, Ridge 회귀 분석

In [4]:
X, y = load_diabetes(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=1234)
reg = SGDRegressor(penalty='l2', max_iter=10000, learning_rate='constant', eta0=0.1, alpha=0.0001, random_state=1234)
reg = reg.fit(X_train, y_train)
print('테스트 데이터셋 R2', reg.score(X_test, y_test))

테스트 데이터셋 R2 0.4641548869505083
