## 다항회귀
> 선형회귀의 경우 설명변수와 종속변수의 관계를 선형관계로 해석하지만 현실 문제는 선형으로 해결이 불가능한 경우가 많습니다.  
선형모델의 구조적 한계를 보완하고자 **변수 간 영향력에 해당하는 새로운 변수를 생성**하여 방정식을 비선형으로 만들고 선형모델을 적용시킬 수 있습니다.  
2차원 예시 $x_1, x_2, x_3$를 $x_1^2, x_2^2, x_3^2, x_1x_2, x_1x_3, x_2x_3$으로 변환하여 변수를 확장.  
보통 2차원 또는 3차원까지 적용하며, 변수가 많아지므로 Ridge, Lasso 모델을 적용한다.

### 다항회귀 실습

In [None]:
# 필요모델 import
from sklearn.preprocessing import PolynomialFeatures

In [None]:
# 다항변수 제작함수 인스턴스화
poly = PolynomialFeatures(degree=2, include_bias=False)
'''
파라메터
degree=2 : 차수설정
include_bias=False : 상수항 제거(필수)
'''

In [None]:
# 변수 변환
# X_train에 해당하는 변수를 학습과 동시에 적용
# 설명변수의 갯수, 설명변수 이름 학습
poly_X_train = poly.fit_transform(X_train)

In [None]:
# shape 확인
poly_X_train.shape

In [None]:
# 변환식 반환
poly.get_feature_names_out()

In [None]:
# 데이터프레임으로 값을 확인 시 최대 표시 설정 옵션 설정
pd.options.display.max_columns= 150

In [None]:
# 데이터프레임으로 제작 후 데이터 확인
pd.DataFrame(poly_X_train, columns=poly.get_feature_names_out())

In [None]:
# test 데이터 동일한 모델로 적용
poly_X_test = poly.transform(X_test)

In [None]:
# 모델 정의
from sklearn.linear_model import Lasso

In [None]:
# 모델 학습
lasso = Lasso()
lasso.fit(poly_X_train, y_train)

In [None]:
# 모델 예측
lasso_pred = lasso.predict(poly_X_test)

In [None]:
# 모델 평가
print(f'R2 score : {r2_score(y_test, lasso_pred)}')
print(f'RMSE : {mean_squared_error(y_test, lasso_pred, squared=False)}')
print(f'MAE : {mean_absolute_error(y_test, lasso_pred)}')

In [None]:
# 모델 계수 확인
lasso.coef_

In [None]:
# 계수 플로팅
plt.figure(figsize=(10, 20))
plt.barh(poly.get_feature_names_out(), lasso.coef_)
plt.show()

In [None]:
# 다항회귀는 예측력이 최우선인 프로젝트에 사용.
# 베타 분석이 들어가면 해석이 어려워짐, 설득도 어려워짐