In [17]:
from sklearn.datasets import fetch_california_housing                       # 데이터
from sklearn.preprocessing import StandardScaler                            # z-score
from sklearn.model_selection import KFold, cross_val_score, GridSearchCV    # KFold: 교차검증 라이브러리 / GridSearch: 탐색 이론 / GridSearchCV: 하이퍼 파라미터가 Kfold를 통해 계산된 값을 통함
from sklearn.linear_model import Ridge, Lasso
import numpy as np

# K-fold

In [3]:
X, y = fetch_california_housing(return_X_y=True)

In [4]:
# 정규화 - Zcore
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

In [5]:
# 모델 정의
ridge = Ridge(alpha=0.5)
lasso = Lasso(alpha=0.5)

In [6]:
# k-fold 설정
kf = KFold(n_splits=5, shuffle=True, random_state=40)

In [10]:
# 성능 평가
ridge_score = cross_val_score(ridge, X_scaled, y, cv=kf, scoring='r2')
lasso_score = cross_val_score(lasso, X_scaled, y, cv=kf, scoring='r2')

In [11]:
# 결과 출력
print("Ridge: ", ridge_score)
print("Lasso: ", lasso_score)

Ridge:  [0.60757443 0.56774215 0.61562659 0.60829511 0.62288943]
Lasso:  [0.27814871 0.28281175 0.29193695 0.2825222  0.29102031]


# Grid Search

In [12]:
param_grid = {
    'alpha': [0.01, 0.1, 0.5, 1, 10, 100]
    }

In [13]:
# Ridge 모델 그리드 서치
ridge_grid = GridSearchCV(Ridge(), param_grid, scoring='r2', cv=kf)
ridge_grid.fit(X_scaled, y)

In [14]:
# Lasso 모델 그리드 서치
lasso_grid = GridSearchCV(Lasso(), param_grid, scoring='r2', cv=kf)
lasso_grid.fit(X_scaled, y)

In [15]:
# 결과 출력
print("Ridge 최적 alpha: ", ridge_grid.best_params_['alpha'])
print("Ridge R제곱 점수: ", ridge_grid.best_score_)

Ridge 최적 alpha:  10
Ridge R제곱 점수:  0.6044478621111038


In [16]:
# 결과 출력
print("Lasso 최적 alpha: ", lasso_grid.best_params_['alpha'])
print("Lasso R제곱 점수: ", lasso_grid.best_score_)

Lasso 최적 alpha:  0.01
Lasso R제곱 점수:  0.6010918340063588
