In [None]:
import numpy as np
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import shapiro, bartlett

# 데이터를 불러온다.
data = pd.read_csv('your_dataset.csv')

# 종속 변수와 독립 변수들을 선택한다.
y = data['Dependent_Variable']
X = data[['Independent_Var1', 'Independent_Var2', 'Independent_Var3']]

# 다중 선형 회귀 모델을 적합시킨다.
X = sm.add_constant(X)  # 절편을 위해 상수항 추가
model = sm.OLS(y, X).fit()

# 회귀 분석 결과를 출력한다.
print(model.summary())

# 잔차 분석
residuals = model.resid

# 잔차의 독립성 확인
# Durbin-Watson 테스트 등을 활용할 수 있음

# 등분산성 확인
plt.scatter(model.fittedvalues, residuals)
plt.xlabel('Fitted Values')
plt.ylabel('Residuals')
plt.title('Residuals vs. Fitted Values')
plt.show()

# 잔차의 정규성 확인
sns.histplot(residuals, kde=True)
plt.title('Residuals Distribution')
plt.show()

# 정규성 검정
shapiro_test = shapiro(residuals)
print("Shapiro-Wilk Test (p-value):", shapiro_test.pvalue)

# 다중공선성 확인
correlation_matrix = X.corr()
plt.figure(figsize=(8, 6))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', linewidths=0.5)
plt.title('Correlation Matrix')
plt.show()

# Bartlett's test를 활용한 등분산성 검정
bartlett_test = bartlett(y, residuals)
print("Bartlett's Test (p-value):", bartlett_test.pvalue)


In [None]:
#릿지 라쏘 확인방법

In [None]:
from sklearn.linear_model import Ridge, Lasso, ElasticNet
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# 데이터를 불러온다.
data = pd.read_csv('your_dataset.csv')

# 종속 변수와 독립 변수들을 선택한다.
y = data['Dependent_Variable']
X = data[['Independent_Var1', 'Independent_Var2', 'Independent_Var3']]

# 데이터를 학습용과 테스트용으로 분리한다.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Ridge 회귀 모델 생성 및 훈련
ridge_model = Ridge(alpha=1.0)  # alpha 값은 조절할 수 있음
ridge_model.fit(X_train, y_train)
ridge_pred = ridge_model.predict(X_test)
ridge_mse = mean_squared_error(y_test, ridge_pred)

# Lasso 회귀 모델 생성 및 훈련
lasso_model = Lasso(alpha=1.0)  # alpha 값은 조절할 수 있음
lasso_model.fit(X_train, y_train)
lasso_pred = lasso_model.predict(X_test)
lasso_mse = mean_squared_error(y_test, lasso_pred)

# Elastic Net 회귀 모델 생성 및 훈련
elasticnet_model = ElasticNet(alpha=1.0, l1_ratio=0.5)  # alpha와 l1_ratio 값은 조절할 수 있음
elasticnet_model.fit(X_train, y_train)
elasticnet_pred = elasticnet_model.predict(X_test)
elasticnet_mse = mean_squared_error(y_test, elasticnet_pred)

# 결과 출력
print("Ridge MSE:", ridge_mse)
print("Lasso MSE:", lasso_mse)
print("Elastic Net MSE:", elasticnet_mse)
