## 조절변수(control variable)

In [None]:
# 통계분석에서 조절변수(control variable) 또는 공변량(covariate)은 
# 연구 설계에서 주요 관심 변수의 효과를 명확하게 파악하기 위해 통제되는 변수 
# 조절변수는 연구 결과에 영향을 줄 수 있는 외부 요인을 통제함으로써, 
# 주요 독립변수와 종속변수 사이의 관계를 더 정확하게 이해하고 해석할 수 있도록 돕는다.

In [None]:
# 회귀분석을 통해 주식 수익률에 대한 특정 독립변수(예: 광고 지출)의 영향을 분석하면서,
# 시장 변동성과 같은 조절변수의 효과를 함께 고려

In [1]:
import pandas as pd
import statsmodels.api as sm

# 가상의 데이터 생성
data = {
    'stock_return': [0.05, 0.02, 0.04, 0.03, 0.05, 0.06, 0.07, 0.04, 0.03, 0.05],
    'ad_spend': [200, 150, 300, 250, 500, 400, 350, 300, 450, 500],
    'market_volatility': [0.1, 0.15, 0.12, 0.1, 0.2, 0.18, 0.16, 0.14, 0.2, 0.19]
}

df = pd.DataFrame(data)

# 독립변수와 종속변수 정의
X = df[['ad_spend', 'market_volatility']]  # 독립변수에 광고 지출과 시장 변동성 포함
y = df['stock_return']

# 상수항 추가
X = sm.add_constant(X)

# OLS 회귀 모델 적합
model = sm.OLS(y, X).fit()

# 결과 출력
print(model.summary())


                            OLS Regression Results                            
Dep. Variable:           stock_return   R-squared:                       0.223
Model:                            OLS   Adj. R-squared:                  0.001
Method:                 Least Squares   F-statistic:                     1.003
Date:                Sat, 06 Apr 2024   Prob (F-statistic):              0.414
Time:                        14:02:49   Log-Likelihood:                 29.558
No. Observations:                  10   AIC:                            -53.12
Df Residuals:                       7   BIC:                            -52.21
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
                        coef    std err          t      P>|t|      [0.025      0.975]
-------------------------------------------------------------------------------------
const                 0.0364      0.02



In [2]:
import pandas as pd
import statsmodels.api as sm

# 가상의 데이터 생성
data = {
    'stock_return': [0.05, 0.02, 0.04, 0.03, 0.05, 0.06, 0.07, 0.04, 0.03, 0.05],
    'ad_spend': [200, 150, 300, 250, 500, 400, 350, 300, 450, 500]
   }

df = pd.DataFrame(data)

# 독립변수와 종속변수 정의
X = df[['ad_spend']]  # 독립변수에 광고 지출
y = df['stock_return']

# 상수항 추가
X = sm.add_constant(X)

# OLS 회귀 모델 적합
model = sm.OLS(y, X).fit()

# 결과 출력
print(model.summary())


                            OLS Regression Results                            
Dep. Variable:           stock_return   R-squared:                       0.174
Model:                            OLS   Adj. R-squared:                  0.071
Method:                 Least Squares   F-statistic:                     1.687
Date:                Sat, 06 Apr 2024   Prob (F-statistic):              0.230
Time:                        14:05:41   Log-Likelihood:                 29.254
No. Observations:                  10   AIC:                            -54.51
Df Residuals:                       8   BIC:                            -53.90
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const          0.0265      0.014      1.861      0.1

