### 단위근 검정(Unit Root Test)

단위근 검정은 시계열 데이터가 정상성(Stationarity)을 만족하는지 검증하는 통계적 방법입니다. 

비정상성을 가진 데이터는 평균이나 분산이 시간에 따라 변하며, 분석 및 예측 모델링에 적합하지 않을 수 있습니다. 
    
    단위근 검정은 데이터가 정상 시계열인지, 비정상 시계열인지 판단하는 데 필수적입니다.

###  Augmented Dickey-Fuller (ADF) Test

In [1]:
from statsmodels.tsa.stattools import adfuller
import numpy as np
import pandas as pd

# 데이터 생성 (비정상 데이터)
np.random.seed(42)
data = np.cumsum(np.random.normal(0, 1, 100))  # 누적합 데이터 (랜덤 워크)
df = pd.Series(data)

# ADF 테스트 수행
result = adfuller(df)
print("ADF Statistic:", result[0])
print("p-value:", result[1])
print("Critical Values:", result[4])

# 결과 해석
if result[1] < 0.05:
    print("귀무가설 기각: 데이터는 단위근이 없습니다 (정상성).")
else:
    print("귀무가설 채택: 데이터는 단위근이 있습니다 (비정상성).")


ADF Statistic: -1.3583317659818985
p-value: 0.6020814791099101
Critical Values: {'1%': -3.498198082189098, '5%': -2.891208211860468, '10%': -2.5825959973472097}
귀무가설 채택: 데이터는 단위근이 있습니다 (비정상성).


In [None]:
# p-값이 0.05보다 작으면 귀무가설을 기각 → 데이터는 정상성을 가진다.

# p-값이 0.05보다 크면 귀무가설을 채택 → 데이터는 단위근을 가진다 (비정상성).

### Phillips-Perron (PP) Test

In [3]:
# 필요한 라이브러리 설치 (arch)
# pip install arch

from arch.unitroot import PhillipsPerron
import numpy as np
import pandas as pd

# 1. 데이터 생성 (비정상 데이터)
np.random.seed(42)
data = np.cumsum(np.random.normal(0, 1, 100))  # 랜덤 워크 데이터 (누적합)
df = pd.Series(data)

# 2. Phillips-Perron 테스트 수행
pp_test = PhillipsPerron(df)
print("Phillips-Perron Test Statistic:", pp_test.stat)
print("p-value:", pp_test.pvalue)
print("Critical Values:", pp_test.critical_values)

# 결과 해석
if pp_test.pvalue < 0.05:
    print("귀무가설 기각: 데이터는 단위근이 없습니다 (정상성).")
else:
    print("귀무가설 채택: 데이터는 단위근이 있습니다 (비정상성).")


Phillips-Perron Test Statistic: -1.3110251324578213
p-value: 0.6241133288275903
Critical Values: {'1%': -3.498198082189098, '5%': -2.891208211860468, '10%': -2.5825959973472097}
귀무가설 채택: 데이터는 단위근이 있습니다 (비정상성).


p-value 해석:

p-값 < 0.05 → 데이터는 정상성을 만족.

p-값 ≥ 0.05 → 데이터는 비정상성을 가짐.

### KPSS Test

In [4]:
from statsmodels.tsa.stattools import kpss

# KPSS 테스트 수행
result_kpss = kpss(df, regression="c")
print("KPSS Statistic:", result_kpss[0])
print("p-value:", result_kpss[1])
print("Critical Values:", result_kpss[3])

# 결과 해석
if result_kpss[1] < 0.05:
    print("귀무가설 기각: 데이터는 정상성이 없습니다 (비정상성).")
else:
    print("귀무가설 채택: 데이터는 정상성을 만족합니다.")


KPSS Statistic: 1.2573035522875027
p-value: 0.01
Critical Values: {'10%': 0.347, '5%': 0.463, '2.5%': 0.574, '1%': 0.739}
귀무가설 기각: 데이터는 정상성이 없습니다 (비정상성).


look-up table. The actual p-value is smaller than the p-value returned.

  result_kpss = kpss(df, regression="c")


p-값이 0.05보다 작으면 귀무가설을 기각 → 데이터는 정상성을 만족하지 않는다.

p-값이 0.05보다 크면 귀무가설을 채택 → 데이터는 정상성을 만족한다.