In [15]:
# econometrics5 pg.156,159
# ARMA 모형의 안정성 조건: 고유값 벡터 |람다| < 1 일 것 (AR의 안정성 조건과 동일)
# -AR안정성조건과 동일한 이유:
#  AR의 경우 계수의 해가 unit circle 안에 존재하는지 여부인 반면
#  MA의 경우는 차수가 유한하기만 하다면 유한차수에 대한 MA모형은 항상 안정적이므로
#  ARMA의 경우 AR 안정성조건만 만족한다면 안정적 
# 분산과 공분산은 안정성 조건이 만족되면 유한한 값을 가지며,
# 자기상관함수도 장기에 0으로 수렴함

In [16]:
# """
# Econometrics5 pg.160
# ARIMA모형: ARMA 자료변형한 모형
# 불안정 시계열의 경우 ARMA 적용 불가 -> ARMA모형 추정시 예측치가 무한히 발산함
# 추세가 존재하는 경우 시계열자료 차분을 통해 안정적 시계열로 변환 가능
# (ex) ARMA(1,1)에서 Yt_hat이 도출가능한 조건은 ARMA모형이 안정적일 것, 즉 AR(1)의 안정성조건(|alpha|<1)과 동일

# pg.161
# 1차 차분: 세모Yt = Yt - Yt-1
# 차분을 통한 추세제거: 추세가 1차식인 경우(45도직선처럼) 1차 차분하면 추세가 제거됨
# 추세가 2차식인 경우는 2차차분하면 추세가 제거됨 (미분과 마찬가지 원리로)
# 따라서 시계열분석 시 추세가 존재하는 자료의 경우 차분한 자료를 이용하면 안정적 시계열을 통한 추정 및 예측이 가능함
# - 차분의 문제점: 자료가 가지는 고유의 특성이 유실됨(시계열값 그 자체의 특성을 잃어버리고 Yt-Yt-1의 차이만을 정보로 가짐)

# pg.161
# ARIMA: 차분된 자료를 이용해서 이것을 ''다시 원모형으로 돌려서 추정''하는 방법. 즉 적분된 ARMA 모형
# ARIMA(p,d,q): p=ar차수, d=ma차수, q=차분차수
# ex) arma(1,1) -> 1번 차분 -> arima(1,1,1)
# """

In [17]:
# """
# pg.164,165
# BOX-JENKINS 단계적 모형식별 방법

# 1단계: 그래프->데이터 안정화
# - 주어진 data를 이용해 시계열도표를 그려 자료 특징 파악 (안정적인 자료인지 아닌지 파악)
# - 자료가 안정적이지 않은 것으로 판단되면 자료를 안정화(ex. 차분, 계절변동제거, 함수변환(자연로그등))한다음 다시 도표를 그려 자료가 안정적인지 확인

# 2단계: 시계열모형식별(후보군모형 선정)
# - 시계열이 안정화된 것으로 판단되면 ACF와 PACF를 그려서 안정성 판단
# - ACF와 PACF를 보고 적합한 모형의 형태(AR, MA, ARMA 등)와 적절한 차수 선정하여 후보모형군 식별

# 3단계: 추정 및 적정차수 결정
# - 선택한 모형군에 대한 계수 추정 실시 (일반적으로 최우추정법 이용)
# - 정보기준(Information Criteria) 이용하여 적정차수 선택
# - 추정된 모형 중 정보기준에 가장 적합한 모형 선택

# 4단계: white noise check
# - 추정된 모형의 오차항이 white noise 여부 체크
# ex) 오차항에서 시계열상의 패턴(자기상관)이 발견되었다면 추정계수들이 적절하지 않으며 Yt에서 잡혀야할 패턴이 유실되었다고 할수 있음 -> 이 모형의 에측치는 정확하지 않음
# - 정보기준을 만족하는 모형이더라도 오차항이 white noise가 아니면 탈락. -> 이경우 다음 정보기준을 만족하는 모형의 white noise check 실시
# - 정보기준이 최적인 모형 중 white noise check ㅁ나족한 모형을 예측을 위한 모형으로 최종 선택
# - 검정통계량으로는 ''Q통계량'' 사용(추정된 모형의 잔차항을 이용하여 귀무가설 설정(자기상관계수)). 즉 잔차항간 'H0: 공분산=0이다'를 검정
# -    IF 귀무가설 기각: 이 모형은 탈락. 
# -    IF기각X: 이 모형 사용
# - 소표본일 경우 Q통계량의 단점(j가 클수록 사용가능 자료 개수 감소)을 보완한 box-pierce의 Q통계량 사용 권장

# """

In [18]:
# """
# pg.171
# 정보기준 (information criteria, IC)
# - 종속변수 추정의 정확도 측정: 잔차제곱합이 작을수록 유리 -> 잔차크기가 작은 모형=정보량이 우수
# - but 설명변수 수가 많으면 잔차크기 줄어들기 때문에 설명변수 증가에 따른 부분을 정보기준 산정시 감안 (ex. AR(2)>AR(1)보다 당연히 SSE가 더 작으니까)
# - AIC/BSC
# - AIC: Akaike Information Criteria
#     AIC = ln(잔차제곱합의 평균)
# - BSC: Bayes-Schwartz Criteria
# - AIC/BSC 값이 가장 작은 모형을 선택 (값이 낮을수록 정보up)
# - 추정 -> p,q차수선택(정보기준) -> whitenoise check -> 식별

# [정리]
# 자료가 안정적 -> ARMA
# 자료가 안정적X -> ARIMA

# 모형 선택과정:
# (1) ACF/PACF그래프 그려보고, 대략적인 모형들의 차수 선택
# (2) MLE/OLS 등(보통MLE) 추정방법으로 추정
# (3) 정보기준 통해 우수모형 선택
# (4) Q-Test(white noise)
# (5) 통과된 모형을 예측을 위한 최종 시계열 모형으로 사용
# """

In [19]:
# """
# econometrics5 pg. 178
# 단위근(unit root)
# 확률보행과정(random walk process)(|lambda_vector|=1인경우) 은 단위근을 가지는 AR(1)과정
# 단위근 문제는 p>1인 AR(p)과정에서도 나타날 수 있음
# - AR프로세스를 따르는 확률과정의 경우 불안정 시계열을 좀더 명확하게 정의 가능
#     단위근을 가지는 경우는 정확하게 random walk process이므로 이 경우는 불안정 시계열이라고 명확하게 정의 가능
#     즉, ACF/PACF 등을 통해 판단하는게 아니라 좀 더 세부적인 방법(가설검정)을 이용해서 이 프로세스가 단위근이 있는지
#     판단하고 그 판단근거를 통해 이 시계열의 안정성을 좀더 명확하게 판단 가능
# - unit root test: 시계열 안정성 검정의 특수한 형태
#     단위근은 단순히 data graph를 통해서는 식별 불가: 단위근 여부에 대한 가설검정 필요

# econometrics5 pg.181,182
# 단위근 검정
# - 정규분포가 아닌 D.F분포를 이용하여 가설검정 실시
# 1) 추세가 없는 경우: Yt = phi*Yt-1 + e (AR1, no constant)
# 2) 추세가 있는 경우: Yt = u + phi*Yt-1 + e (AR1, with constant)
# - 단위근이 있는 경우 1)과 2)가 서로 다른 분포로 수렴
# - 2)의 경우(명시적으로 추정모형에 추세 반영 - 회귀식에 직접 추세 포함한 경우) 단위근이 좀더 명확하게 표현됨
#     추세가 있는 경우 더 많이 사용되는 추정식
# H0: a=1 (or a1+a2=1 for AR(2)) - 단위근 존재
# H1: a<1 (or a1+a2<1 for AR(2)) - 단위근 없음

# pg.183, 185
# ADF 검정
# - 시계열에 단위근 존재하는 경우 잔차항의 iid과정 파괴됨
# - ADF는 차분된 시계열의 과거항을 포함해서 그 차분항이 어느정도 E_t가 white noise 역할 못하는 부분을 잡아줌
# - (pg.184) 이 때 t-p의 차수결정은 b1, b2...가 유의한 계수가 나타날때 까지만 포함시키면 됨 (유의하지 않은 계수가 나타나면 뒷부분은 포함x)
#     why? 오차항이 white noise가 될 수 있기 위해 포함하는 항들이므로
# - 세모Yt(차분항) 사용, 설명변수에 시계열 차분항 포함(for white noise문제 해결)
# - 세모Yt = phi*Yt-1 + b1세모Yt-1+b2세모Yt-2+....+Et
# H0: a=0 (단위근 존재)
# H1: a<0 (단위근 없음)

# PP Test
# - 오차항이 약종속적(자기상관)이거나 이분산이 존재할 때 사용
# H0: a=0
# H1: a<0
# DF와 가설 같음
# - 자기상관이나 이분산을 일정부분 조정하기 위해 검정통계량 계산시 오차항분산/공분산을 일정부분 조정한 것
# - 자기상관/이분산 없으면 DF검정법과 검정통계량 동일
# - 자기상관/이분산 문제 해결하고 정확한 DF분포를 사용하기 위해 고안된 검정통계량

# KPSS Test
# - 시계열이 random walk의 함수일 때의 가설검정 방법
# - LM검정통계량 사용

# [정리] pg.187
# DF방법 - DF, ADF (수렴분포)
# DF방법 확장 - PP(이분산/자기상관), KPSS(비모수방법)
# """