# 안정적 시계열 분석
안정적 시계열은 시간의 흐름에 따라 평균과 분산이 일정하고, 특정 시점 간의 공분산이 시간에 의존하지 않는 시계열을 의미함!<br>
이러한 시계열에 적용하는 기본 모델은 AR, MA, ARMA가 있다

## AR, MA, ARMA
* AR (p) : 자기회귀 모형
    * 현재 시점의 값이 과거 $p$ 시점의 값에 선형적으로 의존하는 모형
    * 자기 상관 함수는 점차 감소, 부분 자기 상관 함수는 $p$ 시점에서 절단됨
* MA (q) : 이동평균 모형
    * 현재 시점의 값이 과거 $q$ 시점의 예측 오차의 선형 결합으로 표현되는 모형
    * PACF는 점차 감소, ACF는 $q$ 시점에서 절단됨

### 전제 조건

AR과 MA 모델을 적용하기 위해서는 데이터의 특성과 모델 구조의 안정성을 고려해야 함

#### 정상성, 가역성
* 정상성 : 시계열 분석의 가장 핵심적인 전제 조건입니다. AR, MA, ARMA 모델을 적용하기 위해서는 시계열이 정상성을 만족<br>
검정 -> ADF/KPSS test

* 가역성 : MA 모형이 AR 모형으로 무한히 표현될 수 있거나, 또는 MA 계열의 예측 오차 $\epsilon_t$가 과거 관측값으로 표현될 수 있는 조건을 의미

* ARMA (p, q) : 자기회귀 이동평균 모형
    * AR 성분과 MA 성분을 결합한 모형
    * ACF와 PACF 모두 점차 감소하며 0에 수렴


# 차수 결정법
시계열 모델(AR, MA, ARMA)에서 최적의 차수($p, q$)를 결정하는 방법

자기 상관 계수 (ACF)
- **ARMA(p, q)모형**에서 사용할 **$q$개의 오차** 결정 방법
- 두 시점 사이의 상관 관계 파악 (**간접 영향까지** 모두 파악)

부분 자기 상관 계수 (PACF)
- **ARMA(p, q) 모형**에서 사용할 **$p$개의 시점** 결정 방법
- 두 시점 사이의 직접적인 영향만 파악


ACF 그래프가 <U>천천히 감소/진동 감소</U> & PACF 그래프가 <U>p+1 시점부터 0에 근접</U>
> AR(p) / (= ARMA(p, 0)) 사용

ACF 그래프가 <U>q+1 시점부터 0에 근접</U> & PACF 그래프가 <U>천천히 감소/진동 감소</U>
> MA(q) / (= ARMA(0, q)) 사용

ACF 그래프가 <U>q+1 시점부터 0에 근접</U> & PACF 그래프가 <U>p+1 시점부터 0에 근접</U>
> ARMA(p, q) 사용

# 불안정 시계열 분석
불안정 시계열 모델은 안정적 시계열 모델(ARMA)에 정상성 확보 과정(차분, 계절성 차분)이 추가된 형태!

## ARIMA
ARMA 모형에 차분 성분을 추가한 모형<br>
불안정한 시계열을 차분($d$)을 통해 안정화(정상화)한 후 ARMA 분석을 적용

## SARIMA
ARIMA 모형에 주기성/계절성(Seasonality)을 나타내는 성분을 추가하여, 주기적인 변동을 갖는 시계열을 분석


# 다변량 시계열 분석

VAR, 벡터 자기회귀 모형 (Vector AutoRegression)	
* 여러 변수가 서로의 과거 값에 의해 영향을 받는 관계를 동시에 모델링
* 모든 변수가 내생 변수입니다.


VECM, 벡터 오차 수정 모형 (Vector Error Correction Model)
* 변수들 간에 공적분 관계가 있을 때 사용
* 장기적인 균형 관계에서 벗어난 오차를 단기적인 움직임에 반영합니다.

# 시계열 딥러닝

## RNN 계열
개념 : 은닉 상태를 통해 이전 시점의 정보를 현재 시점으로 전달하여 시계열의 순차적인 특성을 처리

장점 : 순서가 있는 데이터를 모델링하는 데 가장 기본적인 구조

단점 :

* 장기 의존성 문제 : 시퀀스가 길어지면 초기의 중요한 정보가 손실(기울기 소실)되는 경향이 있음
* 학습 속도 : 순차적으로만 계산 가능하여 병렬 처리가 어렵....
* 변형 : LSTM, GRU는 gate를 도입하여 장기 의존성 문제를 개선함!

## Attention 계열
개념 : 시퀀스의 모든 입력 요소에 대해 가중치를 계산하여, 현재 시점의 예측에 가장 중요한 이전 시점의 정보를 선택적으로 집중하도록 하는 메커니즘

장점 :

* 장기 의존성 해결 : 시퀀스 길이에 관계없이 모든 시점의 정보를 직접 연결하여 장기 의존성 문제를 효과적으로 해결
* 병렬 처리 : 순차적인 RNN 구조와 달리, 트랜스포머 구조에서는 Attention을 사용하여 완벽한 병렬 처리가 가능

## Foundation 모델
개념 : 대규모의 다양한 시계열 데이터셋(예: 수백만 개의 센서 데이터, 금융 데이터)으로 미리 학습되어, 특정 예측 작업에 미세 조정하여 사용할 수 있는 거대한 모델

장점:
* 전이 학습 : 대규모 데이터에서 학습된 일반적인 패턴(예: 추세, 주기)을 새로운 작은 데이터셋에 적용하여 성능을 극대화
* 데이터 효율성 : 레이블된 데이터가 적은 도메인에서도 높은 성능을 달성할 수 있음

단점:
* 계산 비용: 모델의 학습 및 미세 조정에 엄청난 계산 자원과 비용이 필요
* 해석의 어려움: 모델의 규모가 커서 내부 작동 방식이나 예측 근거를 해석하기 어렵