# 단변량 모델과 다변량 모델
## 1. 다변량과 단변량
- **단변량(Univariate)**: 단일 종속 변수(Y)의 시계열 패턴
  - 예: 일일 전력 소비량 예측  
- **다변량(Multivariate)**: 두 개 이상의 종속 변수(Y) 또는 다수의 독립 변수(X) 간 상호작용을 고려하는 시계열 패턴턴
  - 예: 온도, 습도, 기계 가동률을 활용한 전력 수요 예측  

| 구분 | 단변량 모델 | 다변량 모델 |  
|------|-------------|-------------|  
| **입력 변수** | 단일 시계열 | 다중 시계열 또는 외부 변수(외생 변수) 포함 |  
| **복잡도** | 낮음 (계산 자원 소요 적음) | 높음 (변수 간 상관관계 모델링 필요) |  
| **적용 사례** | 단순 패턴 예측 | 복잡한 시스템의 다차원 상호작용 분석 |  

---


## 2. 주요 모델  

### **2.1. 단변량 예측 모델**  
- **ARIMA/SARIMA**: 시계열의 자기회귀(AR)와 이동평균(MA) 성분을 결합.  
- **Exponential Smoothing**: 최근 관측치에 가중치 부여.  
- **Prophet**: Facebook 개발, 휴일/이상치 자동 처리.  
- **Chronos-forecasting**: Intel의 Analytics Zoo에서 제공하는 시계열 예측 라이브러리로, AutoML 기능을 통해 최적의 하이퍼파라미터와 모델 구조를 자동으로 탐색

### **2.2. 다변량 예측 모델**  
- **VAR(Vector Autoregression)**: 다변량 시계열의 선형 상호작용 모델링.  
- **LSTM with Multiple Inputs**: RNN 기반, 장기 의존성 학습.  
- **TFT(Temporal Fusion Transformer)**: Attention 메커니즘으로 변수 중요
- **TSMixer**: 시계열 데이터를 위한 MLP 기반 모델로, 간단한 구조와 높은 효율성을 제공.  
- **Informer**: Sparse Self-Attention 메커니즘을 활용하여 긴 시계열 데이터의 효율적인 예측 가능.  
- **TSRM (Time-Series Relational Modeling)**: 시계열 데이터 간의 관계를 학습하여 다변량 시계열 예측 성능을 향상.  

---


## 3. 딥러닝 기반 주요 다변량 시계열 모델

### 1. **LSTM with Multiple Inputs**
- **방식**: 재귀 신경망을 통한 장기 의존성 학습  
- **강점**: 시퀀스 길이 유연성  
- **한계**: 계산 비용 대비 정확도 한계  
- **적용 분야**: 에너지 소비 패턴 예측

### 2. **TFT (Temporal Fusion Transformer)**
- **방식**: 어텐션 기반 변수 중요도 가중치 부여  
- **강점**: 이종 피처(정적/동적) 통합 처리  
- **한계**: 1,000+ 변수 시 확장성 저하  
- **적용 분야**: 공급망 수요 예측

### 3. **TSMixer**
- **방식**: 순수 MLP 구조의 시간/특성 혼합 레이어  
- **강점**: 트랜스포머 대비 3배 빠른 추론  
- **한계**: 초장기 예측(1,000+ step) 미흡  
- **적용 분야**: 실시간 전력 수요 예측

### 4. **Informer**
- **방식**: ProbSparse 어텐션을 통한 효율적 장기 예측  
- **강점**: 10,000+ 길이 시퀀스 처리 가능  
- **한계**: 단순 주기성 패턴 재현 어려움  
- **적용 분야**: 기상 데이터 장기 예보

### 5. **TSRM (Time-Series Relational Modeling)**
- **방식**: CNN-어텐션 하이브리드 아키텍처  
- **강점**: 누락 데이터 내재적 보정  
- **한계**: 소규모 데이터셋 과적합 리스크  
- **적용 분야**: 의료 센서 데이터 분석

---



## 1. **LSTM with Multiple Inputs**
### 📄 논문
- 별도 제시되지 않음 (전통적인 LSTM 확장 아키텍처)
### 👨💻 GitHub
- [Multistep Input-Output Timeseries](https://github.com/iamarchisha/multistep-io-timeseries): 다변량 입력/출력 처리 LSTM 구현
- [Apple/Google 주가 예측](https://github.com/SevilayMuni/Multivariate-TimeSeries-Forecast-LSTM-Apple-Google-Stocks): 실제 금융 데이터 적용 사례

---

## 2. **TFT (Temporal Fusion Transformer)**
### 📄 논문
- [Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting](https://arxiv.org/abs/1912.09363) (AAAI 2021)
### 👨💻 GitHub
- [공식](https://github.com/google-research/google-research/tree/master/tft)
- [PyTorch 버전](https://github.com/mattsherar/Temporal_Fusion_Transform)

---

## 3. **TSMixer**
### 📄 논문
- [TSMixer: An All-MLP Architecture for Time Series Forecasting](https://arxiv.org/abs/2303.06053) (Google Research)
### 👨💻 GitHub
- [PyTorch 공식 구현체](https://github.com/ditschuk/pytorch-tsmixer)
- [경량화 버전](https://github.com/smrfeld/tsmixer-pytorch)

---

## 4. **Informer**
### 📄 논문
- [Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting](https://arxiv.org/abs/2012.07436) (AAAI 2021 Best Paper)
### 👨💻 GitHub
- [공식 코드베이스](https://github.com/zhouhaoyi/Informer2020)
- [관련 프로젝트 모음](https://github.com/topics/informer?l=python)

---

## 5. **TSRM (Time-Series Relational Modeling)**
### 📄 논문
- [TSRM: A Lightweight Temporal Feature Encoding Architecture](https://arxiv.org/pdf/2504.18878.pdf) (2025)
### 👨💻 GitHub
- [공식 구현 리포지토리](https://github.com/RobertLeppich/TSRM)

---

## 비교 테이블
| 모델          | 논문 링크                                                                 | GitHub                                                                 |
|---------------|--------------------------------------------------------------------------|------------------------------------------------------------------------|
| LSTM          | -                                                                        | [링크](https://github.com/iamarchisha/multistep-io-timeseries)       |
| TFT           | [arXiv:1912.09363](https://arxiv.org/abs/1912.09363)                     | [링크](https://github.com/mattsherar/Temporal_Fusion_Transform)       |
| TSMixer       | [arXiv:2303.06053](https://arxiv.org/abs/2303.06053)                     | [링크](https://github.com/ditschuk/pytorch-tsmixer)                   |
| Informer      | [arXiv:2012.07436](https://arxiv.org/abs/2012.07436)                     | [링크](https://github.com/zhouhaoyi/Informer2020)                     |
| TSRM          | [arXiv:2504.18878](https://arxiv.org/pdf/2504.18878.pdf)                 | [링크](https://github.com/RobertLeppich/TSRM)                         |


## 종합 평가 매트릭스

| 모델          | 처리 변수 수 | 최대 시퀀스 길이 | 실시간 처리 | 비선형성 대응 |  
|---------------|--------------|------------------|-------------|---------------|  
| VAR           | 10~50        | 500              | △           | ×             |  
| LSTM          | 100~500      | 1,000            | ○           | ○             |  
| TFT           | 50~200       | 2,000            | △           | ◎             |  
| TSMixer       | 200~1,000    | 512              | ◎           | ○             |  
| Informer      | 100~300      | 10,000           | △           | ◎             |  
| TSRM          | 50~500       | 2,048            | ○           | ◎             |  

**◎: 우수 ○: 보통 △: 제한적 ×: 미지원**

---



## 모델 선택 가이드라인
1. **실시간성 요구**: TSMixer > LSTM > TSRM  
2. **초장기 예측**: Informer > TFT > TSRM  
3. **변수 복잡도**: TSMixer > TSRM > TFT  
4. **해석 가능성**: VAR > TFT > TSMixer  


#### 1.1.2. 다변량(Multivariate) 모델
- **정의**
- **주요 모델**
  
- **1.1 단변량 vs 다변량 모델 핵심 차이점**  
  - 단변량: ARIMA, Prophet의 산업 적용 한계점  
  - 다변량: Informer, Autoformer의 시계열 장기 의존성 해결 전략  
- **1.2 스마트팩토리 전력 데이터 특화 모델**  
  - N-BEATS의 Interpretable한 계층 구조  
  - TFT(Temporal Fusion Transformer)의 변수 간 상호작용 모델링  
- **1.3 실시간 에지 컴퓨팅 최적화 기법**  
  - LightGBM + DeepAR 하이브리드 아키텍처  
  - 모델 경량화를 위한 Knowledge Distillation 적용 사례
  
#### **2. Forecasting 딥러닝 모델링 실습**  
- **2.1 데이터 전처리 워크플로우**  
  - 시계열 정규화(Min-Max vs Z-Score)  
  - 공장 휴일/비가동 시간 마스킹 기법  
- **2.2 Multivariate Input 모델링 전략**  
  - CNN-LSTM Hybrid 구조의 특징 추출  
  - Attention 기반 변수 중요도 가시화 실습  
- **2.3 실전 프로젝트 케이스 스터디**  
  - 전력 소비 패턴과 기계 가동률의 상관관계 분석  

---

### [1시간: AI 모델 성능 평가, 트러블 슈팅]  
#### **1. 성능 평가 고급 기법**  
- **1.1 다변량 평가 지표 심화**  
  - CRPS(Continuous Ranked Probability Score)를 활용한 확률적 예측 검증  
  - MASE(Mean Absolute Scaled Error)의 계절성 조정 계산법  
- **1.2 예측 구간 시각화 실습**  
  - Quantile Regression을 이용한 95% 신뢰구간 생성  
  - Plotly를 활용한 Interactive 불확실성 시각화  

#### **2. 트러블슈팅 핵심 전략**  
- **2.1 추세 반영 실패 진단 매트릭스**  
  - STL 분해(Seasonal-Trend Decomposition)를 이용한 잔차 분석  
  - Gradient Boosted Trees의 Feature Importance 역추적  
- **2.2 하이퍼파라미터 최적화 워크샵**  
  - Optuna를 활용한 Bayesian Optimization 자동화 파이프라인  
  - Early Stopping과 Pruning의 적정 임계값 설정 가이드  

#### **3. 실전 배포 환경 대응**  
- **3.1 Concept Drift 감지 시스템**  
  - ADWIN(Adaptive Windowing) 알고리즘 구현  
  - 재학습 주기 최적화를 위한 모니터링 설계  
- **3.2 에지 디바이스 최적화**  
  - TensorRT를 이용한 ONNX 모델 변환 실습  
  - 전력 소모량과 예측 정확도 Trade-off 분석  

---

