# 单变量/多变量

单变量：时间是唯一影响因素【可由多变量指定更加具体的条件得到，预测难度更高】

多变量：时间和多个变量共同影响结果
【数据收集难度更大，但是精度更高】

# 时序数据的训练和预测

传统时间序列数据在机器学习模型下的建模结果不好。
- 时间不是影响标签的关键因素
- 时间序列预测大多依赖周期性，而不是从根本解析数据之间的关系
    - 时间序列模型更专注于如何学习“周期性规律”、如何学习“趋势”
    - 传统机器学习中，每个样本相互独立。故两者的学习思路是不一致的。
- 机器学习模型无法处理“未见过的特征值”，而时间序列预测的特征永远是未曾出现过的

铁律：只能用过去预测未来，不能反向操作

测试集的时间一定晚于训练集，测试日期越接近训练日期越好预测

时序数据的训练
- 单步预测【难度大，一个模型需要学习出多种规律】
    - 将时间数据按照普通回归数据的方式进行训练和预测
    - 训练集、验证集和测试集是完全分割的三段时间，在训练集上训练、在验证集上调参，在测试集上预测
- 多步预测【缺陷：可能会导致误差累加】
    - 分成训练集和测试集，从t时间开始，在t之前为训练集，t之后为测试集，可将测试集分割，分割为t+d,t+2d,t+3d...
    - 预测出的t+d放回训练集进行训练，去预测t+2d，重复

两种预测都只适用于时间线的预测，而不适用于时间点的预测

多变量时间序列可使用机器学习模型建模

- 时间序列预测是否需要使用交叉验证？
    - 统计学/数学模型不需要交叉验证。
    - 时间序列数据可以想多步预测一样，但是不会存在误差累加的情况

# 时间序列模型

## 1. 不同的时序预测任务
针对单变量时间序列和多变量时间序列在训练和预测的具体手段和规则上都有巨大差异，分为两种类型：
- Forecasting(未来预测/时序预测)【只关注实现，不关心特征】
> 在单变量时间序列上，完成对未来某个时间段中连续时间点的预测（学习过去，预测未来），要求:
>1. 样本按照时间顺序排列
>2. 样本之间时间间隔固定
>3. 样本间存在相关性
>4. 过去的样本必然影响未来的样本
- Time Supervision(时序有监督学习)
> 在多变量时间序列上，基于时间或时间相关的数据，完成<b>回归或分类</b>任务<br>
> 与经典机器学习预测非常像，对样本之间的时间顺序、相关等都没有要求，反而更关注特征之间的关系，要求：
>1. 数据中必须存在除时间之外的其他特征，越多越好
>2. 如果有必要，可以完成“去时序化”处理，将时序数据彻底变为一般机器学习数据<br>
> 可以删掉时序特征，把整个时序数据转变为一般机器学习数据，从而无视时序训练规则，简化训练流程

|                              | 时序模型 | 机器学习模型  |
| ---------------------------- | -------- | ------------- |
| 时序预测(Forecast)           | √        | √必须去时序化，如果可以用则一般比时序模型效果好 |
| 时序有监督(Time Supervision) | ×        | √             |

还有一些类型的时序预测：
1. 时序分解，将一组时间序列分成多组符合不同规律的时间序列数据
2. 超长或超短时间窗口的预测
3. 处理时序数据中的缺失值和异常值
4. 层次时间序列(Hierarchical Time Series)
5. 分组时间序列(Group Time Series)

## 2. 当代时间序列算法
重点是用于Forcasting任务的算法

- 统计学/机器学习领域<br>
>AR: 自回归模型(AutoRegression)，基本思想：根据历史行为预测未来行为的模型，非常关注时序中的值与它之前和之后的值之间是否存在某种相关性。<br>
>MA: 移动平均模型(Moving Average Model)，更关注每个时间点上的值受到外界<b>偶然因素</b>多大的影响。<br>
>ARIMA: 自回归移动平均模型(Autogressive Integrated Moving Average)，使用最广泛的时序预测模型之一。融合AR和MA，可应对较复杂的时间序列数据。<br>
>SARIMA:季节性自回归综合移动平均模型，在原本模型的基础上允许ARIMA学习季节性模型、在按某个时间段上，呈现某种规律的数据上能有好的表现。<br>
>以上四种模型都属于ARIMA，可借助statemodel、Pmdarima、sktime等多个库实现
><hr>
>指数平滑(Exponential Smoothing): 用于单变量数据的时间序列预测方法，与ARIMA系列构成统计学领域应用最广泛的两类模型。关心数据在较长一段时间内的趋势性和季节性。
><hr>
>Prophet:自动化预测开源库，使用<b>加法模型</b>(Additive Model)作为和兴完成时序预测。可以说，是目前完成度较高的时间序列库之一。
><hr>
>数模型及其他高级机器学习模型：只要对数据进行“去时序化”，或遵循“过去预测未来”，就可以使用机器学习中的模型。大部分时候我们还是止会对去时序化后的多变量时间序列使用告诫机器学习模型<br>
>在可以使用机器学习模型的前提下，我们不会优先选择时序模型【时序模型在建模过程中有太多束缚】

- 深度学习领域
>RNN: 循环神经网络，本质是全连接网络，但考虑了过去的信息，输出不仅取决于当前输入，还取决于之前的信息，是深度学习最基础的时序模型。<br>
>LSTM: 长短期记忆网络，循环神经网络的变体，科学系序列中项目之间顺序依赖性和时间滞后性，可处理不连续的时间。<br>
>GRU: 门控循环单元结构，结构不LSTM更加简单、参数更少、训练更快、效果更好，结果与LSTM类似，但模型比LSTM更清量<br>
>以上都是循环神经网络的时序模型，既可用于单变量时序预测、有可用于多变量时序预测
><hr>
>DeepAR: 针对大量相关时间序列统一建模的预测算法，使用RNN结合AR来预测标量时间序列<br>
>N-BEATS: 基于后向和残差链接进行单变量时间序列点预测<br>
>Temporal Funsion Transformer: 时序融合Transformer，基于注意力架构<br>
>CNN: 卷积神经网络，更多被用于多变量时序数据上的时序有监督分类