# 瞬态时间序列观测数据的分析方法

对于空间和地面观测获取到的时间序列，无论是来自物理测量还是数字建模，面对的都是非线性物理系统。

- 针对这些系统，在多数情况下我们都无法直接建立解析数学模型，而只能通过观测或者实验获取它们的连续时间演化数据，并试图从中获取相关的动力学系统信息。
- 同时，实测数据精度的限制和不确定性物理因素，在很大程度上制约着我们对物理量瞬态时间演化数据的理解。

因此，如何找到合适的算法来分析这些瞬态数据，并从中提取有效的时间-频率信息来构建相关参数的预测模型，是空间物理观测研究当前面临的一个重要问题。

日地空间系统的观测数据不仅在时间上是自相关的，在空间上也是连续的，比如地磁场、行星际磁场、太阳风等离子体密度和温度等。但对于空间场量之间的相关性，到目前为止还没有严格的检验方法，现有的处理手段是

- 将空间网格化，通过计算局地的相关系数，判断其置信度，再将同水平的置信区域用等值线或者同样的阴影面积标出，以此来显现空间场量的相关显著性。

## 时间序列的数据分析

- 相关性分析
- 功率谱及时频能量谱分析

### 相关性分析

#### Pearson相关系数

考虑两个时间序列之间的线性关系时，常用的一个量化指标是Pearson相关系数(Sedgwick,1996)。对于时间长度为N的两个任意变量x和y，其标准差分别为：

$$
\begin{aligned}
    \sigma_x = \sum\limits_{i=1}^N (x_i-\overline{x}), \ \ 
    \sigma_y = \sum\limits_{i=1}^N (y_i-\overline{y})
\end{aligned}
$$

两者之间的Pearson相关系数由下式计算：

$$
  \gamma = \frac{1}{N}\sum\limits_{i=1}^N\left(\frac{x_i-\overline{x}}{\sigma_x}\right)
  \left(\frac{y_i-\overline{y}}{\sigma_y}\right)
$$

$\gamma(|\gamma|\leq 1)$可以用于度量两个因子之间的关联程度：$\gamma>0$ 表示两者正相关，$\gamma<0$则表示负相关。

同时可以定义单个变量的方差$S_{xx},S_{yy}$和协方差$S_{xy}$：

$$
\begin{aligned}
    S_{xx} &= \frac{1}{N}\sum\limits_{i=1}^N(x_i-\overline{x})^2 = \sigma_x^2\\
    S_{yy} &= \frac{1}{N}\sum\limits_{i=1}^N(y_i-\overline{y})^2 = \sigma_y^2\\
    S_{xy} &= \frac{1}{N}\sum\limits_{i=1}^N(x_i-\overline{x})(y_i-\overline{y})
\end{aligned}
$$

因此，相关系数、协方差和方差之间存在如下关系：

$$
    \gamma = \frac{S_{xy}}{\sigma_x\sigma_y}
$$

**Pearson相关系数的优缺点：**

相关系数能直观地定量描述变量之间的关系，且容易解释，故在实际分析中应用得最多，但它存在几点不足：

- 不适用于非线性关系
- 对异常值（野值）的影响很敏感
- 分析包含行波的问题时需要先考虑时间差

因此，计算Pearson相关系数之间需要先分析数据是否包含非线性关系、是否存在野值、是否有时间滞后现象等特征，再根据实际情况做相应线性化处理。

#### 显著性检验

通常情况下，可以用显著性检验来

- 表示两变量之间的差异
- 或者差异是否明显

具体可用两种统计方法来计算：

- Z统计法
- t统计法

#### 自由度估计

由于自然气候学变量通常都具有红噪声，与白噪声不同的是，红噪声在不同时刻的值并不是随机的，这意味着该变量在某一时刻的值会对后序时刻产生影响。因此，在进行相关系数的显著性检验时，为避免自相关性对相关系数置信度估计的影响，需要先估计时间序列的有效自由度。

估计自由度的方法有很多：

- Dawdy和Matalas(1964)
- Leith(1973)
- Bretherton(1999)

#### 秩相关系数

秩相关系数是一个与分布无关的秩统计参数，由Spearman于1904年提出，用来度量两个变量之间联系的强弱（Zar,2004）。


与普通的Pearson相关系数相比，Spearman秩相关系数具有较好的鲁棒性，而且对野值不太敏感。

因此，在实际中，如果怀疑待分析的时间序列中存在异常数据，却又没有办法排除或订正的情况下，更适合用秩相关系数来分析。

#### 滞后相关系数

值得注意的是，如果两个待分析的时间序列包含有行波或者任何可以随时间传播的信息，就需要考虑两者之间的相位差，仅按照上述方式简单地计算它们之间的相关系数实际上是不恰当的。

为解决这样的问题，常常需要考虑两信号的时间差，再计算滞后相关系数。反之，也可以通过计算两时间序列之间不同的时间滞后相关，来查找它们之间可能的相位差。

日地系统中存在很多类似的情况，研究的要素或变量之间的关系都是有时间滞后的，例如行星际太阳风参数与地磁场变化量之间的相关联系。

### 功率谱及时频能量谱分析

对于时间序列观测数据，目前常用的谱分析方法大致可以分为三种类型：

- 第一类是基于线性和平稳性假设的传统分析方法，如短时傅里叶变换（STFT）和快速傅里叶变化（FFT）
- 第二类是针对线性但非平稳数据设计的小波变换（WT）和Wigner-Ville分布
- 第三类是非线性稳态时间序列分析方法（Tong，2001）

然而，实际中获得的大多数观测数据会同时具有非线性和非稳态两个特性，因为无法事先确定基函数，故从这样的数据中分析出精细的物理结构或提炼出精确的关系式绝非易事，即使存在一个较为理想的基函数，也需要通过自适应的方法获得才能有说服力。

#### 功率谱

在处理连续的时间序列时，为了能定量地检测数据中的显著周期，常用的方法是功率谱分析。理论上，计算功率谱要借助于谐波分析来进行，而谐波分析是时间序列信号处理的一种基本手段，又称为调和分析，即用三角函数来拟合时间序列函数，并根据拟合函数来定义信号的周期、相位和振幅。由于实际测量的时间序列中经常包含多种时间尺度的变化成份，在大致确定各变化成份的周期特征后，通常要根据最小二乘法拟合来确定谐波参数，由此获得与实测时间序列最为接近的谐波函数。

功率谱常用的算法有两种：

- 一种是直接计算不同阶数的谐波振幅，称为功率谱，或功率谱密度
- 第二种是落后自相关方法，需要先根据时间序列求落后时间步长的自协方差矩阵，然后进行谐波分析，检测出周期。

#### 时频能量谱

时频能量谱是分析非线性时间序列最基本的方法之一，可以通过有线时间窗宽的FFT得到。

## 常用的时频分析方法

在分析非平稳实际信号时，通常需用到一些时频分析技术，通过时间和频率的联合分布函数，以时间-频率空间的能量（或功率）密度来表征信号特征。

在数字信号处理领域，根据不同的时频联合分布函数，有多种时频分析方法，常规的时频分析方法大致可以归为线性方法和二次变换两大类：

- 线性时频分析方法
    - 短时傅里叶变换
    - 连续小波变换
- 二次时频分析方法
    - Wigner-Ville分布
    - 由Wigner-Ville分布衍生的核函数法。
    
这些传统的分析方法凭借其自身的优势，已广泛地应用于地球物理、环境科学、地质学等领域。

但是对于非平稳的随机信号，较为理想的方法应同时具备以下几方面特性，分别是完备性、局部性、正交性和自适应性。其中，完备性和正交性可以保证信号分解的精度要求和信号能量的非负性；由于非平稳信号一般不存在周期性，所以需要分析方法具有局部性，即分析得到的信号频率及能量等参数都是包含时间变量和局部特征信息的函数。以上几种传统的分析方法基本上都面临一个问题：**很难找到一个预设的基函数来适应全局的情况**，而解决这个问题的方法就是通过信号本身来产生自适应函数，但自适应性对于大部分的时频分析来说都是一个较高的要求。

### 短时傅里叶变换

短时傅里叶变换实际上就是加窗的傅里叶变换，即信号划分成许多小的时间间隔，并假设在每个时间间隔内信号时平稳的，然后对时间窗内的每段信号进行傅里叶变换，并通过窗函数的平移来覆盖整个时间域，从而获得局部的组合频谱。

具体地，若给定一个时间间隔很短的窗函数$h(t)$，则信号$s(t)$的短时傅里叶变化定义为：

$$
    STFT(t,f)=\int_{-\infty}^{+\infty}s(t')h(t'-t)e^{-2\pi j ft'}dt
$$

其中信号$s(t')$乘以一个以$t$为中心的分析窗$h(t'-t)$表示取时间点$t$附近的一个时间段内的信号，故$STFT(t,f)$可理解为在时间点$t$附近的傅里叶变换，相应的短时傅里叶变换的频谱图可定义为在$t$时刻的能量密度频谱，即

$$
    P_{STFT}(t,\omega)=\frac{1}{2\pi}|STFT(t,\omega)|^2=\frac{1}{2\pi}
   \left|\int_{-\infty}^{+\infty}s(\tau)h(\tau-t)e^{-i\omega}d\tau\right|^2
$$

STFT通过加窗的方法对不同时间段的信号样本赋予不同的权重，能够突出窗内信号，抑制窗外信号，系统地处理有限尺度效应，从而实现对信号的局域化分析。但通常情况下在进行STFT时，如果想要得到较高的时间分辨率，需要的窗函数要尽可能短，但如果想要较高的频率分辨率，窗函数的时间宽度就要尽可能长，二者相互矛盾。

STFT的缺点：

- STFT的窗函数是固定不变的，一旦选定就要全局使用，故不可能在时间和频率上同时具有较高的分辨率。
- STFT以传统的傅里叶变换为基础，需要假定信号时分段平稳的，一般的实际信号不一定能满足
- 即便信号满足分段平稳的条件，也很难保证窗宽与信号分段平稳的时间尺度相吻合，若窗宽大于该时间尺度，则对窗内的信号进行傅里叶分析就失去物理意义


因此，在分析实际问题时，窗函数的设定有一定的难度，对于不同的信号，难免要尝试很多次才能找到合适的窗函数，这大大影响了STFT的实用性。而且分解出来的结果只是从数学的方法得到的各个谐波函数，是否有物理意义需要根据实际情况来判断，也与具体的研究对象和研究目的有关。



### 小波变换

小波变换（WT）是20世纪80年代后期发展起来的一种时频分析方法，其数学形式最早由Grossmann et al. (1984)提出，1987年Mallat引入了计算机视觉领域多分辨率的分析思想，建立了小波分解和重构的快速算法（Mallat，1987）。随后，Daubechies et al. (1992)构造了具有紧支集的正交小波基。

WT的思想是：将时间-频率构成的二维空间平面分割为一组不重叠的窗口，然后用一族小波函数去逼近这些窗口，从而获得信号的时频信息。相比于固定时间窗的短时傅里叶变换，小波函数可以通过平移和伸缩去逼近不同大小和形状的时频窗口，具有多分辨率的特点，在时域和频域都能较好地体现信号的局部特征，因此被誉为“数学显微镜”，在信号分析、检测、识别、滤波去噪，包括语音分析和图像处等领域有着广泛的应用。

最常用的Morlet小波变换的一般定义如下：

$$
    W(a,b;X,\Psi)=|a|^{1/2}\int_{-\infty}^{+\infty}X(t)\Psi^*\left(\frac{t-b}{a}\right)dt
$$

其中，$\Psi^*$是小波的基函数，$a$是尺度因子，$b$是平移参数。$W(a,b;X,\Psi)$代表的是$X$在$t=b$时刻，尺度为$a$的信号的能量。

通过调节小波的尺度参数和平移参数，可实现对时间窗口和频带宽度进行伸展收缩，从而满足时域和频域空间不同局部化分析的需求。鉴于实际问题中高频信号的持续时间较短而低频信号持续时间长，小波变换所得的时间-频率谱通常在高频部分具有较高的频率分辨率，而在低频部分具有较高的时间分辨率，因此能够对信号的瞬时结构进行有效的聚焦。

小波变换的局限性：

（1）小波的基函数$\Psi^*$会根据不同需要进行变化，但其具体形式是需要事先确定的，同时，对于不同的尺度因子，基函数一般都不是正交基。

（2）非平稳信号的频谱结构在不同时间点上常常存在较大差异，采用不同的小波基函数所得的结果也存在显著差异。因此，如何判断和选取合适的小波基函数是WT方法至今面临的一个难题。一旦确定小波基，整个分析过程中都无法替换，所以，小波分析不具备自适应性。

（3）无论是连续小波变换还是离散小波变换，其本质都是一种线性分析，比如最常用的Morlet小波理论上仍然是基于FT，因此沿袭了FT的一些缺点，这也是影响WT分析结果的一个重要因素。



### Wigner-Ville分布

较为典型的二次型时频方法是Cohen类时频分布Cohen（1995）。按照定义，时间序列$X(t)$的Wigner-Ville分布可表示为瞬时相关函数$C_c$关于时间间隔$\tau$的傅里叶变换：

$$
    W(t,\Omega)=\int_{-\infty}^{+\infty}C_c(\tau, t)e^{-j\omega t}d\tau
$$

其中，瞬时相关函数$C_c$可表示为：

$$
   C_c(\tau, t) = X(t-\tau/2)X^*(t+\tau/2)
$$

若要确定时间序列$X(t)$的Wigner-Ville分布在时间t的特性，只需要以t为中心将信号左右两边对折，若两部分有重叠则表示在t时刻具备相应的特性。Wignet-Ville分布在总能量、边缘条件和有效支持特性等方面都有着很好的表现，但也存在一些缺陷：

- 首先，Wigner-Ville分布不满足非正值性要求，某些频段可能存在负功率，这表明存在严重的交叉项，即两个信号的Wigner-Ville分布并不是单个信号的Wigner-Ville分布之和，从而会出现一个附加项
- 其次，Wigne-Ville分布中不同时间段的信号特性是均衡化的，故不能很好地体现信号的局部特征。

尽管上述缺点可以通过Kernel方法来消除（Cohen 1995），但其本质上还是加窗的傅里叶分析，因此同样具有傅里叶分析的所有局限性。Yen(1994)用Wigner-Ville分布定义了扩展波包，可以将复杂的数据转化为有效的简单分量，这个扩展功能非常强大，可以将Wigner-Ville分布应用于各种各样的问题，但应用于复杂数据前需要做大量的判断。

## HHT方法原理及步骤

HHT是由huang et al.(1998a)提出的一种新的视频分析方法，由经验模态分解（Eppirical Mode Decomposition, EMD）和Hilbert谱分析（Hilbert Spectrum Analysis, HSA）两个基本部分组成。

与传统的以傅里叶变化为基础的时频方法不同的是：

- EMD无需使用预先设定的基函数，因此对非稳态数据具有更好的适应性
- 由于不严格受Heisenberg测不准原理的制约，HSA在时间域和频率域可以同时具有较高的分辨率

EMD和HSA的组合提供了一个具有物理意义的时间频率空间的能量描述。

HHT分析过程具体通过两个步骤实现：

（1）第一步利用EMD对数据进行预处理，该方法基于数据本身包含的瞬时扰动特性自适应地分解筛分，将原始数据分解为有限个本真模态函数（Intrinsic Mode Function，IMF）的集合；

（2）第二步将分解得到的IMF进行Hilbert变换，得到能量-频率-时间的完整分布，同时定义了时间域上的瞬时频率。

与传统的方法相比，该方法可以更有效地分析非线性和非稳态数据，经多方检验和证实，该方法可以将隐藏于复杂数据中的周期成份提取出来，并显现出更细致的时间变化特征。

### HHT的基本概念

- 瞬时频率
- 本征模态函数

#### 瞬时频率

通过解析信号来定义非平稳数据的瞬时频率，是目前为止获得认可的一种较合理的方法（Huang,2009）。与Laplace和Fourier变换一样，Hilbert变换也是一个为了解决数学物理中特殊条件下的积分方程而被引入的积分变换。对任意一个时域内的时间序列$X(t)$，可对其进行Hilbert变换得到$Y(t)$：

$$
    Y(t)=\frac{1}{\pi} PV\int_{-\infty}^{+\infty}\frac{X(\tau)}{t-\tau}d\tau
$$

式中PV代表Cauchy主值，上述变换对$L^p$空间中的所有解析信号都成立。

由$X(t)$和$Y(t)$构成的复数形式为$X(t)$的解析信号$Z(t)$：

$$
   Z(t) = X(t) + i Y(t) = a(t)e^{i\phi t}
$$

其中$a(t)$为解析信号的振幅，$\phi(t)$为解析信号的相位:

$$
\begin{aligned}
   a(t) &= [X^2(t)+Y^2(t)]^{\frac{1}{2}}\\
   \phi(t) &= \arctan\left(\frac{Y(t)}{X(t)}\right)
\end{aligned}
$$

根据上式定义的解析信号，瞬时频率可以定义为：

$$
   f(t)=\frac{1}{2\pi}\frac{d\phi(t)}{dt}
$$


#### 本征模态函数

本征模态函数的定义如下：

（1）在数据集中，极值点的个数和过零点的个数相等或最多相差一个数；

（2）在任意点，由局部极大值定义的上包络线和由局部极小值定义的下包络线的均值为零。

满足上述条件的函数之所以被称为本征模态函数，是因为它代表了原始数据中的振荡模态。根据上述定义，IMF在每个周期（由局部极值点间的时间间隔定义）只涉及一种振荡模式，当然这其中包括单一频率或振幅调制的函数。

### 经验模态分解

EMD本质上就是对信号的平稳化处理，根据信号的预设判定准则，将信号中存在的不同特征时间尺度的波动或变化趋势逐级分解，产生一系列具有IMF特征的数据序列：

$$
    x(t) = \sum\limits_{k=1}^n c_k(t) + r_n(t)
$$

其中，$c_k(t)$是一组符合Hilbert变换要求的IMF，残差$r_n(t)$是一个单调函数，它可以试平均趋势，也可以是一个常数。

注：EMD仅对所选的筛选方法具有唯一性，目前的筛选过程使用三次样条函数来拟合上下包络线，如选定不同的函数来拟合，会产生不同的分解结果。

目前存在的问题：

- 端点效应
- 模态混叠

### 集合经验模态分解

Wu et al. (2004)在原有EMD算法的基础上提出了集合经验模态分解（Ensemble Empirical Mode Decomposition, EEMD）。简单地说，EEMD就是一种噪声辅助的EMD分解方法。

### Hilbert谱分析

经EMD或者EEMD分解所得的IMF可直接用于Hilbert变换，所得的瞬时频率具有物理意义，因此可进行时间-频率空间的谱分析。

###  HHT尚待解决的问题

在过去的20多年间，HHT方法在诸多自然科学领域获得了广泛的应用。然而，由于缺乏完整的理论体系，HHT方法中还存在以下问题尚待解决：


**问题一：**


- HHT方法中的自适应数据分解过程基本是凭经验进行的，很难建立系统的理论模型，与之相关的一些数学问题还未完全解决；由于EMD方法依赖于极值分离IMF和信号，如果某高频模不产生极值，就不可能将低振幅分量从高振幅分量中分离出来。

**问题二：**

- IMF的唯一性和最优化EMD问题：弄清IMF的唯一性问题实际就是考虑是否能给出更严格的IMF定义，并找到一个可自动实现的算法。

**问题三：**

- 非线性系统辨识和非平稳过程的预测

## 总结

在分析处理连续的时间序列数据时，除了通过相关性分析研究两个或多个随机变量之间的依赖关系外，常用的方法便是谱分析，它可以客观定量地检测时间序列中的显著的功率或能量分布。然而，在实际中，大多数信号都具有突变性或非稳定变化，除需要了解信号包含的频率成分，还需要关注信号在不同时刻和不同频率范围内的能量分布，FT显然在分析这些信号时不够理想。

STFT在一定程度上克服了传统FT的全局性缺陷，实现了对信号的局域性分析，但是由于采用固定的窗函数，它并不能适用于所有频段的信号，同时，也不能保证事先设定的窗函数的尺寸与平稳时间尺度相一致。

WT通过可平移和伸缩的时频窗口，在时域和频域都能较好地体现信号的局部特征，但仍然面临小波基函数难以事先确定的问题。

HHT方法将自适应的EMD和Hilbert变换相结合，在可能涉及非线性物理过程的非稳态数据分析中体现出很大的优势。

- 一方面，由于EMD方法无需事先设定基函数，而是根据信号固有的特性进行分解，这不仅可以使得重构信号时所需要建模的参数得到大量简化，还可以防止能量谱的泄露损失。
- 另一方面，经EMD分解获得的满足Hilbert变化条件的IMF虽不是理论上严格意义的本征值，但却有助于获得信号在频率和时间域的瞬时性质。

对于非平稳的实际信号，理想的方法应同时具备完备性、正交性、局部性和自适应性。HHT方法可以基本满足这四种性质，但是同时也存在其自身的局限性和尚待解决的问题。因此，在对自然观测数据进行具体分析时，需结合考虑实际情况并综合各种方法的处理结果进行客观的讨论。