# 统计泛函的估计

## 统计泛函

一个统计泛函 $ T(F) $ 是 $ F $ 的一个泛函，如均值 $ \mu = \int x \text{d} F(x) $，方差 $ \sigma^2 = \int (x - \mu)^2 \text{d} F(x) $ 及中位数 $ m = F^{-1}(1/2) $。

一个形式为 $ \int a(x) \text{d} F(x) $ 的泛函称为线性泛函。显然，这个形式的所有泛函都是线性泛函，因为积分对测度是线性的。而由 Riesz 表示定理可知，在某些合适的空间上，所有线性泛函均能表示为这一形式。（笔者的测度论水平不佳，因此不会证明这一点。）

### 标准误和标准差

标准误和标准差是一个笔者之前容易混淆的名词，因此在这里做一个简单的辨析。

标准差是一种描述总体或样本数据波动性的统计量，它衡量的是数据点偏离均值的平均程度，不论这个总体是怎么来的（经验的或理论的），标准差都是通过计算得到的整体性质。标准误是指某个统计泛函的估计量（如样本均值）在其抽样分布中的标准差，它反映了如果重复抽样、反复估计，这个估计量会在样本之间如何波动。标准误通常通过统计泛函与原分布的理论推导得到，而不是直接从一个样本中计算，即使只有一个估计值，我们也可以推导出这个估计量在抽样中的不确定性。

假设我们从某个分布 $ F $ 中抽取了 50 个样本，希望估计其均值，用样本数据计算出的均值是一个估计量,尽管我们只得到一个值，但可以通过概率推导知道，这个估计值是一个统计泛函在样本空间中的一个实现，它本身具有一个分布，因此可以计算其在该分布下的标准误，衡量其估计的不确定性。

## 插入估计

定义 $ \theta = T(F) $ 的插入估计 (plug-in estimation) 为

$$
    \hat{\theta} = T(\hat{F}_n)
$$

由经验分布函数的性质知，对于线性泛函 $ \theta = \int a(x) \text{d} F(x) $，其插入估计为

$$
    T(\hat{F}_n) = \int a(x) \text{d} \hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^n a(X_i).
$$

### 插入估计的置信区间

若假定能发现插入估计量 $ T(\hat{F}_n) $ 的估计的标准误差 $ \hat{se} $，在许多情况，可以得出 

$$
    T(\hat{F}_n) \approx N(T(F), \hat{se}^2)
$$

在这种情况下，可以用 $ T(\hat{F}_n) \pm z_{1-\alpha/2} \hat{se} $ 来构造置信区间 $ [T(F) - z_{1-\alpha/2} \hat{se}, T(F) + z_{1-\alpha/2} \hat{se}] $，我们称之为基于正态的区间。

### 常见的统计量的插入估计

#### 均值

令 $ \mu = \int x \text{d} F(x) $，其插入估计为 $$ \hat{\mu} = \frac{1}{n} \sum_{i=1}^n X_i = \bar{X}_n. $$

#### 方差

令 $ \sigma^2 = \int (x - \mu)^2 \text{d} F(x) $，其插入估计为

$$
    \begin{aligned}
        \hat{\sigma}^2 & = \int x^2 \text{d} \hat{F}_n(x) - \left[ \int x \text{d} F(x) \right]^2 \\ & = \frac{1}{n} \sum_{i=1}^n x_i^2 - \left[ \frac{1}{n} \sum_{i=1}^n X_i \right]^2 \\ & = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X}_n)^2.
    \end{aligned}
$$

需要注意的是，此插入估计不同于通常的无偏样本方差。

#### 偏度

偏度是关于分布对称性缺失的度量，其定义为

$$
    \kappa = \frac{\mathbb{E} \left[ (X - \mu)^3 \right]}{\sigma^3}=\frac{\int (x - \mu)^3 \text{d} F(x)}{\left[ \int (x - \mu)^2 \text{d} F(x) \right]^{3/2}}.
$$

因此，$ \kappa $ 的插入估计为 
$$ 
    \hat{\kappa} = \frac{ \frac{1}{n} \sum_{i=1}^n (X_i - \hat{\mu})^3}{\hat{\sigma}^3}. 
$$

#### 相关

令 $ \rho = \frac{\mathbb{E} \left[ (X - \mu_X) (Y - \mu_Y) \right] }{\sigma_X \sigma_Y}$，其插入估计为

$$
    \hat{\rho} = \frac{\frac{1}{n} \sum_{i=1}^n (X_i - \hat{\mu}_X) (Y_i - \hat{\mu}_Y)}{\hat{\sigma}_X \hat{\sigma}_Y}.
$$

因为我们取的是样本方差的插入估计，因此这一计算公式与样本方差的无偏估计是一致的。

#### 分位数

令 $ F $ 严格递增的，其概率密度函数为 $ f $，令 $ T(F) = F^{-1}(p) $ 为 $ p $ 分位点，定义 $ \hat{F}_n^{-1}(p) = \inf \{ x: \hat{F}_n(x) \geq p \} $，并称之为样本 $ p $ 分位点。
