# 非参数 Delta 方法

## 影响函数

若 $ T $ 是分布函数 $ F $ 的一个统计泛函，则 $ T $ 在 $ F $ 沿方向 $ G $ 的 Gâteaux 导数为 

$$
    L_F(G) := \lim_{\epsilon \to 0} \frac{T((1-\epsilon)F + \epsilon G) - T(F)}{\epsilon}.
$$

如果 $ G = \delta_x $ 是在 $ x $ 的一个点概率，那么记 $ L_F(x) := L_F(\delta_x) $，并称 $ L_F(x) $ 为影响函数。这样，

$$
    L_F(x) = \lim_{\epsilon \to 0} \frac{T((1-\epsilon)F + \epsilon \delta_x) - T(F)}{\epsilon}.
$$

经验影响函数定义为 $ \hat{L}(x) = L_{\hat{F}_n}(x) $，于是

$$
    \hat{L}(x) = \lim_{\epsilon \to 0} \frac{T((1-\epsilon)\hat{F}_n + \epsilon \delta_x) - T(\hat{F}_n)}{\epsilon}
$$

对于分布函数 $ F $ 明确的情况，可以省略影响函数的下标 $ F $。

## 影响函数的性质

令 $ T(F) = \int a(x) \text{d} F(x) $ 为一个线性泛函，那么

1. $ L_F(x) = a(x) - T(F) $ 且 $ \hat{L}(x) = a(x) - T(\hat{F}_n) $。

    这是因为

    $$
    \begin{aligned}
        L_F(x) & = \lim_{\epsilon \to 0} \frac{T((1-\epsilon)F + \epsilon \delta_x) - T(F)}{\epsilon}
        \\ & = \lim_{\epsilon \to 0} \frac{\int a(x) \text{d}((1-\epsilon)F + \epsilon \delta_x)(x) - T(F)}{\epsilon}
        \\ & = \lim_{\epsilon \to 0} \frac{(1-\epsilon) \int a(x) \text{d}F(x) + \epsilon \int a(x) \text{d}\delta_x(x) - T(F)}{\epsilon}
        \\ & = a(x) - T(F).
    \end{aligned}
    $$

    同理 $ \hat{L}(x) = a(x) - T(\hat{F}_n) $ 也成立。

2. 对于任意的 $ G $，有 $ T(G) = T(F) + \int L_F(x)\text{d}G(x) $。

    这是因为 

    $$
        \begin{aligned}
            \int L_F(x)\text{d}G(x) & = \int (a(x) - T(F))\text{d}G(x) \\
            & = \int a(x)\text{d}G(x) - \int T(F)\text{d}G(x) \\
            & = T(G) - T(F).
        \end{aligned}
    $$

3. $ \int L_F(x) \text{d} F(x) = 0$。

    由性质2可知

    $$
        \begin{aligned}
            \int L_F(x) \text{d} F(x) = T(F) - T(F) = 0
        \end{aligned}
    $$

4. 令 $ \tau^2 = \int L^2_F(x) \text{d} F(x) $，则 $ \tau^2 = \int (a(x) - T(F))^2 \text{d} F(x) $，如果 $ \tau^2 < \infty $，则 $ \sqrt{n} \left[ T(F) - T(\hat{F}_n) \right] \leadsto N(0, \tau^2) $.

    由性质2, 3和中心极限定理可知

    $$
        \begin{aligned}
            T(\hat{F}_n) - T(F) & = \int L_F(x) \text{d} \hat{F}_n(x) \\
            & = \frac{1}{n} \sum_{i=1}^n L_F(X_i) \\
            & \leadsto N(0, \tau^2).
        \end{aligned}
    $$

    其中需要注意到 $ \int (L_F(x) - \mathbb{E} \left[ L_F(x) \right])^2 \text{d} F(x) = \int (L_F(x))^2 \text{d} F(x) = \tau^2. $

5. 令 $ \widehat{\tau}^{2}=\frac{1}{n}\sum_{i=1}^{n}\widehat{L}^{2}(X_{i})=\frac{1}{n}\sum_{i=1}^{n}[a(X_{i})-T(\widehat{F}_{n})]^{2}$，则 $ \widehat{\tau}^{2} \xrightarrow{P} \tau^{2} $ 及 $ \frac{\hat{se}}{se} \xrightarrow{P} 1 $，其中 $ \hat{se} = \frac{\widehat{\tau}}{\sqrt{n}} $ 和 $ se = \sqrt{\text{Var} \left( T(\hat{F}_n) \right) } $。

    这里由大数定理易知成立。

6. $ \frac{\sqrt{n}[T(F)-T(\widehat{F}_n)]}{\widehat{\tau}}\leadsto N(0,1)$

    这是由于性质4, 5 与 [Slutsky 定理](https://en.wikipedia.org/wiki/Slutsky%27s_theorem) 而成立

若这个统计泛函不是一个线性泛函，上述性质不一定成立，我们对更加一般的条件给出一个比较通用的定理

如果 $ T $ 关于 $ d(F,G) \sup_x \left| F(x) - G(x) \right| $ 是 Hadamard 可微的，那么

$$
    \sqrt{n}[T(\widehat{F}_n)-T(F)]\leadsto N(0,\tau^2)
$$

此处， $ \tau^2 = \int L_F(x)^2 \text{d} F(x) $。

此外，

$$
    \frac{\sqrt{n}[T(\widehat{F}_n)-T(F)]}{\widehat{\tau}}\leadsto N(0,1)
$$

其中 $ \widehat{\tau}^2 = \frac{1}{n}\sum_{i=1}^n[L_F(X_i)]^2 $。

## 非参数 Delta 方法

利用以上定理，我们对满足要求的所有统计泛函都有一个估计，我们把近似 $ \left[ T(\hat{F}_n) - T(F) \right] / \hat{se} \approx N(0,1) $ 称为非参数 Delta 方法。

由正态近似，一个大样本置信区间为 $ T(\hat{F}_n) \pm z_{\alpha/2} \hat{se} $。

形式上，$ T(F) $ 的一个 $ 1-\alpha $ 置信区间为 $ T(\hat{F}_n) \pm z_{\alpha/2} \hat{se} $，其中 $ \hat{se} = \frac{\widehat{\tau}}{\sqrt{n}} $，$ \widehat{\tau}^2 = \frac{1}{n}\sum_{i=1}^n[L_F(X_i)]^2 $。

## 一些例子

### 分位数

令 $ F $ 为严格递增的，有正密度 $ f $，记 $ T(F) = F^{-1}(p) $ 为 $ p $ 分位点。

若记估计的分位数为 $\xi_p$，则 $F(\xi_p) = p$。并记 $F_\epsilon = (1-\epsilon)F + \epsilon \delta_{x}$。令 $T(F_\epsilon) = \xi_{p, \epsilon}$，满足 $p = F_\epsilon(T(F_\epsilon)) = F_\epsilon(\xi_{p, \epsilon})$。

代入上式，我们有:

$$p = (1-\epsilon)F(\xi_{p, \epsilon}) + \epsilon\delta_x(\xi_{p, \epsilon})$$

将等式关于 $\epsilon$ 进行微分，得

$$\frac{\text{d}}{\text{d}\epsilon}(p) = \frac{\text{d}}{\text{d}\epsilon} \left[ (1-\epsilon)F(\xi_{p, \epsilon}) + \epsilon\delta_x(\xi_{p, \epsilon}) \right]$$

$$0 = \left[ -F(\xi_{p, \epsilon}) + (1-\epsilon)\frac{\text{d}}{\text{d}\epsilon}F(\xi_{p, \epsilon}) \right] + \left[ \delta_x(\xi_{p, \epsilon}) + \epsilon \frac{\text{d}}{\text{d}\epsilon}\delta_x(\xi_{p, \epsilon}) \right]$$

注意到  $ \frac{\text{d}}{\text{d}\epsilon}F(\xi_{p, \epsilon}) = F'(\xi_{p, \epsilon}) \cdot \frac{\text{d}\xi_{p, \epsilon}}{\text{d}\epsilon} = f(\xi_{p, \epsilon})\frac{\text{d}\xi_{p, \epsilon}}{\text{d}\epsilon} $，代入得

$$0 = -F(\xi_{p, \epsilon}) + (1-\epsilon)f(\xi_{p, \epsilon})\frac{\text{d}\xi_{p, \epsilon}}{\text{d}\epsilon} + \delta_x(\xi_{p, \epsilon}) + \epsilon \frac{\text{d}}{\text{d}\epsilon}\delta_x(\xi_{p, \epsilon})$$

考虑到 $ \epsilon \to 0 $，有

$$0 = -F(\xi_p) + f(\xi_p) \left( \frac{d\xi_{p, \epsilon}}{d\epsilon}\Big|_{\epsilon=0} \right) + \delta_x(\xi_p) + 0$$

已知 $\frac{\text{d}\xi_{p, \epsilon}}{\text{d}\epsilon}\Big|_{\epsilon=0} = L_F(x)$，$F(\xi_p) = p$，因此

$$0 = -p + f(\xi_p) L_F(x) + \delta_x(\xi_p)$$

解得

$$L_F(x) = \frac{p - \delta_x(\xi_p)}{f(\xi_p)}$$

其中 $\delta_x$ 是一个在 $x$ 处的点概率的累积分布函数。

$ T(\hat F_{n}) $ 的渐进方差为 

$$
    \frac{\tau^2}{n} = \frac{1}{n} \int L^2(x) \mathrm{ d } F(x) = \frac{1}{n} (\int_{0}^{\xi_p} \left( \frac{p - 1}{f(\xi_p)} \right)^2 \mathrm{ d } F(x) + \int_{\xi_p}^{1}  \left( \frac{p}{f(\xi_p)} \right)^2 \mathrm{ d } F(x)) = \frac{p(1-p)}{nf^2(\xi_p)}
$$

### 相关

对于某函数 $a(t_1,\cdots,t_m)$，统计泛函有 $T(F)=a(T_1(F),\cdots,T_m(F))$ 的形
式.按照链规则，影响函数为

$$L(x)=\sum_{i=1}^m\frac{\partial a}{\partial t_i}L_i(x)$$

其中，

$$
    L_i(x)=\lim_{\epsilon\to0}\frac{T_i((1-\epsilon)F+\epsilon\delta_x)-T_i(F)}{\epsilon}.
$$

令 $Z = (X, Y)$，而且令 $T(F) = \mathbb{E}(X - \mu_x)(Y - \mu_Y) / (\sigma_X \sigma_Y)$ 表示相关，这里，$F(x, y)$ 是二元分布函数。回顾 $T(F) = a(T_1(F), T_2(F), T_3(F), T_4(F), T_5(F))$，这里，
$$T_1(X) = \int x \mathrm{d}F(z), \quad T_2(X) = \int y \mathrm{d}F(z), \quad T_3(X) = \int xy \mathrm{d}F(z),$$
$$
T_4(X) = \int x^2 \mathrm{d}F(z), \quad T_5(X) = \int y^2 \mathrm{d}F(z),$$
$$a(t_1, \cdots, t_5) = \frac{t_3 - t_1 t_2}{\sqrt{(t_4 - t_1^2)(t_5 - t_2^2)}}.$$
根据上文对多元统计泛函的公式计算可知,
$$
L(x, y) = \widetilde{x} \widetilde{y} - \frac{1}{2} T(F) (\widetilde{x}^2 + \widetilde{y}^2),$$
这里，
$$\widetilde{x} = \frac{x - \int x \mathrm{d}F}{\sqrt{\int x^2 \mathrm{d}F - \left( \int x \mathrm{d}F \right)^2}}, \quad \widetilde{y} = \frac{y - \int y \mathrm{d}F}{\sqrt{\int y^2 \mathrm{d}F - \left( \int y \mathrm{d}F \right)^2}}.$$