# 插值

### 插值的定义

对一组数据点进行插值就是找一个函数，这个函数恰好经过这组数据点。函数 $y = P(x)$ 插值一组数据点 $(x_1, y_1),...,(x_n, y_n)$ 如果 $P(x_i) = y_i$

插值是函数计算的逆过程

### 多项式插值

* 多项式插值的优势

    多项式的计算很简单

    一组点一定可以得到插值多项式

#### 拉格朗日插值

对 $n$ 个数据点 $(x_1, y_1),...,(x_n, y_n)$，拉格朗日插值公式为

$$P_n(x) = \sum_{i = 1}^n y_i \frac{\prod_{j = 1,i \neq j}^n (x - x_j)}{\prod_{j = 1,i \neq j} (x_i - x_j)}$$

经过 $n$ 个数据点的 最高次数小于等于 $n - 1$ 的多项式有且只有一个，即拉格朗日多项式

拉格朗日插值是直观的，但是有更好的获取多项式插值公式的方法，计算量更小，更可维护

#### 牛顿差商法

一组数据点 $(x_1, f(x_1)), ..., (x_n, f(x_n))$ 的唯一的插值多项式的 $x^{n-1}$ 项的系数定义为 $f[x_1...x_n]$

那么一组数据点 $(x_1, f(x_1)), ..., (x_n, f(x_n))$ 的唯一的插值多项式可以写成

$$\begin{aligned}P(x) =  f[x_1] &+ f[x_1\ x_2] (x - x_1) \\
&+ f[x_1\ x_2\ x_3] (x - x_1)(x - x_2) \\
&+ f[x_1\ x_2\ x_3\ x_4] (x - x_1)(x - x_2)(x - x_3) \\
&+ \cdots \\
&+ f[x_1\ \cdots x_n] (x - x_1)\cdots (x - x_{n-1}) \\
\end{aligned}$$

其中系数由以下公式给出

$$\begin{aligned}
f[x_k] &= f(x_k) \\
f[x_k\ x_{k+1}] &= \frac{f[x_{k+1}] - f[x_k]}{x_{k+1} - x_k} \\
f[x_k\ x_{k+1}\ x_{k+2}] &= \frac{f[x_{k+1}\ x_{k+2}] - f[x_k\ x_{k+1}]}{x_{k+2} - x_k} \\
f[x_k\ x_{k+1}\ x_{k+2}\ x_{k+3}] &= \frac{f[x_{k+1}\ x_{k+2}\ x_{k+3}] - f[x_k\ x_{k+1}\ x_{k+2}]}{x_{k+3} - x_k} \\
...
\end{aligned}$$

牛顿差商法对于新增数据点重新获取插值函数是非常方便的

##### 牛顿差商法的证明

首先 $f[x_1 \cdots x_n]$ 是 $n - 1$ 次项的系数是显然的，函数 $H(x) = P(x) - f[x_1\ \cdots x_n] (x - x_1)\cdots (x - x_{n-1})$ 显然也是 $(x_1, f(x_1)), ..., (x_{n-1}, f(x_{n-1}))$ 这 $n - 1$ 个数据点的插值函数，根据插值多项式的唯一性可得 $f[x_1 \cdots x_{n-1}]$ 也是正确的，依此类推可证明 $P(x)$ 可以写成上述形式

接下来证明系数之间的递推关系

先按 $x_2, x_3,...,x_{k-1},x_k,x_1$ 的顺序写出 

$$\begin{aligned}P_1(x) =  f[x_2] &+ f[x_2\ x_3] (x - x_2) \\
&+ \cdots \\
&+ f[x_2\ x_3\ \cdots x_{k-1}\ x_k] (x - x_2)\cdots (x - x_{k-1}) \\
&+ f[x_2\ x_3\ \cdots x_{k-1}\ x_k\ x_1] (x - x_2)\cdots (x - x_{k-1})(x - x_k) \\
\end{aligned}$$

再按 $x_2, x_3,...,x_{k-1},x_1,x_k$ 的顺序写出 

$$\begin{aligned}P_2(x) =  f[x_2] &+ f[x_2\ x_3] (x - x_2) \\
&+ \cdots \\
&+ f[x_2\ x_3\ \cdots x_{k-1}\ x_1] (x - x_2)\cdots (x - x_{k-1}) \\
&+ f[x_2\ x_3\ \cdots x_{k-1}\ x_1\ x_k] (x - x_2)\cdots (x - x_{k-1})(x - x_1) \\
\end{aligned}$$

根据插值多项式的唯一性，$P_1(x) = P_2(x)$，$P_1(x_k) = P_2(x_k)$ 可得

$$
f[x_2\ x_3\ \cdots x_{k-1}\ x_k] + f[x_2\ x_3\ \cdots x_{k-1}\ x_k x_1](x - x_k) = \\
f[x_2\ x_3\ \cdots x_{k-1}\ x_1] + f[x_2\ x_3\ \cdots x_{k-1}\ x_1 x_k](x - x_1)
$$

$$
f[x_2\ x_3\ \cdots x_{k-1}\ x_k] = \\
f[x_2\ x_3\ \cdots x_{k-1}\ x_1] + f[x_2\ x_3\ \cdots x_{k-1}\ x_1 x_k](x_k - x_1)
$$

重排不影响系数的值，于是

$$
f[x_1\ \cdots\ x_{k}] = \frac{f[x_2\ \cdots\ x_{k}] - f[x_1\ \cdots\ x_{k-1}]}{x_k - x_1}
$$

### 插值的应用

插值的一个重要应用是把复杂函数的计算替换为简单多项式函数的计算，因为多项式计算只涉及加减和乘法，这对计算机硬件是非常友好的。

可以把这个替换看出一种形式的压缩：复杂的信息被简单的信息替换了，也许会损失一定的精确性

#### 应用举例

对函数 $f(x) = sin\ x$, 在 $[0, \pi/2]$ 区间等间隔地取四个点进行多项式插值，来模拟 $f(x)$

完成插值后，我们就实现了把 $sin$ 曲线的无限信息压缩到几个系数中，并可以通过几次乘和加还原曲线信息