# 数值计算方法

2024 年秋季学期本科

## 第 6 章 数值积分

### 引言

使用和式 $\displaystyle\sum_{i=0}^n a_if(x_i)$ 来近似计算定积分 $\displaystyle\int_a^bf(x){\rm{d}}x$ 的过程叫做**数值积分** (numerical integration) 或**数值求积** (numerical quadrature).

求积问题是数学分析的主要来源之一. 根据古希腊毕达哥拉斯学派的观点，计算一个对象的面积可以视为在几何上构造具有相同面积的 $\overset{\textit{quadra}}{\text{正方形}}$ 的过程（求平方）. 随着积分的发明，出现了一种通用的面积计算方法。 因此，术语“quadrature”已成为历史名词，而“numerical integration”一词首次出现于 1915 年. 

<img src="./assets/squaring_the_circle.png" width="320" style="display: block;margin-left: auto;margin-right: auto;" />

> The word *quadrature* has (at least) three incompatible meanings. Integration by quadrature either means solving an integral analytically, or solving of an integral numerically. 
> 
> The word quadrature is also used to mean squaring...
> 
> by *wolfram.com*

### Newton-Cotes 公式

#### 矩形公式

在微积分的课程中，矩形公式是一种基础的数值积分方法，用来估算函数图像下方的面积. 当我们只使用区间 $[a,b]$ 的一个端点的函数值来估算积分时，这种方法可以类比为求矩形的面积，因此叫做**矩形公式** (rectangle rule).

具体来说，假设我们要计算函数 $f(x)$ 在区间 $[a,b]$ 上的定积分 $\int_a^b f(x) \, \mathrm{d}x$. 矩形公式的基本思想是选择区间的一端作为代表点，通常是左端点 $x=a$，用 $f(a)$ 作为整个区间上函数值的近似. 于是，矩形公式给出的积分近似为：

$$ \int_a^b f(x) \, \mathrm{d}x \approx f(a)\cdot (b-a). $$

这表示用矩形的面积 $f(a) \cdot (b-a)$ 来近似原函数曲线下的面积.

矩形公式的误差取决于函数的变化率. 如果 $f(x)$ 在区间 $[a,b]$ 上是一个缓慢变化的函数，则这种近似通常效果较好. 然而，如果 $f(x)$ 变化较快，误差可能会显著增加. 矩形公式的误差与 $f(x)$ 的导数相关，对于线性函数，矩形公式能够给出精确结果.

#### 梯形公式

如果同时使用区间的两个端点，可以形象地类比为几何学中的求梯形面积，因此叫做**梯形公式** (trapezoidal rule).

<img src="./assets/trapezoidal.png" width="480" style="display: block;margin-left: auto;margin-right: auto;" />

对 $f(x)$ 使用线性插值 $$P_1(x)=\frac{(x-x_1)}{(x_0-x_1)}f(x_0)+\frac{(x-x_0)}{(x_1-x_0)}f(x_1)$$ 对其在 $[a,b]$ 上积分 $$\begin{align*}\int_a^b f(x){\rm{d}}x&=\int_{x_0}^{x_1}\left[\frac{(x-x_1)}{(x_0-x_1)}f(x_0)+\frac{(x-x_0)}{(x_1-x_0)}f(x_1)\right]{\rm{d}}x\\&+\frac{1}{2}\int_{x_0}^{x_1} f^{\prime\prime}(\xi(x))(x-x_0)(x-x_1){\rm{d}}x\end{align*}$$

> **带权的积分中值定理**
>
> 假设 $f\in C[a,b]$，$g$ 在 $[a,b]$ 上的黎曼积分存在，并且 $g$ 在$[a,b]$ 上不变号，则存在 $c\in (a,b)$，使得 $$\int_a^b f(x)g(x)\,{\rm{d}} x=f(c)\int_a^b g(x)\,{\rm{d}} x$$

由积分中值定理，误差项可以化为 $$\begin{align*}\int_{x_0}^{x_1} f^{\prime\prime}(\xi(x))(x-x_0)(x-x_1){\rm{d}}x&=f^{\prime\prime}(\xi)\int_{x_0}^{x_1}(x-x_0)(x-x_1){\rm{d}}x\\&=f^{\prime\prime}(\xi)\left[\frac{x^3}{3}-\frac{(x_0+x_1)x^2}{2}+x_0x_1x\right]_{x_0}^{x_1}\\&=-\frac{h^3}{6}f^{\prime\prime}(\xi),\quad \xi \in (x_0,x_1)\end{align*}$$

因此 $$\begin{align*}\int_a^b f(x){\rm{d}}x&=\int_{x_0}^{x_1}\left[\frac{(x-x_1)}{(x_0-x_1)}f(x_0)+\frac{(x-x_0)}{(x_1-x_0)}f(x_1)\right]{\rm{d}}x-\frac{h^3}{12}f^{\prime\prime}(\xi)\\&=\left[\frac{(x-x_1)^2}{2(x_0-x_1)}f(x_0)+\frac{(x-x_0)^2}{2(x_1-x_0)}f(x_1)\right]_{x_0}^{x_1}-\frac{h^3}{12}f^{\prime\prime}(\xi)\\&=\frac{x_1-x_0}{2}[f(x_0)+f(x_1)]-\frac{h^3}{12}f^{\prime\prime}(\xi)\\&=\frac{h}{2}[f(x_0)+f(x_1)]-\frac{h^3}{12}f^{\prime\prime}(\xi)\quad(h=b-a=x_1-x_0)\end{align*}$$

显然，当函数的二阶导数为零时，即任何次数不超过 1 的多项式，梯形公式给出的结果是精确的，具有**一阶精度**.

#### Simpson 公式

如果使用区间 $[a,b]$ 上的三个等距节点作二次 Lagrange 插值，即 $x_0=a,x_1=a+h,x_2=b$. 

<img src="./assets/simpson.png" width="480" style="display: block;margin-left: auto;margin-right: auto;" />

假设 $f$ 在 $x_1$ 处展为三次 Taylor 多项式，则有 $$f(x)=f(x_1)+f^\prime(x_1)(x-x_1)+\frac{f^{\prime\prime}(x_1)}{2}(x-x_1)^2+\frac{f^{\prime\prime\prime}(x_1)}{6}(x-x_1)^3+\frac{f^{(4)}(\xi(x))}{24}(x-x_1)^4$$ 其中 $\xi(x) \in (x_0,x_2)$. 对 $f(x)$ 在 $[x_0,x_2]$ 上积分，误差项使用带权的积分中值定理，可推导得
$$\int_{x_0}^{x_2}\frac{f^{(4)}(\xi(x))}{24}(x-x_1)^4{\rm{d}}x=\frac{f^{(4)}(\xi_1)}{24}\int_{x_0}^{x_2}(x-x_1)^4{\rm{d}}x=\frac{f^{(4)}(\xi_1)}{120}(x-x_1)^5\bigg|_{x_0}^{x_2},\; \xi_1 \in (x_0,x_2)$$

又 $h=x_2-x_1=x_1-x_0$ 继续化简

$$\int_{x_0}^{x_2}f(x){\rm{d}}x=2hf(x_1)+\frac{h^3}{3}f^{\prime\prime}(x_1)+\frac{f^{(4)}(\xi_1)}{60}h^5,\; \xi_1 \in (x_0,x_2)$$

使用二阶导数的近似公式 $$f^{\prime\prime}(x_1)=\frac{1}{h^2}[f(x_0)-2f(x_1)+f(x_2)]-\frac{h^2}{12}f^{(4)}(\xi_2)$$ 代入积分式，得到 $$\int_{x_0}^{x_2}f(x){\rm{d}}x=\frac{h}{3}[f(x_0)+4f(x_1)+f(x_2)]-\frac{h^5}{12}\left[\frac{1}{3}f^{(4)}(\xi_2)-\frac{1}{3}f^{(4)}(\xi_1)\right],\; \xi_1,\xi_2 \in (x_0,x_2)$$

用 $\xi$ 代替 $\xi_1$ 和 $\xi_2$，于是 $$\int_{x_0}^{x_2}f(x){\rm{d}}x=\frac{h}{3}[f(x_0)+4f(x_1)+f(x_2)]-\frac{h^5}{90}f^{(4)}(\xi),\quad \xi \in (x_0,x_2)$$

此为 Simpson 公式，它对次数不超过 3 的多项式，给出的结果是精确的，具有**三阶精度**.

> 【例 6.1】
>
> 用梯形公式和 Simpson 公式近似计算积分 $$I(f)=\int_0^1\frac{1}{1+x}\,{\rm{d}}x$$

应用梯形公式 $$I_T(f)\approx\frac{1}{2}[f(0)+f(1)]=0.75$$

应用 Simpson 公式 $$I_S(f)\approx\frac{0.5}{3}[f(0)+4f(0.5)+f(1)]=0.694444$$

对比真实值 $I(f)=\ln 2\approx 0.693147$

In [1]:
import numpy as np

# 定义函数 f(x) = 1 / (1 + x)
def f(x):
    return 1 / (1 + x)

# 矩形公式
def rectangle_rule(f, a, b):
    return f(a) * (b - a)

# 梯形公式
def trapezoidal_rule(f, a, b):
    return 0.5 * (f(a) + f(b)) * (b - a)

# Simpson公式
def simpson_rule(f, a, b):
    return (b - a) / 6 * (f(a) + 4 * f((a + b) / 2) + f(b))

# 定义积分区间 [a, b]
a = 0
b = 1

# 使用三种方法计算积分
rectangle_result = rectangle_rule(f, a, b)
trapezoidal_result = trapezoidal_rule(f, a, b)
simpson_result = simpson_rule(f, a, b)

# 积分的真实值
true_value = np.log(2)

print("矩形公式结果: ", rectangle_result)
print("梯形公式结果: ", trapezoidal_result)
print("Simpson公式结果: ", simpson_result)
print("真实值: ", true_value)

矩形公式结果:  1.0
梯形公式结果:  0.75
Simpson公式结果:  0.6944444444444443
真实值:  0.6931471805599453


#### 其他 Newton-Cotes 公式

考虑节点 $x_k=x_0+kh,(k=0,1,\dots,n)$，其中 $x_0=a,x_n=b$，且 $h=\displaystyle\frac{b-a}{n}$. Newton-Cotes 公式的基本思路是从区间 $[a,b]$ 选择一组互不相同的点 $\{x_0,\dots,x_n\}$ 构建 Lagrange 插值多项式，然后对其进行积分. 

将积分写成和式 $$\int_a^bf(x){\rm{d}}x\approx\sum_{i=0}^na_kf(x_k)$$ 其中，$$a_k=\int_{x_0}^{x_n}L_k(x){\rm{d}}x=\int_{x_0}^{x_n}\prod_{i=0,i\ne k}^n\frac{(x-x_i)}{(x_k-x_i)}{\rm{d}}x$$

> 存在 $\xi\in(a,b)$，使得当 $n$ 是偶数且 $f\in C^{n+2}[a,b]$ 时，有 $$\int_a^bf(x){\rm{d}}x=\sum_{i=0}^na_kf(x_k)+\frac{h^{n+3}f^{(n+2)(\xi)}}{(n+2)!}\int_0^nt^2(t-1)\dots(t-n){\rm{d}}t$$ 当 $n$ 是奇数且 $f\in C^{n+1}[a,b]$ 时，有 $$\int_a^bf(x){\rm{d}}x=\sum_{i=0}^na_kf(x_k)+\frac{h^{n+2}f^{(n+1)(\xi)}}{(n+1)!}\int_0^nt^2(t-1)\dots(t-n){\rm{d}}t$$ 

常用 Newton-Cotes 公式例如：
- $n=1$ 梯形公式 $$\int_{x_0}^{x_1}f(x){\rm{d}}x=\frac{h}{2}[f(x_0)+f(x_1)]-\frac{h^3}{12}f^{\prime\prime}(\xi),\quad \xi \in (x_0,x_1)$$
- $n=2$ Simpson 1/3 公式 $$\int_{x_0}^{x_2}f(x){\rm{d}}x=\frac{h}{3}[f(x_0)+4f(x_1)+f(x_2)]-\frac{h^5}{90}f^{(4)}(\xi),\quad \xi \in (x_0,x_2)$$
- $n=3$ Simpson 3/8 公式 $$\int_{x_0}^{x_3}f(x){\rm{d}}x=\frac{3h}{8}[f(x_0)+3f(x_1)+3f(x_2)+f(x_3)]-\frac{3h^5}{80}f^{(4)}(\xi),\quad \xi \in (x_0,x_3)$$
- $n=4$ Boole 公式 $$\int_{x_0}^{x_4}f(x){\rm{d}}x=\frac{2h}{45}[7f(x_0)+32f(x_1)+12f(x_2)+32f(x_3)+7f(x_4)]-\frac{8h^7}{945}f^{(6)}(\xi),\quad \xi \in (x_0,x_4)$$

一般地，$n$ 点公式有如下形式 $$\int_{x_0}^{x_n}f(x){\rm{d}}x=h\sum_{k=0}^nC_{n,k}f(x_k)$$ 其中 $$C_{n,k}=\frac{(-1)^{n-k}}{k!(n-k)!}\int_0^n\prod_{i=0,i\ne k}^n(t-i){\rm{d}}t$$ 

验证前四个 Newton-Cotes 公式：

|$$n,k$$ | 0     | 1     | 2     | 3     | 4     |
|--|--|--|--|--|--|
|1   | 1/2   | 1/2   |       |       |       |
|2   | 1/3   | 4/3   | 1/3   |       |       |
|3   | 3/8   | 9/8   | 9/8   | 3/8   |       |
|4   | 14/45 | 64/45 | 24/45 | 64/45 | 14/45 |

从表格可以看出，$\displaystyle\sum_{k=0}^nC_{n,k}=n$.

### 复化公式

对于积分区间较大的情况，一种可能的方法是使用高阶公式. 然而即便如此，也会因为等距节点的高阶插值带来振荡. 因此对于较大区间，Newton-Cotes 公式并不适合. 

**复合积分** (composite integration) 技术可以把较大区间划分成一段一段的子区间，在每段子区间上应用 Newton-Cotes 低阶公式，再对每一段子区间的积分结果求和，最终获得整个区间上的积分近似值. 

<img src="./assets/composite.png" width="560" style="display: block;margin-left: auto;margin-right: auto;" />

#### 复化梯形公式

用 $(n+1)$ 个点 $a=x_0<x_2<\dots<x_n=b$ 将区间 $[a,b]$ 划分为 $n$ 个相等的子区间 $[x_i,x_{i+1}]$，其中 $x_{i+1}-x_i=\displaystyle\frac{b-a}{n}=h$，即 $x_i=a+ih$. 在每个子区间上使用梯形公式$$\int_{x_i}^{x_{i+1}}f(x){\rm{d}}x=\frac{h}{2}[f(x_i)+f(x_{i+1})]-\frac{h^3}{12}f^{\prime\prime}(\xi_i),\quad \xi_i \in (x_i,x_{i+1})$$

因此整个区间上的积分近似为分段子区间的求和，即 $$\int_a^bf(x){\rm{d}}x=\sum_{i=0}^{n-1}\int_{x_i}^{x_{i+1}}f(x){\rm{d}}x=\frac{h}{2}\sum_{i=0}^{n-1}[f(x_i)+f(x_{i+1})]-\frac{h^3}{12}\sum_{i=0}^{n-1}f^{\prime\prime}(\xi_i)$$

假设 $f^{\prime\prime}(x)$ 在 $[a,b]$ 上连续，则必有一点 $\xi\in(a,b)$ 使得 $\displaystyle\frac{1}{n}\sum_{i=0}^{n-1}f^{\prime\prime}(\xi_i)=f^{\prime\prime}(\xi)$ 从而得到复化梯形公式 $$\int_a^bf(x){\rm{d}}x=\frac{h}{2}\left[f(a)+2\sum_{i=1}^{n-1}f(a+ih)+f(b)\right]-\frac{b-a}{12}h^2f^{\prime\prime}(\xi)$$

#### 复化 Simpson 公式

取正的偶数 $n$，用 $(n+1)$ 个点 $a=x_0<x_2<\dots<x_n=b$ 将区间 $[a,b]$ 划分为 $n/2$ 个相等的子区间 $[x_{2i-2},x_{2i}]$，其中 $x_{2i}-x_{2i-2}=\displaystyle\frac{2(b-a)}{n}=2h$，子区间中点为 $x_{2i-1}$. 在每个子区间上使用 Simpson 公式$$\int_{x_{2i-2}}^{x_{2i}}f(x){\rm{d}}x=\frac{h}{3}[f(x_{2i-2})+4f(x_{2i-1})+f(x_{2i})]-\frac{h^5}{90}f^{(4)}(\xi_i),\quad \xi_i \in (x_{2i-2},x_{2i})$$

假设 $f^{(4)}(x)$ 在 $[a,b]$ 上连续，则存在 $\xi \in (a,b)$ 使得 $$\begin{align*}\int_a^bf(x){\rm{d}}x&=\sum_{i=1}^{n/2}\int_{x_{2i-2}}^{x_{2i}}f(x){\rm{d}}x=\frac{h}{3}\sum_{i=1}^{n/2}[f(x_{2i-2})+4f(x_{2i-1})+f(x_{2i})]-\frac{h^5}{90}\sum_{i=1}^{n/2}f^{(4)}(\xi_i)\\&=\frac{h}{3}\left[f(a)+2\sum_{i=1}^{(n/2)-1}f(a+2ih)+4\sum_{i=1}^{n/2}f(a+(2i-1)h)+f(b)\right]-\frac{b-a}{180}h^4f^{(4)}(\xi)\end{align*}$$

从而得到复化 Simpson 公式.

In [2]:
def f(x):
    return np.sin(x)

# 复化梯形公式
def composite_trapezoidal(f, a, b, n):
    h = (b - a) / n
    integral = 0.5 * f(a) + 0.5 * f(b)
    for i in range(1, n):
        integral += f(a + i * h)
    integral *= h
    return integral

# 复化 Simpson 公式
def composite_simpson(f, a, b, n):
    if n % 2 != 0:
        raise ValueError("n 必须是偶数.")
    
    h = (b - a) / n
    integral = f(a) + f(b)
    
    for i in range(1, n, 2):
        integral += 4 * f(a + i * h)
    
    for i in range(2, n-1, 2):
        integral += 2 * f(a + i * h)
    
    integral *= h / 3
    return integral

# 积分区间 [a, b]
a = 0
b = np.pi

# 使用复化梯形公式和复化 Simpson 公式计算积分
n = 100  # 划分的子区间数
trapezoidal_result = composite_trapezoidal(f, a, b, n)
simpson_result = composite_simpson(f, a, b, n)

# 积分的真实值
true_value = -np.cos(b) - (-np.cos(a))

print("复化梯形公式结果: ", trapezoidal_result)
print("复化Simpson公式结果: ", simpson_result)
print("真实值: ", true_value)

复化梯形公式结果:  1.9998355038874436
复化Simpson公式结果:  2.0000000108245044
真实值:  2.0


### Romberg 求积法

#### Richardson 外推法

本节介绍一个强大而通用的工具，可以用最少的努力提高公式的准确性. 其基本思想在数值分析中至关重要. 

假设我们有要计算的量 $Q$ 和公式 $A(h)$，使得 $\displaystyle\lim_{h\to 0}A(h)=Q$.  

对于两点中心差分的例子 $$Q=f^\prime(x),\quad A(h)=\frac{f(x+h)-f(x-h)}{2h}$$ 

使用 Taylor 级数展开，得到 $$f(x\pm h)=f(x)\pm hf^\prime(x)+\frac{h^2}{2!}f^{\prime\prime}(x)\pm \frac{h^3}{3!}f^{\prime\prime\prime}(x)+\dots$$

通过代入 Taylor 展式，我们可以消去奇数阶导数，得到类似下式 $$A(h)=Q+c_2h^2+c_4h^4+\dots$$

其基本思想是，通过在多个 $h$ 值处求得 $A(h)$ 的值，可以获得未知数（例如，$Q$）的方程组. 再将这些方程组合起来**求解**感兴趣的量.

首先假设我们想要获得比 $A(h)$ 更好的 $Q$ 的近似值. **Richardson 外推法** (Richardson extrapolation) 的过程是在 $h$ 的两个值处评估上式，并求解 $Q$.

例如，选取 $h$ 和 $h/2$，我们有

$$\begin{cases}\displaystyle A(h)=Q+c_2h^2+c_4h^4+\dots\\\displaystyle A(\frac{h}{2})=Q+\frac{c_2}{4}h^2+\frac{c_4}{16}h^4+\dots
\end{cases}$$ 为了消除误差项，方程组的下式乘以 4 再减去上式，可得 $$\displaystyle \frac{4}{3}A(\frac{h}{2})-\frac{1}{3}A(h)=Q + a_4h^4+a_6h^6+\dots$$ 其中常数 $a_4,a_6,\dots$在此处无关紧要. 

因此我们有 $$A_1(h)=\frac{4}{3}A(\frac{h}{2})-\frac{1}{3}A(h)$$它是 $Q$ 的 $O(h^4)$ 近似. 

回到前面的中心差分例子，这就给出了以下四点中心差分格式 
$$\begin{align*}A_1(h)&=\frac{4}{3}\left(\frac{f(x+h/2)-f(x-h/2)}{h}\right)-\frac{1}{3}\left(\frac{f(x+h)-f(x-h)}{2h}\right)\\&=\frac{f(x-h)-8f(x-h/2)+8f(x+h/2)-f(x+h)}{6h}\end{align*}$$

继续外推 $$A_1(h)=Q + a_4h^4+a_6h^6+\dots$$ 可以得到 $$\begin{align*}A_2(h)&=\frac{16}{15}A_1(\frac{h}{2})-\frac{1}{15}A_1(h)\\&=\frac{1}{45}A(h)-\frac{20}{45}A(\frac{h}{2})+\frac{64}{45}A(\frac{h}{4})\end{align*}$$
这个结果达到了 $O(h^6)$ 精度.

将这个过程形式化，得到一个计算近似值 $A_k(h^{2j})$的迭代过程，其中 $j=0,1,\dots,k$. 

可以使用 $$A_k(h)=Q+O(h^{2k})$$ 有效地计算上述公式.

整个过程的**计算成本很低**，只需要计算几次 $A_k(h)$ 即可获得更高阶的精度.

注意，可以用 Richardson 外推法估计每个近似值的阶数（如 $O(h^p)$），但无法获知更精确的信息，例如 $h^p$ 前面的次数或系数. 不过，在实践中并不总是需要了解这些.

#### Romberg 积分

Romberg 求积法是在复化梯形公式的基础上应用**外推**得到的算法. 如果 $f\in C^\infty[a,b]$，则复化梯形公式可以写成 $$\int_a^bf(x){\rm{d}}x=\frac{h}{2}\left[f(a)+2\sum_{i=1}^{n-1}f(a+ih)+f(b)\right]+c_1h^2+c_2h^4+c_3h^6+\dots$$

使用 $R_{k,1}$ 来表示对复合梯形公式取 $n=2^{k-1}$ 时的近似结果. 应用外推法得到 $O(h^4)$ 的近似结果记为 $$R_{k,2}=R_{k,1}+\frac{1}{3}(R_{k,1}-R_{k-1,1}),\quad k=2,3,\dots$$ 以此类推，如果已经得到 $R_{k,j-1}$ 近似值，可以用下式估算 $O(h^{2j})$ 阶近似 $$R_{k,j}=R_{k,j-1}+\frac{1}{4^{j-1}-1}(R_{k,j-1}-R_{k-1,j-1}),\quad k=j,j+1,\dots$$

我们还需要得到 $R_{k,1}$ 的计算方法. 令 $h_k=(b-a)/2^{k-1}$，易知 $$R_{1,1}=\frac{h_1}{2}[f(a)+f(b)]=\frac{b-a}{2}[f(a)+f(b)]$$ 及 $$R_{2,1}=\frac{h_2}{2}[f(a)+f(b)+2f(a+h_2)]$$ 用 $R_{1,1}$ 表示 $R_{2,1}$ 得到 $$R_{2,1}=\frac{b-a}{4}[\frac{2}{b-a}R_{1,1}+2f(a+h_2)]=\frac{1}{2}R_{1,1}+\frac{h_1}{2}f(a+h_2)$$ 以此类推，下式对 $k=2,3,\dots,n$ 成立 $$R_{k,1}=\frac{1}{2}\left(R_{k-1,1}+h_{k-1}\sum_{i=1}^{2^{k-2}}f(a+(2i-1)h_k)\right)$$

Romberg 积分表如下

|$$k$$      | $O(h_k^2)$ | $O(h_k^4)$ | $O(h_k^6)$ | $\dots$  | $O(h_k^{2n})$ |
|--|--|--|--|--|--|
|$$1$$        | $R_{1,1}$  |            |            |          |               |
|$$2$$        | $R_{2,1}$  | $R_{2,2}$  |            |          |               |
|$$3$$        | $R_{3,1}$  | $R_{3,2}$  | $R_{3,3}$  |          |               |
|$$\vdots$$ | $\vdots$   | $\vdots$   | $\vdots$   | $\ddots$ |               |
|$$4$$        | $R_{n,1}$  | $R_{n,2}$  | $R_{n,3}$  | $\dots$  | $R_{n,n}$     |

$$R_{k,1}=\frac{1}{2}\left(R_{k-1,1}+h_{k-1}\sum_{i=1}^{2^{k-2}}f(a+(2i-1)h_k)\right),\quad k=2,3,\dots,n$$
$$R_{k,j}=R_{k,j-1}+\frac{1}{4^{j-1}-1}(R_{k,j-1}-R_{k-1,j-1}),\quad k=j,j+1,\dots$$

按照从上到下、从左到右的顺序，逐项递推计算.

> 【例 6.2】
>
> 使用 Romberg 求积法，计算 $\displaystyle\int_0^\pi \sin x {\,\rm{d}}x$ 的近似值

分别取 $n=1,2,4,8$ 计算 $R_{k,1}$，有

$$\begin{align*}
&R_{1,1}=\frac{\pi}{2}[\sin 0 + \sin \pi]=0,&h_1=\pi\\
&R_{2,1}=\frac{1}{2}\left[R_{1,1} + h_1\sin\frac{\pi}{2}\right]=1.5707963,&h_2=\frac{\pi}{2}\\
&R_{3,1}=\frac{1}{2}\left[R_{2,1} + h_2\sin\frac{\pi}{4}+h_2\sin\frac{3\pi}{4}\right]=1.8961189,&h_3=\frac{\pi}{4}\\
&R_{4,1}=\frac{1}{2}\left[R_{3,1} + h_3\sin\frac{\pi}{8}+h_3\sin\frac{3\pi}{8}+h_3\sin\frac{5\pi}{8}+h_3\sin\frac{7\pi}{8}\right]=1.9742316,&h_4=\frac{\pi}{8}
\end{align*}$$

继续求 $O(h^4)$ 阶的近似结果

$$\begin{align*}
&R_{2,2} = R_{2,1} + \frac{1}{3}(R_{2,1}-R_{1,1})=2.0943951\\
&R_{3,2} = R_{3,1} + \frac{1}{3}(R_{3,1}-R_{2,1})=2.0045598\\
&R_{4,2} = R_{4,1} + \frac{1}{3}(R_{4,1}-R_{3,1})=2.0002692
\end{align*}$$

继续求 $O(h^6)$ 阶的近似结果

$$\begin{align*}
&R_{3,3} = R_{3,2} + \frac{1}{15}(R_{3,2}-R_{2,2})=1.9985707\\
&R_{4,3} = R_{4,2} + \frac{1}{15}(R_{4,2}-R_{3,2})=1.9999831
\end{align*}$$

继续求 $O(h^8)$ 阶的近似结果

$$\begin{align*}
&R_{4,4} = R_{4,3} + \frac{1}{63}(R_{4,3}-R_{3,3})=2.0000056
\end{align*}$$

In [3]:
def romberg_integration(f, a, b, max_k):
    R = np.zeros((max_k, max_k), dtype=float)
    
    # 初始计算 R[k,1]
    h = b - a
    R[0, 0] = 0.5 * h * (f(a) + f(b))
    
    # 递推计算 R[k,1]
    for k in range(1, max_k):
        h /= 2
        sum_f = sum(f(a + (2*i - 1) * h) for i in range(1, 2**(k-1) + 1))
        R[k, 0] = 0.5 * R[k-1, 0] + h * sum_f
        
        # 递推计算 R[k,j]
        for j in range(1, k + 1):
            R[k, j] = R[k, j-1] + (R[k, j-1] - R[k-1, j-1]) / (4**j - 1)
    
    return R

# 最大迭代次数
max_k = 5

# 使用 Romberg 积分算法计算积分
romberg_result = romberg_integration(f, a, b, max_k)

# 最终结果在 Romberg 表的最后一列最后一行
romberg_final_result = romberg_result[max_k-1, max_k-1]

print("Romberg积分结果: ", romberg_final_result)
print("真实值: ", true_value)

Romberg积分结果:  1.9999999945872902
真实值:  2.0


In [4]:
def print_romberg_table(R):
    max_k = R.shape[0]
    print("-" * (max_k * 13 + 1))
    for i in range(max_k):
        row = "|".join(f"{R[i, j]:12.8f}" if j <= i else " " * 12 for j in range(max_k))
        print(f"|{row}|")
        print("-" * (max_k * 13 + 1))

# 打印 Romberg 积分表
print_romberg_table(romberg_result)

------------------------------------------------------------------
|  0.00000000|            |            |            |            |
------------------------------------------------------------------
|  1.57079633|  2.09439510|            |            |            |
------------------------------------------------------------------
|  1.89611890|  2.00455975|  1.99857073|            |            |
------------------------------------------------------------------
|  1.97423160|  2.00026917|  1.99998313|  2.00000555|            |
------------------------------------------------------------------
|  1.99357034|  2.00001659|  1.99999975|  2.00000002|  1.99999999|
------------------------------------------------------------------


### Gauss 求积法

#### 代数精度

如果求积公式对于次数不大于 $m$ 的多项式均能确保其误差为零，但不保证对 $m+1$ 次多项式的误差为零，则称该求积公式具有 $m$ 阶**代数准确度** (algebraic degree of accuracy) 或**精度** (precision).

不难验证，梯形公式和 Simpson 公式的代数准确度分别是 1 （一阶精度）和 3 （三阶精度）.

如前所述，数值求积是**寻找**满足 $\displaystyle\int_a^bf(x){\,\rm{d}}x\approx\sum_{i=0}^na_if(x_i)$ 的 $a_i$ 和 $x_i$，它可以看作一个确定未知参数的代数问题.

> 【例 6.3】
>
> 用求积公式 $$a_0f(x_0)+a_1f(x_1)$$ 近似计算积分 $$I(f)=\int_{-1}^1f(x){\,\rm{d}}x$$ 为使求积公式的代数准确度为 3，确定系数 $a_i$ 和节点 $x_i$，其中 $i=0,1$. 

一般地，欲使求积公式具有 $m$ 阶精度，只要令它对于 $f(x)=1,x,x^2,\dots,x^m$ 均成立. 因此

$$\begin{align*}
&a_0 + a_1 =I(1)= \int_{-1}^1 {\,\rm{d}}x=2\\
&a_0x_0 + a_1x_1 =I(x)= \int_{-1}^1 x{\,\rm{d}}x=0\\
&a_0x_0^2 + a_1x_1^2 =I(x^2)= \int_{-1}^1 x^2{\,\rm{d}}x=\frac{2}{3}\\
&a_0x_0^3 + a_1x_1^3 =I(x^3)= \int_{-1}^1 x^3{\,\rm{d}}x=0
\end{align*}$$

求解结果是 $x_0=-\displaystyle\frac{1}{\sqrt{3}},x_1=\displaystyle\frac{1}{\sqrt{3}},a_0=a_1=1$.

#### Gauss 求积公式

Newton-Cotes 公式是在以下限制条件下推导的：

- 在有限区间 $[a,b]$ 上积分
- 被积函数的权函数 $W(x)=1$
- 等间距的节点

$(n+1)$ 个节点的 Newton-Cotes 求积公式的代数准确度至少是 $n$. 

通过适当地选取，求积公式的的最高代数精度有可能至多是 $2n+1$（例如上一例题）. 我们称：

> 如果一个具有 $(n+1)$ 个节点的插值求积公式的代数精度是 $2n+1$，则称它为 **Gauss 求积公式** (Gaussian quadrature).

#### 最高代数精度

Gauss 求积公式是具有最高代数精度的插值求积公式.

对于带权的积分 $$\int_a^bf(x)W(x){\,\rm{d}}x\approx\sum_{i=0}^nw_if(x_i)$$ 其中**权** (weight) 由下式给出 $$w_i=\int_{x_0}^{x_n}L_i(x)W(x)$$ 对比 Newton-Cotes 处理的积分式，可知实际上是用 $w_i$ 代替原本的系数 $a_i$.

> 如果 $f$ 是次数不超过 $2n+1$ 的多项式，则近似求积 $$\int_a^bf(x)W(x){\,\rm{d}}x\approx\sum_{i=0}^nw_if(x_i)$$ 是精确的.
>

【证明】根据题设 $f$ 次数不超过 $2n+1$，那么可以表示为 $f=P_{n+1}(x)Q(x)+R(x)$ 其中 $Q(x)$ 和 $R(x)$ 是次数不超过 $n$ 的多项式. 由于 $P_{n+1}(x)$ 与所有次数不超过 $n$ 的多项式正交，因此 $$\int_a^bf(x)W(x){\,\rm{d}}x=\int_a^bP_{n+1}(x)Q(x)W(x){\,\rm{d}}x+\int_a^bR(x)W(x){\,\rm{d}}x=\int_a^bR(x)W(x){\,\rm{d}}x$$ 又 $\displaystyle R(x)=\sum_{i=0}^nR(x_i)L_i(x)$ 且 $f(x_i)=P_{n+1}(x_i)Q(x_i)+R(x_i)=R(x_i)$ 则 $$\int_a^bR(x)W(x){\,\rm{d}}x=\sum_{i=0}^nf(x_i)\int_{x_0}^{x_n}L_i(x)W(x){\,\rm{d}}x=\sum_{i=0}^nw_if(x_i)$$

#### Gauss-Legendre 公式

令区间为 $(-1,1)$ 且 $W(x)=1$，就得到了最常见的 Gauss 求积公式：Gauss-Legendre 公式，此时的正交多项式叫做 Legendre 多项式. 前 5 个 Legendre 多项式分别是

$$\begin{align*}
&P_0(x)=1\\
&P_1(x)=x\\
&P_2(x)=x^2-\frac{1}{3}\\
&P_3(x)=x^3-\frac{3}{5}x\\
&P_4(x)=x^4-\frac{6}{7}x^2+\frac{3}{35}
\end{align*}$$

不难验证，只要 $P(x)$ 是一个次数小于 $n$ 的多项式，都有 $\displaystyle\int_{-1}^1P(x)P_n(x){\,\rm{d}}x=0$

> 假设 $x_1,x_2,\dots,x_n$ 是 $n$ 次 Legendre 多项式 $P_n(x)$ 的根，并且对于每个 $i=1,2,\dots,n$，$c_i$ 满足 $$c_i=\int_{-1}^1\prod_{j=1,j\ne i}^n\frac{(x-x_j)}{(x_i-x_j)}{\,\rm{d}}x$$ 如果 $P(x)$ 是一个次数小于 $2n$ 的多项式，则下式成立 $$\int_{-1}^1P(x){\,\rm{d}}x=\sum_{i=1}^nc_iP(x_i)$$

【证明】对于次数小于 $n$ 的多项式 $P(x)$，取 $n$ 次 Legendre 多项式的根为插值节点，$P(x)$ 可表示为 $(n-1)$ 次 Lagrange 插值基函数，后者误差项含有 $P(x)$ 的 $n$ 阶导数. 但 $P(x)$ 次数小于 $n$，因此$n$ 阶导数为零. 故而定理对次数小于 $n$ 的多项式 $P(x)$成立.

对次数小于 $n$ 的多项式 $P(x)$成立，故有 $$P(x)=\sum_{i=1}^nP(x_i)L_i(x)=\sum_{i=1}^n\prod_{j=1,j\ne i}^n\frac{(x-x_j)}{(x_i-x_j)}P(x_i)$$ 且 $$\int_{-1}^1P(x){\,\rm{d}}x=\sum_{i=1}^n\left[\int_{-1}^1\prod_{j=1,j\ne i}^n\frac{(x-x_j)}{(x_i-x_j)}{\,\rm{d}}x\right]P(x_i)=\sum_{i=1}^nc_iP(x_i)$$

继续考察大于等于 $n$ 的多项式 $P(x)$，用 $n$ 次 Legendre 多项式 $P_n(x)$ **除** $P(x)$，可以得到两个次数小于 $n$ 的多项式，记为商式 $Q(x)$、余式 $R(x)$，即 $$P(x)=P_n(x)Q(x)+R(x)$$ 由于 $x_i$，其中$i=1,2,\dots,n$，是 $P_n(x)$ 的根，因此
$$P(x_i)=P_n(x_i)Q(x_i)+R(x_i)=R(x_i)$$

注意到商式 $Q(x)$、余式 $R(x)$都是次数小于 $n$ 的多项式. Legendre 多项式的正交性能够确保 $$\int_{-1}^1Q(x)P_n(x){\,\rm{d}}x=0$$ 此外，根据前面对次数小于 $n$ 的多项式的证明结果，有
$$\int_{-1}^1R(x){\,\rm{d}}x=\sum_{i=1}^nc_iR(x_i)
$$
 因此代入这些结果即可得证 $$\int_{-1}^1P(x){\,\rm{d}}x = \int_{-1}^1[P_n(x)Q(x)+R(x)]{\,\rm{d}}x = \int_{-1}^1R(x){\,\rm{d}}x = \sum_{i=1}^nc_iR(x_i) = \sum_{i=1}^nc_iP(x_i)$$

> 【例 6.4】
>
> 用两点求积公式 $$a_0f(x_0)+a_1f(x_1)$$ 近似计算积分 $$I(f)=\int_{-1}^1f(x){\,\rm{d}}x$$ 为使求积公式的代数准确度为 3，用 Gauss-Legendre 公式确定系数 $a_i$ 和节点 $x_i$，其中 $i=0,1$. 

二次 Legendre 多项式 $P_2(x)=x^2-\displaystyle\frac{1}{3}$ 的两个根分别是 $x_0=-\displaystyle\frac{1}{\sqrt{3}},x_1=\displaystyle\frac{1}{\sqrt{3}}$. 以它们作为求积公式的节点，计算系数 $a_i$，有
$$\begin{align*}
&a_0=\int_{-1}^1\frac{x-x_1}{x_0-x_1}{\,\rm{d}}x=1\\
&a_1=\int_{-1}^1\frac{x-x_0}{x_1-x_0}{\,\rm{d}}x=1
\end{align*}$$

#### 其他 Gauss 求积公式

利用变量替换的方法，可以将 Gauss-Legendre 公式从区间 $[-1,1]$ 推广到任意区间 $[a,b]$ 上的积分. 令 $\displaystyle t=\frac{2x-a-b}{b-a}$ 从而 $\displaystyle x=\frac{1}{2}[(b-a)t+a+b]$ 因此

$$\int_a^b f(x){\,\rm{d}}x=\int_{-1}^1\frac{b-a}{2}f\left(\frac{(b-a)t+a+b}{2}\right){\,\rm{d}}t$$

此外，通过对权函数 $W(x)$ 和积分区间的不同选择，可以导出不同的 Gauss 求积公式，下面是包括 Legendre 多项式在内的简单汇总

|正交多项式        | 区间                  | 权函数                                         |
|:--:|--|--|
|Legendre 多项式  | $$[-1.1]$$            | $$1$$                                         |
|Chevyshev 多项式 | $$(-1.1)$$            | $$\frac{1}{\sqrt{1-x^2}}$$                    |
|Jacobi 多项式    | $$(-1,1)$$            | $$(1-x)^\alpha(1+x)^\beta,\;\alpha,\beta>-1$$ |
|Laguerre 多项式  | $$[0,+\infty)$$       | $$e^{-x}$$                                    |
|Hermite 多项式   | $$(-\infty,+\infty)$$ | $$e^{-x^2}$$                                  |

### Monte Carlo 积分方法

Monte Carlo 积分方法是一种基于随机采样的数值积分方法，通常用于高维空间的积分计算或复杂区域的积分问题. 与传统的如梯形公式、Simpson 公式等数值积分方法不同，Monte Carlo 积分是一种非确定性方法，它通过随机生成样本点来估计积分值，因此其结果带有一定的随机性.

Monte Carlo 积分方法简单易行、适应性强，尽管计算结果具有随机性，但在大量样本的支持下，能够提供有效的积分估计.

#### 基本原理

假设我们要计算函数 $f(x)$ 在区间 $[a, b]$ 上的定积分：

$$ I = \int_a^b f(x) \, \mathrm{d}x $$

Monte Carlo 积分方法的基本思想是，通过生成大量的随机样本点来估计积分. 具体步骤如下：

1. **生成随机样本点**: 在区间 $[a, b]$ 内随机生成 $ N $ 个样本点 $x_1, x_2, \dots, x_N$，样本点服从均匀分布. 
2. **计算函数值的平均**: 计算这些样本点在函数 $f(x)$ 上对应的函数值 $f(x_1), f(x_2), \dots, f(x_N)$ 的平均值
   $$ \hat{f} = \frac{1}{N} \sum_{i=1}^{N} f(x_i) $$
3. **估计积分值**: 乘以区间长度 $(b - a)$ 来得到积分的估计值
   $$ I \approx \hat{f}\cdot(b - a)  $$

#### 误差分析

Monte Carlo 积分方法的误差通常随样本点数量 $ N $ 的增加而减小. 理论上的误差量级为 $ O(N^{-1/2}) $，即误差与样本数量的平方根成反比. 因此，通过增加样本数量，可以提高积分的准确性，但由于其随机性，结果会带有一定的波动.

In [5]:
import numpy as np

def f(x):
    return 1 / (1 + x)

# Monte Carlo 积分方法
def monte_carlo_integration(f, a, b, N):
    # 生成 N 个在 [a, b] 区间内的随机样本点
    x_random = np.random.uniform(a, b, N)
    # 计算 f(x) 的平均值
    f_mean = np.mean(f(x_random))
    # 估计积分值
    integral_estimate = (b - a) * f_mean
    return integral_estimate

# 积分区间 [a, b]
a = 0
b = 1

# 样本数量
N = 1000000

# 使用 Monte Carlo 积分方法计算积分
monte_carlo_result = monte_carlo_integration(f, a, b, N)

# 积分的真实值
true_value = np.log(2)

print("Monte Carlo 积分结果: ", monte_carlo_result)
print("真实值: ", true_value)

Monte Carlo 积分结果:  0.6933006251528772
真实值:  0.6931471805599453
