# 不定积分的运算法则与基本公式（CS/AI 专项笔记·精研版）
## 前言
不定积分的运算法则与基本公式是**积分计算的核心工具集**，其本质是将复杂积分转化为可直接套用公式的简单形式。在AI领域，这些工具是**概率分布建模（PDF→CDF）、期望计算、累积奖励求解、积分约束优化**的工程基础——例如逻辑回归的Sigmoid函数推导依赖换元法则，强化学习的期望奖励计算依赖分部积分法则，正态分布的CDF计算依赖指数函数积分公式。本章将聚焦“可操作、高频率”，系统梳理AI场景中必备的运算法则与基本公式，结合案例拆解工程应用，适配Jupyter归档与CS/AI实战需求。

## 一、不定积分的核心运算法则（AI高频使用）
不定积分的运算法则均基于“导数逆运算”和“函数性质”推导，AI中以**线性法则、换元法则、分部积分法则**为核心，覆盖90%以上的积分场景。

### 1. 线性运算法则（AI最常用，基础中的基础）
#### 1.1 数学表述
设 $f(x)$、$g(x)$ 均存在原函数，$\alpha$、$\beta$ 为任意常数，则：
$$\boxed{\int [\alpha f(x) + \beta g(x)]dx = \alpha \int f(x)dx + \beta \int g(x)dx + C}$$
- 推论1（齐次性）：$\int \alpha f(x)dx = \alpha \int f(x)dx + C$（$\beta=0$ 时，适用于单一函数的系数缩放）；
- 推论2（可加性）：$\int [f(x) - g(x)]dx = \int f(x)dx - \int g(x)dx + C$（$\alpha=1$、$\beta=-1$ 时，适用于函数差的积分）。

#### 1.2 推导逻辑
对等式右侧求导（利用导数线性性质）：
$$\frac{d}{dx}\left[ \alpha \int f(x)dx + \beta \int g(x)dx \right] = \alpha f(x) + \beta g(x)$$
与左侧被积函数一致，故法则成立（积分常数 $C$ 合并所有常数项）。

#### 1.3 AI核心应用场景
- 多任务损失的积分约束：联合损失函数 $L(w) = \alpha L_{cls}(w) + \beta L_{reg}(w)$ 的积分正则项，可拆分计算后加权求和；
- 混合分布的CDF计算：混合分布PDF为 $\sum_{i=1}^n \alpha_i p_i(x)$（$\sum \alpha_i=1$），其CDF为各分布CDF的加权和 $\sum_{i=1}^n \alpha_i P_i(x)$；
- 强化学习的组合奖励积分：瞬时奖励 $r(t) = \alpha r_1(t) + \beta r_2(t)$（如即时奖励+延迟奖励），累积奖励为 $\alpha \int r_1(t)dt + \beta \int r_2(t)dt$。

#### 1.4 示例（混合分布CDF计算）
- 问题：混合分布PDF为 $p(x) = 0.7 \cdot 2e^{-2x} + 0.3 \cdot 3e^{-3x}$（$x \geq 0$），求其CDF；
- 解：利用线性法则拆分积分：
  $$\int p(x)dx = 0.7 \int 2e^{-2x}dx + 0.3 \int 3e^{-3x}dx + C$$
  套用指数函数积分公式，得：
  $$\int p(x)dx = 0.7(1 - e^{-2x}) + 0.3(1 - e^{-3x}) + C = 1 - 0.7e^{-2x} - 0.3e^{-3x} + C$$
  由CDF性质 $F(0)=0$ 得 $C=0$，最终 $F(x) = 1 - 0.7e^{-2x} - 0.3e^{-3x}$。

### 2. 换元积分法则（复合函数积分核心）
换元法则的本质是“通过变量替换简化复合函数结构”，分为**第一类换元法（凑微分法）** 和**第二类换元法（直接替换法）**，AI中以第一类换元法应用最广。

#### 2.1 第一类换元法（凑微分法，AI高频）
##### 2.1.1 数学表述
若 $\int f(u)du = F(u) + C$，且 $u = \varphi(x)$ 可导，则：
$$\boxed{\int f(\varphi(x)) \cdot \varphi'(x)dx = F(\varphi(x)) + C}$$

##### 2.1.2 核心步骤（AI工程思路）
1. 凑微分：观察被积函数，拆分出“复合函数外层 $f(\cdot)$”和“内层函数的导数 $\varphi'(x)dx = du$”；
2. 换元：令 $u = \varphi(x)$，将积分转化为 $\int f(u)du$（直接套用基本公式）；
3. 回代：将 $u = \varphi(x)$ 代回，得到原变量的积分结果。

##### 2.1.3 AI核心应用场景
- 激活函数的积分推导（如Softplus函数是ReLU的积分形式）；
- 带指数/对数复合的积分（如概率分布中的 $\int e^{-\lambda x^2} \cdot x dx$）；
- 强化学习的折扣奖励积分（如 $\int r(\gamma t) \cdot \gamma dt$）。

##### 2.1.4 示例（Sigmoid函数推导，逻辑分布CDF）
- 问题：标准逻辑分布PDF为 $p(t) = \frac{e^{-t}}{(1 + e^{-t})^2}$，求其CDF；
- 解：
  1. 凑微分：令 $u = 1 + e^{-t}$，则 $du = -e^{-t}dt$，即 $-du = e^{-t}dt$；
  2. 换元：积分转化为 $\int \frac{-du}{u^2} = \int -u^{-2}du$；
  3. 套用幂函数积分公式：$\int -u^{-2}du = u^{-1} + C = \frac{1}{u} + C$；
  4. 回代：$u = 1 + e^{-t}$，得 $CDF = \frac{1}{1 + e^{-t}} + C$；
  5. 确定 $C$：由 $F(-\infty)=0$ 得 $C=0$，即 $F(t) = \frac{1}{1 + e^{-t}}$（Sigmoid函数）。

#### 2.2 第二类换元法（直接替换法，复杂场景用）
##### 2.2.1 数学表述
若 $x = \varphi(t)$ 是**单调可导**函数，且 $\varphi'(t) \neq 0$，$t = \varphi^{-1}(x)$ 为其反函数，则：
$$\boxed{\int f(x)dx = \int f(\varphi(t)) \cdot \varphi'(t)dt + C}$$

##### 2.2.2 核心步骤
1. 直接换元：针对被积函数含根号、三角函数等复杂结构，令 $x = \varphi(t)$ 简化形式；
2. 转化积分：将 $dx = \varphi'(t)dt$ 代入，转化为关于 $t$ 的简单积分；
3. 反代回原变量：利用反函数 $t = \varphi^{-1}(x)$ 还原为 $x$ 的函数。

##### 2.2.3 AI核心应用场景
- 高维积分的降维（如变分推断中的KL散度计算）；
- 含根号的奖励函数积分（如强化学习中 $r(x) = \sqrt{x}$ 的累积奖励）；
- 正态分布CDF的近似计算（通过换元转化为误差函数）。

##### 2.2.4 示例（正态分布CDF近似）
- 问题：标准正态分布PDF为 $\phi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}$，求其CDF；
- 解：
  1. 换元：令 $t = \frac{x}{\sqrt{2}}$，则 $x = \sqrt{2}t$，$dx = \sqrt{2}dt$；
  2. 转化积分：$\int \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}dx = \int \frac{1}{\sqrt{2\pi}} e^{-t^2} \cdot \sqrt{2}dt = \frac{1}{\sqrt{\pi}} \int e^{-t^2}dt$；
  3. 引入误差函数：定义 $\text{erf}(x) = \frac{2}{\sqrt{\pi}} \int_0^x e^{-t^2}dt$，故积分结果为 $\frac{1}{2} \text{erf}\left( \frac{x}{\sqrt{2}} \right) + C$；
  4. 确定 $C$：由 $F(-\infty)=0$ 得 $C=0.5$，最终 $\Phi(x) = \frac{1}{2} \left[ 1 + \text{erf}\left( \frac{x}{\sqrt{2}} \right) \right]$。

### 3. 分部积分法则（乘积形式积分核心）
#### 3.1 数学表述
设 $u = u(x)$、$v = v(x)$ 均具有连续导数，则：
$$\boxed{\int u(x) v'(x)dx = u(x)v(x) - \int v(x) u'(x)dx}$$
或简化为便于记忆的形式：
$$\boxed{\int udv = uv - \int vdu}$$

#### 3.2 推导逻辑
由乘积导数公式：$(uv)' = u'v + uv'$，移项得 $uv' = (uv)' - u'v$，两边积分：
$$\int uv'dx = \int (uv)'dx - \int u'v dx = uv - \int vdu$$
（$\int (uv)'dx = uv + C$，常数项合并到最终的 $C$ 中）。

#### 3.3 核心选择原则（AI工程避坑）
拆分被积函数为 $u$ 和 $dv$ 时，遵循“**易求导的选u，易积分的选dv**”，AI中常见组合：
| 被积函数类型       | $u$ 选择                | $dv$ 选择                  | 示例                  |
|--------------------|--------------------------|----------------------------|-----------------------|
| 多项式 × 指数函数  | 多项式（如 $x$、$x^2$）  | 指数函数（如 $e^{\lambda x}dx$） | $\int x e^{-x}dx$     |
| 多项式 × 对数函数  | 对数函数（如 $\ln x$）   | 多项式（如 $x dx$）        | $\int x \ln x dx$     |
| 多项式 × 三角函数  | 多项式（如 $x$）         | 三角函数（如 $\sin x dx$） | $\int x \cos x dx$    |
| 指数函数 × 三角函数 | 指数函数/三角函数均可    | 另一类函数                  | $\int e^x \sin x dx$  |

#### 3.4 AI核心应用场景
- 期望计算：连续随机变量的期望 $E[X] = \int x p(x)dx$（如指数分布、Gamma分布的期望）；
- 高阶矩计算：方差 $Var(X) = E[X^2] - (E[X])^2$，需通过分部积分计算 $E[X^2] = \int x^2 p(x)dx$；
- 深度学习的积分约束：含乘积项的损失函数积分（如 $\int x L(x)dx$，$L(x)$ 为损失函数）。

#### 3.5 示例（指数分布的期望计算）
- 问题：指数分布PDF为 $p(x) = \lambda e^{-\lambda x}$（$x \geq 0$），求 $E[X] = \int_0^{+\infty} x \lambda e^{-\lambda x}dx$；
- 解：先求不定积分 $\int x \lambda e^{-\lambda x}dx$：
  1. 拆分：令 $u = x$（易求导），$dv = \lambda e^{-\lambda x}dx$（易积分）；
  2. 计算：$du = dx$，$v = \int \lambda e^{-\lambda x}dx = -e^{-\lambda x}$；
  3. 代入分部积分公式：
     $$\int x \lambda e^{-\lambda x}dx = -x e^{-\lambda x} - \int (-e^{-\lambda x})dx = -x e^{-\lambda x} - \frac{1}{\lambda} e^{-\lambda x} + C$$
  4. 代入上下限：当 $x \to +\infty$ 时，$-x e^{-\lambda x} \to 0$，故 $E[X] = 0 - (0 - \frac{1}{\lambda}) = \frac{1}{\lambda}$。

## 二、不定积分的基本公式（AI高频必备）
基本公式是积分计算的“原子工具”，均由导数公式逆推而来。以下筛选AI场景中使用频率最高的公式，按“函数类型”分类，标注应用场景与示例：

### 1. 幂函数积分（多项式相关场景）
| 被积函数 $f(x)$ | 不定积分 $\int f(x)dx$                | 约束条件       | AI应用场景                          | 示例                  |
|------------------|---------------------------------------|----------------|-----------------------------------|-----------------------|
| $k$（常数）      | $kx + C$                               | $k$ 为常数     | 常数奖励的累积计算、均匀分布CDF    | $\int 2dx = 2x + C$    |
| $x^n$            | $\frac{x^{n+1}}{n+1} + C$              | $n \neq -1$    | 多项式奖励函数、幂函数PDF的CDF    | $\int x^2 dx = \frac{x^3}{3} + C$ |
| $\frac{1}{x}$    | $\ln|x| + C$                           | $x \neq 0$     | 对数似然函数的积分、熵的计算      | $\int \frac{1}{x}dx = \ln|x| + C$ |
| $\frac{1}{\sqrt{x}}$ | $2\sqrt{x} + C$                        | $x > 0$        | 根号形式奖励的累积、平方根分布CDF | $\int \frac{1}{\sqrt{x}}dx = 2\sqrt{x} + C$ |
| $\frac{1}{x^2}$  | $-\frac{1}{x} + C$                     | $x \neq 0$     | 反比例函数PDF的CDF                | $\int \frac{1}{x^2}dx = -\frac{1}{x} + C$ |

### 2. 指数函数积分（概率分布核心）
| 被积函数 $f(x)$ | 不定积分 $\int f(x)dx$                | 约束条件       | AI应用场景                          | 示例                  |
|------------------|---------------------------------------|----------------|-----------------------------------|-----------------------|
| $e^x$            | $e^x + C$                              | -              | 指数分布CDF、指数奖励累积          | $\int e^{0.5x}dx = 2e^{0.5x} + C$ |
| $a^x$            | $\frac{a^x}{\ln a} + C$                | $a > 0, a \neq 1$ | 离散分布的连续近似、指数衰减奖励    | $\int 2^x dx = \frac{2^x}{\ln 2} + C$ |
| $e^{\lambda x}$  | $\frac{1}{\lambda}e^{\lambda x} + C$   | $\lambda \neq 0$ | 指数分布、泊松过程的累积概率        | $\int e^{-2x}dx = -\frac{1}{2}e^{-2x} + C$ |

### 3. 三角函数积分（信号处理、特征工程）
| 被积函数 $f(x)$ | 不定积分 $\int f(x)dx$                | AI应用场景                          | 示例                  |
|------------------|---------------------------------------|-----------------------------------|-----------------------|
| $\sin x$         | $-\cos x + C$                          | 正弦信号的积分滤波、周期奖励累积    | $\int \sin 3x dx = -\frac{1}{3}\cos 3x + C$ |
| $\cos x$         | $\sin x + C$                           | 余弦信号的积分滤波、周期特征提取    | $\int \cos 2x dx = \frac{1}{2}\sin 2x + C$ |
| $\tan x$         | $-\ln|\cos x| + C$                     | 正切函数特征的积分处理              | $\int \tan x dx = -\ln|\cos x| + C$ |
| $\sec^2 x$       | $\tan x + C$                           | 三角函数PDF的CDF（如柯西分布）      | $\int \sec^2 x dx = \tan x + C$ |

### 4. 反三角函数积分（概率分位数计算）
| 被积函数 $f(x)$ | 不定积分 $\int f(x)dx$                | AI应用场景                          | 示例                  |
|------------------|---------------------------------------|-----------------------------------|-----------------------|
| $\frac{1}{\sqrt{1-x^2}}$ | $\arcsin x + C$（或 $-\arccos x + C$） | 正态分布分位数计算、反正弦特征积分  | $\int \frac{1}{\sqrt{1-x^2}}dx = \arcsin x + C$ |
| $\frac{1}{1+x^2}$ | $\arctan x + C$                        | 柯西分布CDF、反正切激活函数的积分  | $\int \frac{1}{1+x^2}dx = \arctan x + C$ |

### 5. 复合函数积分（AI高频组合）
| 被积函数 $f(x)$ | 不定积分 $\int f(x)dx$                | 换元思路                  | AI应用场景                          |
|------------------|---------------------------------------|---------------------------|-----------------------------------|
| $e^{ax + b}$     | $\frac{1}{a}e^{ax + b} + C$           | $u = ax + b$              | 带偏移的指数分布CDF                |
| $\sin(ax + b)$   | $-\frac{1}{a}\cos(ax + b) + C$        | $u = ax + b$              | 带偏移的周期奖励累积                |
| $\frac{1}{ax + b}$ | $\frac{1}{a}\ln|ax + b| + C$          | $u = ax + b$              | 线性偏移的对数似然积分              |
| $x e^{x^2}$      | $\frac{1}{2}e^{x^2} + C$              | $u = x^2$                 | 正态分布PDF的积分（凑微分）          |

## 三、工程实现（Python 法则与公式验证工具）
通过`sympy`实现符号积分（验证法则与公式正确性），`scipy`实现数值积分（工程应用），代码可直接在Jupyter中运行，适配AI场景的理论验证与实际计算。
```python
import numpy as np
import sympy as sp
from scipy import integrate

# 符号定义
x, t, lambda_, a, b = sp.symbols('x t lambda a b', real=True)
x_np = np.linspace(0, 5, 100)  # 数值积分采样点

def verify_integration_rule(func_expr, rule_type='linear'):
    """
    验证积分法则的正确性
    参数：
        func_expr: 被积函数（sympy表达式）
        rule_type: 法则类型（linear/ substitution/ integration_by_parts）
    返回：
        验证结果（bool）、理论积分结果、数值积分结果
    """
    # 符号积分（理论结果）
    symbolic_integral = sp.integrate(func_expr, x) + sp.Symbol('C')

    # 数值积分（近似结果，以x=0为基准）
    func_num = sp.lambdify(x, func_expr, 'numpy')
    numerical_integral = integrate.cumtrapz(func_num(x_np), x_np, initial=0)

    return symbolic_integral, numerical_integral

# ---------------------- 验证线性法则（混合分布CDF） ----------------------
# 混合分布PDF：0.7*2e^(-2x) + 0.3*3e^(-3x)
mixed_pdf = 0.7 * 2 * sp.exp(-2*x) + 0.3 * 3 * sp.exp(-3*x)
symbolic_cdf, numerical_cdf = verify_integration_rule(mixed_pdf, 'linear')
print("=== 线性法则验证（混合分布CDF） ===")
print(f"符号积分结果（CDF）：{symbolic_cdf.simplify()}")

# 理论CDF（确定C=0后）
cdf_theory = 1 - 0.7*sp.exp(-2*x) - 0.3*sp.exp(-3*x)
cdf_theory_num = sp.lambdify(x, cdf_theory, 'numpy')(x_np)

# 可视化对比
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 4))
plt.plot(x_np, numerical_cdf, label="数值积分结果", color='blue')
plt.plot(x_np, cdf_theory_num, '--', label="理论CDF", color='red')
plt.xlabel("x")
plt.ylabel("CDF(x)")
plt.title("混合分布CDF（线性法则验证）")
plt.legend()
plt.grid(alpha=0.3)
plt.show()

# ---------------------- 验证分部积分法则（指数分布期望） ----------------------
# 被积函数：x * lambda * e^(-lambda x)
expectation_expr = x * lambda_ * sp.exp(-lambda_ * x)
symbolic_expectation = sp.integrate(expectation_expr, x)
print("\n=== 分部积分法则验证（指数分布期望） ===")
print(f"不定积分结果：{symbolic_expectation.simplify()}")
# 代入上下限（0到+∞）并化简，应得到 1/lambda
limit_expr = sp.limit(symbolic_expectation, x, sp.oo) - symbolic_expectation.subs(x, 0)
print(f"定积分结果（期望）：{limit_expr.simplify()}")

# ---------------------- 验证基本公式（指数函数积分） ----------------------
exp_expr = sp.exp(-2*x)
symbolic_exp = sp.integrate(exp_expr, x)
print("\n=== 基本公式验证（指数函数积分） ===")
print(f"∫e^(-2x)dx = {symbolic_exp.simplify()}")  # 应输出 -1/2 e^(-2x) + C
```

## 四、常见误区与避坑指南（AI工程视角）
```html
<table style="width:100%; border-collapse: collapse; margin: 16px 0; font-size: 14px;">
  <thead>
    <tr style="background-color: #f5f5f5;">
      <th style="padding: 12px; text-align: left; border: 1px solid #ddd; font-weight: 600;">易错点</th>
      <th style="padding: 12px; text-align: left; border: 1px solid #ddd; font-weight: 600;">错误认知/操作</th>
      <th style="padding: 12px; text-align: left; border: 1px solid #ddd; font-weight: 600;">正确结论/操作</th>
      <th style="padding: 12px; text-align: left; border: 1px solid #ddd; font-weight: 600;">AI领域影响</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td style="padding: 12px; border: 1px solid #ddd;">幂函数积分公式记错</td>
      <td style="padding: 12px; border: 1px solid #ddd;">$\int x^n dx = \frac{x^{n}}{n} + C$（漏加1）</td>
      <td style="padding: 12px; border: 1px solid #ddd;">$\int x^n dx = \frac{x^{n+1}}{n+1} + C$（$n \neq -1$），$n=-1$时为$\ln|x| + C$</td>
      <td style="padding: 12px; border: 1px solid #ddd;">多项式奖励的累积计算错误，导致强化学习目标函数偏差</td>
    </tr>
    <tr style="background-color: #fafafa;">
      <td style="padding: 12px; border: 1px solid #ddd;">换元法忘记替换微分dx</td>
      <td style="padding: 12px; border: 1px solid #ddd;">$\int f(\varphi(x))dx = \int f(u)du$（未替换dx）</td>
      <td style="padding: 12px; border: 1px solid #ddd;">必须同时替换变量和微分：$x=\varphi(t) \implies dx=\varphi'(t)dt$</td>
      <td style="padding: 12px; border: 1px solid #ddd;">正态分布CDF近似错误，分类模型的概率预测偏差</td>
    </tr>
    <tr>
      <td style="padding: 12px; border: 1px solid #ddd;">分部积分法u/dv选择不当</td>
      <td style="padding: 12px; border: 1px solid #ddd;">$\int x e^{-x}dx$ 令 $u=e^{-x}$、$dv=xdx$（导致积分更复杂）</td>
      <td style="padding: 12px; border: 1px solid #ddd;">优先令多项式为u（易求导），指数/三角函数为dv（易积分）</td>
      <td style="padding: 12px; border: 1px solid #ddd;">期望/方差计算卡住，无法推进概率模型的参数估计</td>
    </tr>
    <tr style="background-color: #fafafa;">
      <td style="padding: 12px; border: 1px solid #ddd;">指数函数积分漏写系数</td>
      <td style="padding: 12px; border: 1px solid #ddd;">$\int e^{\lambda x}dx = e^{\lambda x} + C$（漏除$\lambda$）</td>
      <td style="padding: 12px; border: 1px solid #ddd;">$\int e^{\lambda x}dx = \frac{1}{\lambda}e^{\lambda x} + C$（$\lambda \neq 0$）</td>
      <td style="padding: 12px; border: 1px solid #ddd;">指数分布的CDF计算错误，导致生存分析的寿命预测偏差</td>
    </tr>
    <tr>
      <td style="padding: 12px; border: 1px solid #ddd;">忽略积分常数C的确定</td>
      <td style="padding: 12px; border: 1px solid #ddd;">CDF计算中直接省略C，导致$F(+\infty) \neq 1$</td>
      <td style="padding: 12px; border: 1px solid #ddd;">通过分布性质（$F(-\infty)=0$、$F(+\infty)=1$）或初始条件确定C</td>
      <td style="padding: 12px; border: 1px solid #ddd;">概率归一化失败，分类模型的概率之和不等于1</td>
    </tr>
  </tbody>
</table>
```

## 五、学习建议（CS/AI 方向专属）
1. **公式记忆+场景绑定**：不要孤立记忆公式，将每个公式与AI场景强关联（如 $\int e^{\lambda x}dx$ → 指数分布CDF，$\int x p(x)dx$ → 期望计算），通过场景反推公式；
2. **法则优先级排序**：计算积分时，优先用“线性法则拆分”，再用“第一类换元法凑微分”，最后用“分部积分法”，避免一开始就用复杂法则；
3. **强化验证习惯**：工程中通过“求导验证积分结果”（互逆性质），例如计算完CDF后，求导看是否等于PDF，避免计算错误；
4. **聚焦高频场景**：AI中90%的积分是“幂函数+指数函数+多项式乘积”，重点精通这三类函数的积分，三角函数、反三角函数按需学习；
5. **结合框架工具**：用`sympy`做理论推导（如公式验证），用`scipy.integrate`做工程数值积分（如复杂奖励函数），无需手动计算高难度积分。

是否需要我针对**定积分的运算法则与AI应用**（如概率计算、模型期望损失）或**复杂积分场景的工程优化**（如高维积分降维），提供更详细的案例和代码？