# 复合函数（CS/AI 专项笔记·进阶版）

## 1. 严格定义（大学阶段纯数学表述）

### 1.1 复合函数的核心定义

- **文字描述**：设函数 $g: D_g \to R_g$（定义域为 $D_g$，值域为 $R_g$），函数 $f: D_f \to R_f$（定义域为 $D_f$，值域为 $R_f$）。若 $g$ 的值域与 $f$ 的定义域满足 $R_g \cap D_f \neq \emptyset$，则对任意 $x \in D = \{x \mid x \in D_g, g(x) \in D_f\}$，通过“$x \to g(x) \to f(g(x))$”的连续映射确定的新函数，称为 $f$ 与 $g$ 的复合函数，记为 $f \circ g$（读作“$f$ 复合 $g$”），即 $(f \circ g)(x) = f(g(x))$。
- **数学描述**：$(f \circ g)(x) = f(g(x))$，其中定义域 $D(f \circ g) = \{x \in D_g \mid g(x) \in D_f\}$。
- **关键前提**：内层函数的值域与外层函数的定义域必须有非空交集（$R_g \cap D_f \neq \emptyset$），否则复合函数无意义。

### 1.2 核心概念辨析

- **复合顺序**：复合函数是“先内后外”的映射，$f \circ g$ 与 $g \circ f$ 通常不相等（顺序不可交换）。例如 $f(x) = x+1$，$g(x) = x^2$，则 $(f \circ g)(x) = x^2 + 1$，$(g \circ f)(x) = (x+1)^2$，显然不同；
- **定义域传递**：复合函数的定义域由内层函数定义域和“内层函数值属于外层函数定义域”共同决定；
- **多层复合**：可推广至多个函数的连续复合（如 $f \circ g \circ h(x) = f(g(h(x)))$），需满足“前一个函数的值域与后一个函数的定义域有非空交集”。

## 2. 核心性质与原理

### 2.1 复合函数的关键性质

<table style="width:100%; border-collapse: collapse; margin: 16px 0; font-size: 14px;">
  <thead>
    <tr style="background-color: #f5f5f5;">
      <th style="padding: 12px; text-align: left; border: 1px solid #ddd; font-weight: 600;">性质名称</th>
      <th style="padding: 12px; text-align: left; border: 1px solid #ddd; font-weight: 600;">具体描述</th>
      <th style="padding: 12px; text-align: left; border: 1px solid #ddd; font-weight: 600;">CS/AI 核心应用</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td style="padding: 12px; border: 1px solid #ddd;">单调性（同增异减）</td>
      <td style="padding: 12px; border: 1px solid #ddd;">设 $y=f(u)$（外层），$u=g(x)$（内层）：<br/>① 外层递增 + 内层递增 $\implies$ 复合函数递增；<br/>② 外层递增 + 内层递减 $\implies$ 复合函数递减；<br/>③ 外层递减 + 内层递减 $\implies$ 复合函数递增；<br/>④ 外层递减 + 内层递增 $\implies$ 复合函数递减。</td>
      <td style="padding: 12px; border: 1px solid #ddd;">激活函数组合：ReLU（递增）与线性变换（递增）复合，保证神经网络梯度方向一致；注意力机制中多层映射的单调性传递。</td>
    </tr>
    <tr style="background-color: #fafafa;">
      <td style="padding: 12px; border: 1px solid #ddd;">奇偶性传递</td>
      <td style="padding: 12px; border: 1px solid #ddd;">① 外层偶函数 + 内层任意函数 $\implies$ 复合函数偶函数；<br/>② 外层奇函数 + 内层奇函数 $\implies$ 复合函数奇函数；<br/>③ 外层奇函数 + 内层偶函数 $\implies$ 复合函数偶函数。</td>
      <td style="padding: 12px; border: 1px solid #ddd;">对称数据处理：图像识别中，对称特征提取函数（偶函数）与数据变换（任意函数）复合，保持特征的对称性。</td>
    </tr>
    <tr>
      <td style="padding: 12px; border: 1px solid #ddd;">双射性传递</td>
      <td style="padding: 12px; border: 1px solid #ddd;">若 $f(u)$ 和 $g(x)$ 均为双射，则复合函数 $f(g(x))$ 也为双射，且其反函数满足 $(f \circ g)^{-1} = g^{-1} \circ f^{-1}$（反函数“穿脱原则”反向）。</td>
      <td style="padding: 12px; border: 1px solid #ddd;">生成模型逆变换：Flow 模型中多层单调可逆变换的复合，其反函数可拆解为各层反函数的反向复合，简化对数似然计算。</td>
    </tr>
    <tr style="background-color: #fafafa;">
      <td style="padding: 12px; border: 1px solid #ddd;">结合律成立</td>
      <td style="padding: 12px; border: 1px solid #ddd;">对任意可复合的函数 $f, g, h$，有 $(f \circ g) \circ h = f \circ (g \circ h)$（复合运算满足结合律，但不满足交换律）。</td>
      <td style="padding: 12px; border: 1px solid #ddd;">神经网络层间组合：深层网络的前向传播可视为多层函数的复合，结合律保证层序调整（不改变映射逻辑）的可行性。</td>
    </tr>
  </tbody>
</table>

### 2.2 本质原理

复合函数的核心本质是“映射的嵌套传递”——将内层函数的输出作为外层函数的输入，实现“多步映射的一次性封装”。这种嵌套结构在数学上简化了复杂映射的表达，在工程上则对应“模块化处理”：例如神经网络的每一层是一个简单函数，整个网络的前向传播就是这些函数的复合，既便于分层设计，也便于通过链式法则计算梯度。

关键前提“内层值域与外层定义域相交”的本质是“数据兼容性”：只有内层函数的输出能被外层函数处理（属于外层定义域），整个复合映射才有效，这也是实际应用中（如特征工程、模型组网）必须保证的“数据格式匹配”原则。

## 3. 关键公式与推导（含复合函数定义域求解）

### 3.1 复合函数定义域的求解步骤

1. **明确内外层函数**：设复合函数为 $(f \circ g)(x) = f(g(x))$，其中 $u = g(x)$ 是内层函数，$f(u)$ 是外层函数；
2. **列出约束条件**：
   - 内层函数的定义域约束：$x \in D_g$；
   - 内层函数值属于外层函数定义域：$g(x) \in D_f$；
3. **求解交集**：复合函数的定义域是上述两个约束条件的交集，即 $D(f \circ g) = D_g \cap \{x \mid g(x) \in D_f\}$。

### 3.2 典型复合函数定义域与表达式推导

#### 示例 1：基本初等函数复合

已知 $f(u) = \sqrt{u}$（$D_f = [0, +\infty)$），$g(x) = x^2 - 1$（$D_g = \mathbb{R}$），求 $(f \circ g)(x)$ 的定义域与表达式。

- **表达式**：$(f \circ g)(x) = f(g(x)) = \sqrt{x^2 - 1}$；
- **定义域求解**：
  1. 内层定义域：$x \in \mathbb{R}$；
  2. 内层函数值约束：$g(x) = x^2 - 1 \geq 0 \implies x^2 \geq 1 \implies x \leq -1$ 或 $x \geq 1$；
  3. 交集：$D(f \circ g) = (-\infty, -1] \cup [1, +\infty)$。

#### 示例 2：分段函数复合

已知 $f(u) = \begin{cases} 2u, & u \geq 0 \\ u + 1, & u < 0 \end{cases}$，$g(x) = \begin{cases} x - 1, & x \geq 1 \\ -x, & x < 1 \end{cases}$，求 $(f \circ g)(x)$ 的表达式。

- **分情况讨论（按内层函数值的符号）**：
  1. 当 $x \geq 1$ 时，$g(x) = x - 1 \geq 0$，故 $f(g(x)) = 2(x - 1) = 2x - 2$；
  2. 当 $x < 1$ 时，$g(x) = -x$：
     - 若 $-x \geq 0$（即 $x \leq 0$），则 $f(g(x)) = 2(-x) = -2x$；
     - 若 $-x < 0$（即 $0 < x < 1$），则 $f(g(x)) = (-x) + 1 = 1 - x$；
- **整合表达式**：$(f \circ g)(x) = \begin{cases} 2x - 2, & x \geq 1 \\ 1 - x, & 0 < x < 1 \\ -2x, & x \leq 0 \end{cases}$。

### 3.3 伪代码（复合函数构建与定义域计算）

## 4. 例题解析（大学函数章节高频题型）

### 例题 1：复合函数定义域与表达式求解

**题目**：已知 $f(x) = \frac{1}{x - 2}$（$x \neq 2$），$g(x) = \sqrt{x + 3}$（$x \geq -3$），求 $(f \circ g)(x)$ 和 $(g \circ f)(x)$ 的定义域与表达式。

**解析**：

#### （1）求 $(f \circ g)(x) = f(g(x))$

- **表达式**：$f(g(x)) = \frac{1}{g(x) - 2} = \frac{1}{\sqrt{x + 3} - 2}$；
- **定义域约束**：
  1. 内层定义域：$x \geq -3$（$g(x)$ 的定义域）；
  2. 外层定义域约束：$g(x) \neq 2$（$f(u)$ 的定义域要求 $u \neq 2$）$\implies \sqrt{x + 3} \neq 2 \implies x + 3 \neq 4 \implies x \neq 1$；
  3. 根号下非负已由内层定义域保证；
- **定义域**：$[-3, 1) \cup (1, +\infty)$。

#### （2）求 $(g \circ f)(x) = g(f(x))$

- **表达式**：$g(f(x)) = \sqrt{f(x) + 3} = \sqrt{\frac{1}{x - 2} + 3}$；
- **定义域约束**：
  1. 内层定义域：$x \neq 2$（$f(x)$ 的定义域）；
  2. 外层定义域约束：$f(x) + 3 \geq 0$（$g(u)$ 的定义域要求 $u \geq 0$）$\implies \frac{1}{x - 2} + 3 \geq 0 \implies \frac{3x - 5}{x - 2} \geq 0$；
  3. 解不等式 $\frac{3x - 5}{x - 2} \geq 0$：
     - 分子分母零点：$x = \frac{5}{3}$，$x = 2$；
     - 分段讨论得：$x \leq \frac{5}{3}$ 或 $x > 2$；
- **定义域**：$(-\infty, \frac{5}{3}] \cup (2, +\infty)$。

### 例题 2：复合函数单调性证明（同增异减）

**题目**：已知 $f(u) = \ln u$（$u > 0$）严格递增，$g(x) = x^2 + 4x + 3$（$x > -2$）严格递增，证明复合函数 $(f \circ g)(x) = \ln(x^2 + 4x + 3)$ 在 $(-2, -1)$ 上严格递增。

**证明过程**：

1. **明确复合关系**：内层 $g(x) = x^2 + 4x + 3$，外层 $f(u) = \ln u$，复合函数定义域需满足 $g(x) > 0$：
   - 解 $x^2 + 4x + 3 > 0 \implies (x + 1)(x + 3) > 0 \implies x < -3$ 或 $x > -1$；
   - 结合内层递增区间 $x > -2$，复合函数的有效递增区间为 $(-2, -1)$（题目指定区间）；
2. **任取 $x_1 < x_2 \in (-2, -1)$**；
3. 因 $g(x)$ 在 $(-2, -1)$ 严格递增，故 $g(x_1) < g(x_2)$，且 $g(x_1), g(x_2) > 0$（由定义域保证）；
4. 因 $f(u)$ 在 $(0, +\infty)$ 严格递增，且 $g(x_1) < g(x_2)$，故 $f(g(x_1)) < f(g(x_2))$；
5. 综上，$\forall x_1 < x_2 \in (-2, -1)$，有 $(f \circ g)(x_1) < (f \circ g)(x_2)$，故复合函数在 $(-2, -1)$ 上严格递增。

### 例题 3：CS/AI 场景应用（神经网络前向传播的复合函数）

**题目**：神经网络的单隐藏层前向传播可表示为复合函数：$y = \sigma(W_2 \cdot \sigma(W_1x + b_1) + b_2)$，其中 $\sigma(u) = \frac{1}{1 + e^{-u}}$（Sigmoid 激活函数，在 $\mathbb{R}$ 上单调递增），$W_1, W_2$ 为权重矩阵，$b_1, b_2$ 为偏置项。若 $W_1, W_2$ 均为正定矩阵（保证线性变换 $Wx + b$ 单调递增），证明该前向传播函数单调递增。

**解析**：

1. **拆解复合结构**：
   - 第一层复合：$h_1(x) = \sigma(W_1x + b_1)$（内层：线性变换 $u_1 = W_1x + b_1$，外层：Sigmoid 函数）；
   - 第二层复合：$y = \sigma(W_2h_1(x) + b_2)$（内层：线性变换 $u_2 = W_2h_1(x) + b_2$，外层：Sigmoid 函数）；
2. **单调性传递分析**：
   - 线性变换 $u_1 = W_1x + b_1$：因 $W_1$ 正定，对任意 $x_1 < x_2$，有 $W_1x_1 + b_1 < W_1x_2 + b_2$（严格递增）；
   - 第一层复合 $h_1(x)$：外层 Sigmoid 递增 + 内层线性变换递增 $\implies h_1(x)$ 严格递增；
   - 线性变换 $u_2 = W_2h_1(x) + b_2$：$W_2$ 正定 + $h_1(x)$ 递增 $\implies u_2$ 严格递增；
   - 第二层复合 $y$：外层 Sigmoid 递增 + 内层 $u_2$ 递增 $\implies y$ 严格递增；
3. **结论**：整个前向传播函数 $y = \sigma(W_2 \cdot \sigma(W_1x + b_1) + b_2)$ 严格递增，保证输入特征的单调性在输出中传递，适用于需要“特征值越大，预测结果越优”的场景（如信用评分）。

## 5. 典型应用场景（CS/AI 专项）

### 场景 1：神经网络前向传播

- **核心依赖**：复合函数的“多层嵌套”特性，将线性变换与激活函数组合为复杂映射；
- **具体应用**：
  - 全连接网络：每一层是“线性变换 + 激活函数”的复合，整个网络是多层复合函数；
  - Transformer 模型：自注意力机制的计算（QKV 映射、缩放点积、Softmax）可表示为复合函数，结合律保证并行计算的可行性。

### 场景 2：特征工程与数据预处理

- **核心依赖**：复合函数实现“多步预处理的封装”，简化数据转换流程；
- **具体应用**：
  - 标准化 + 非线性变换：$f(g(x)) = \sigma\left(\frac{x - \mu}{\sigma}\right)$（先标准化 $g(x)$，再通过 Sigmoid 映射到 $[0,1]$）；
  - 图像增强：$f(g(x)) = \text{GammaCorrection}(\text{Normalize}(x))$（先归一化，再伽马校正），复合函数保证处理流程的可复现性。

### 场景 3：生成模型与概率映射

- **核心依赖**：复合函数的双射性传递，实现复杂分布的可逆变换；
- **具体应用**：
  - Flow 模型：通过多层“单调可逆变换”的复合，将简单高斯分布映射到复杂数据分布，复合函数的反函数可拆解为各层反函数的反向复合；
  - GAN 生成器：生成器是“噪声→中间特征→原始数据”的复合映射，保证生成过程的连续性与可优化性。

### 场景 4：信号处理与滤波

- **核心依赖**：复合函数实现“多阶段滤波”，每一步滤波对应一个简单函数，复合后实现复杂信号处理；
- **具体应用**：
  - 音频降噪：$f(g(x)) = \text{WienerFilter}(\text{FFT}(x))$（先傅里叶变换到频域，再维纳滤波，最后逆傅里叶变换）；
  - 图像边缘检测：$f(g(x)) = \text{Threshold}(\text{Sobel}(x))$（先 Sobel 算子提取梯度，再阈值化得到边缘）。

## 6. 经典证明题（函数章节专属，无超纲知识）

### 证明题 1：证明复合函数的结合律

#### 已知

设函数 $f, g, h$ 满足：$h$ 的值域与 $g$ 的定义域相交，$g$ 的值域与 $f$ 的定义域相交（即 $f \circ (g \circ h)$ 和 $(f \circ g) \circ h$ 均有意义）。

#### 求证

$(f \circ g) \circ h = f \circ (g \circ h)$。

#### 证明过程

1. **定义等价性证明**：需证明对任意 $x$（属于两个复合函数的公共定义域），有 $[(f \circ g) \circ h](x) = [f \circ (g \circ h)](x)$；
2. 展开左边表达式：$[(f \circ g) \circ h](x) = (f \circ g)(h(x)) = f(g(h(x)))$；
3. 展开右边表达式：$[f \circ (g \circ h)](x) = f((g \circ h)(x)) = f(g(h(x)))$；
4. 左边 = 右边，故对任意有效 $x$，两个复合函数的值相等；
5. 又因两个复合函数的定义域均为 $\{x \mid x \in D_h, h(x) \in D_g, g(h(x)) \in D_f\}$（公共定义域），故 $(f \circ g) \circ h = f \circ (g \circ h)$。

### 证明题 2：证明“外层递减 + 内层递减 → 复合函数递增”

#### 已知

设 $y = f(u)$（外层）在 $D_f$ 上严格递减，$u = g(x)$（内层）在 $D_g$ 上严格递减，且 $R_g \cap D_f \neq \emptyset$，复合函数 $(f \circ g)(x) = f(g(x))$ 的定义域为 $D$。

#### 求证

$(f \circ g)(x)$ 在 $D$ 上严格递增。

#### 证明过程

1. 任取 $x_1 < x_2 \in D$；
2. 因 $g(x)$ 在 $D_g$ 上严格递减，且 $x_1 < x_2$，故 $g(x_1) > g(x_2)$，且 $g(x_1), g(x_2) \in D_f$（由复合函数定义域保证）；
3. 因 $f(u)$ 在 $D_f$ 上严格递减，且 $g(x_1) > g(x_2)$，故 $f(g(x_1)) < f(g(x_2))$；
4. 由 $x_1 < x_2$ 可推出 $(f \circ g)(x_1) < (f \circ g)(x_2)$，符合严格递增定义；
5. 结论：$(f \circ g)(x)$ 在 $D$ 上严格递增。

### 证明题 3：证明双射函数的复合仍为双射

#### 已知

$f(u)$ 和 $g(x)$ 均为双射函数，复合函数 $(f \circ g)(x) = f(g(x))$。

#### 求证

$(f \circ g)(x)$ 是双射函数。

#### 证明过程

需分别证明复合函数是单射和满射：

1. **证明单射**：
   - 任取 $x_1, x_2 \in D(f \circ g)$，若 $(f \circ g)(x_1) = (f \circ g)(x_2)$，即 $f(g(x_1)) = f(g(x_2))$；
   - 因 $f$ 是单射（双射必为单射），故 $g(x_1) = g(x_2)$；
   - 因 $g$ 是单射，故 $x_1 = x_2$，因此复合函数是单射。
2. **证明满射**：
   - 任取 $y \in R(f)$（$f$ 的值域），因 $f$ 是满射，存在 $u \in D_f$ 使得 $f(u) = y$；
   - 因 $g$ 是满射，存在 $x \in D_g$ 使得 $g(x) = u$，且 $x \in D(f \circ g)$（因 $u = g(x) \in D_f$）；
   - 故存在 $x$ 使得 $(f \circ g)(x) = f(g(x)) = f(u) = y$，因此复合函数是满射。
3. **结论**：复合函数既是单射又是满射，故为双射。

## 7. 拓展与联系（知识体系定位）

### 7.1 前置知识

- 函数的定义域、值域与映射关系；
- 单调函数、双射函数的定义与判定；
- 不等式求解与分段函数分析。

### 7.2 后续延伸

- **微积分**：复合函数求导的链式法则（$(f \circ g)'(x) = f'(g(x)) \cdot g'(x)$），是导数计算的核心法则；
- **实变函数**：复合函数的可测性、可积性（可测函数的复合仍为可测函数）；
- **CS 算法**：函数式编程中的“函数复合”算子（如 Python 的 `functools.compose`），实现模块化代码设计；
- **AI 优化理论**：神经网络梯度下降的反向传播算法，本质是链式法则在多层复合函数上的应用。

### 7.3 在 CS/AI 体系中的位置

- **数学基础层**：连接简单函数与复杂映射的核心工具，是微积分、机器学习理论的前置基础；
- **模型设计层**：神经网络、生成模型、信号处理算法的核心结构载体；
- **优化层**：反向传播、梯度计算的理论基础（依赖复合函数求导的链式法则）；
- **工程实现层**：模块化编程、数据预处理流水线、模型组网的数学本质。