# 束搜索（Beam Search）

束搜索（Beam Search）是一种在序列生成任务中常用的搜索算法，特别是在自然语言处理（NLP）领域，如机器翻译、文本摘要、对话生成等。与贪心搜索（Greedy Search）不同，束搜索在每一步都保留多个候选序列，从而增加了找到全局最优解的可能性。

## 1. 基本概念

### 1.1 贪心搜索（Greedy Search）

贪心搜索是一种简单的搜索策略，它在每一步都选择当前最优的选项，即概率最大的下一个词。虽然贪心搜索计算效率高，但它往往只能找到局部最优解，而不是全局最优解。

### 1.2 束搜索（Beam Search）

束搜索通过在每一步保留多个候选序列（称为“束”）来改进贪心搜索。具体来说，束搜索在每一步生成多个候选序列，并根据它们的概率进行排序，然后只保留概率最高的几个序列，继续进行下一步的生成。

- **束大小（Beam Size）**：束搜索中保留的候选序列的数量。束大小越大，找到全局最优解的可能性越高，但计算复杂度也越高。

## 2. 工作原理

### 2.1 初始化

- 初始时，束中只有一个序列，即空序列。

### 2.2 每一步的生成

- 对于束中的每个序列，生成所有可能的下一个词，并计算它们的概率。
- 将所有生成的序列（包括原来的序列和新添加的词）放入一个候选列表中。
- 根据概率对候选列表进行排序，并保留概率最高的 `k` 个序列（`k` 是束大小）。

### 2.3 终止条件

- 当生成的序列达到预定的长度，或者生成的序列中包含终止符（如句号 `.`）时，停止生成。

![Beam Search](https://d2l.ai/_images/beam-search.svg "Beam Search")

## 3. 优点与局限性

### 3.1 优点

- **全局搜索**：相比于贪心搜索，束搜索能够更好地探索搜索空间，从而增加找到全局最优解的可能性。
- **灵活性**：束大小可以根据任务需求进行调整，以平衡计算复杂度和搜索效果。

### 3.2 局限性

- **计算复杂度**：束搜索的计算复杂度随着束大小的增加而增加，尤其是在处理长序列时。
- **概率归一化**：束搜索通常使用对数概率来避免数值下溢问题，但在某些情况下，概率归一化可能会影响搜索效果。

## 4. 应用场景

- **机器翻译**：在生成翻译后的句子时，束搜索可以帮助找到最合适的翻译结果。
- **文本摘要**：在生成摘要时，束搜索可以帮助找到最简洁且信息量最大的摘要。
- **对话生成**：在生成对话回复时，束搜索可以帮助找到最合适的回复。

## 5. 改进与变体

### 5.1 长度归一化（Length Normalization）

在束搜索中，序列的概率通常是多个词的概率的乘积，这可能导致数值下溢问题。为了解决这个问题，可以使用对数概率，并在最终排序时进行长度归一化，即除以序列的长度。

### 5.2 多样性束搜索（Diverse Beam Search）

为了增加生成结果的多样性，可以在束搜索中引入多样性约束，确保生成的序列之间具有一定的差异性。

## 6. 总结

束搜索是一种在序列生成任务中常用的搜索算法，通过在每一步保留多个候选序列，增加了找到全局最优解的可能性。尽管计算复杂度较高，但束搜索在许多NLP任务中表现出色，尤其是在需要生成高质量序列的场景中。
