### 条件概率

**概率**（probability）是从随机试验中的事件到实数域的映射函数，用于表示事件发生的可能性，事件 $A$ 发生的概率通常记为 $P(A)$。

如果 $A$ 和 $B$ 是样本空间 $\Omega$ 上的两个事件，且 $P(B) > 0$，那么在给定 $B$ 时 $A$ 的**条件概率**（conditional probability）为：

$$
P(A|B) = \frac {P(A \cap B)}{P(B)}
$$

$P(A|B)$ 表示在事件 $B$ 发生的条件下，事件 $A$ 发生的概率。

同理可得：

$$
P(B|A) = \frac {P(A \cap B)}{P(A)}
$$

结合上面两个公式，得到概率的**乘法定理**（也叫乘法法则）：

$$
P(A \cap B) = P(A)P(B|A) = P(B)P(A|B)
$$

$P(A \cap B)$ 称为**联合概率**，表示事件 A 和 B 同时发生的概率。

### 独立事件

在条件概率中，如果事件 A 和 B 是相互独立的，也就是说事件 A 的发生和事件 B 没有任何关系，我们有：

$$
P(A|B) = P(A)
$$

上面的式子也可以解释成，无论事件 B 有没有发生，事件 A 发生的概率都不变。于是对于独立事件，我们得到一个很重要的公式，这个公式是 **朴素贝叶斯**（naive Bayes）的前提：

$$
P(A \cap B) = P(A)P(B)
$$

推广到一般形式：

$$
P(A_1 \cap A_2 \cap \dots \cap A_n) = P(A_1)P(A_2) \dots P(A_n)
$$

### 全概率公式

上面我们假设 $A$ 是样本空间 $\Omega$ 上的一个事件，我们把这个事件的对立事件记为 $\bar{A}$，很显然，样本空间是 $A$ 和 $\bar{A}$ 两个事件之和。于是，事件 $B$ 的概率可以写成下面这样：

$$
\begin{align}
P(B) &= P(B \cap A) + P(B \cap \bar{A}) \\
&= P(B|A)P(A) + P(B|\bar{A})P(\bar{A})
\end{align}
$$

这就是**全概率公式**。这个公式可以推广到一般形式，假设 $A_1, A_2, ..., A_n$ 是样本空间 $\Omega$ 的一个划分，即 $\sum_{i=1}^nA_i = \Omega$，并且 $A_i$ 互不相交，则有：

$$
P(B) = \sum_{i=1}^n P(B|A_i)P(A_i)
$$

### 贝叶斯定理

根据上面概率的乘法定理，可以得到下面的公式：

$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$

这个公式被称为 **贝叶斯公式**，也叫 **贝叶斯法则** 或 **贝叶斯定理**（Bayesian theorem），它是英国数学家托马斯·贝叶斯（Thomas Bayes）在1763年提出的，这个公式可以用于条件概率的求解。

推广到一般形式，我们可以把样本空间划分成 $A_1, A_2, ..., A_n$，根据前面的全概率公式，则可以计算出每个划分 $A_i$ 的条件概率：

$$
P(A_i|B) = \frac{P(B|A_i)P(A_i)}{\sum_{i=1}^n P(B|A_i)P(A_i)}
$$

在上面的公式中，$P(A_i)$ 是在事件 B 发生之前 $A_i$ 的概率，所以叫做 **先验概率**（Prior probability）或 **边缘概率**，而 $P(A_i|B)$ 指的是事件 B 发生后，对 $A_i$ 的概率进行修正，我们把它叫做 **后验概率**（Posterior probability），$P(B|A_i)$ 叫做 **类条件概率**（class-conditional probability）或 **似然**（Likelihood）。

疑惑：全概率公式在贝叶斯定理中有什么用？

### 贝叶斯定理实例

我们以一个实例来看看贝叶斯定理在实际中的应用。假设有两个箱子 A 和 B，箱子 A 中装了 5 个球，有一个坏球，箱子 B 中装了 3 个球，有 2 个坏球。

|箱子|总球数|坏球数|
|----|-----|-----|
|A   |5    |1    |
|B   |3    |2    |

现在有一个人从两个箱子中随机挑一个箱子并拿出一个球，发现是坏球，请问这个球可能来自哪个箱子？

这是一个典型的条件概率问题，要想知道球来自哪个箱子的概率最大，我们可以计算出球来自箱子 A 的概率，和来自箱子 B 的概率，比较其大小，就知道最有可能来自哪个箱子了。也就是计算 $P(A|bad)$ 和 $P(B|bad)$。

根据贝叶斯定理很容易得出：

$$
P(A|bad) = \frac{P(bad|A)P(A)}{P(bad)} = \frac{\frac{1}{5} \times \frac{1}{2}}{\frac{3}{8}} = \frac{4}{15}
$$

$$
P(B|bad) = \frac{P(bad|B)P(B)}{P(bad)} = \frac{\frac{2}{3} \times \frac{1}{2}}{\frac{3}{8}} = \frac{8}{9}
$$

很显然，这个球来自箱子 B 的概率最大。