

# 📐 峰度（Kurtosis）推导与理解

峰度是一种衡量分布形状尖锐程度的统计量，特别反映尾部厚度和异常值集中度。

---

## 🧮 数学推导公式

### 1. 原始定义：四阶中心矩标准化
定义一组数据：$X = \{x_1, x_2, ..., x_n\}$，其均值为 $\mu$，标准差为 $\sigma$

四阶中心矩公式： $$ \mu_4 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^4 $$

标准化处理（使不同数据集可比）： $$ \text{Kurtosis} = \frac{\mu_4}{\sigma^4} = \frac{1}{n} \sum_{i=1}^{n} \left( \frac{x_i - \mu}{\sigma} \right)^4 $$

这就是峰度的原始定义，它计算的是每个点与均值的标准化距离的四次方平均。

- 表示所有数据点与均值之间标准化距离的四次方平均值
- 四次方放大远离均值的数据点影响，强调尾部行为

---

### 2. 过峰度（Excess Kurtosis）：偏离正态分布的程度

标准正态分布峰度为 3，因此我们定义“过峰度”：

$$
\text{Excess Kurtosis} = \frac{1}{n} \sum_{i=1}^{n} \left( \frac{x_i - \mu}{\sigma} \right)^4 - 3
$$

- **结果 > 0**：尖峰重尾（异常值多）
- **结果 < 0**：平坦分布（数据分散）
- **结果 = 0**：近似正态分布

---




## ⚙️ Python 示例（使用 `scipy.stats`）


In [1]:
import scipy.stats as stats

data = [12, 15, 14, 13, 14, 100]  # 含极端高值
kurt_val = stats.kurtosis(data, fisher=True, bias=False)
print("Excess Kurtosis:", kurt_val)

Excess Kurtosis: 5.98250897323009
