# 🔀 偏度（Skewness）推导与理解

偏度是一种衡量分布**对称性**的统计量，反映数据在平均值左右是否存在倾斜。它能揭示数据是否更偏向低值或高值，尤其在信号分析、金融波动性评估中非常重要。

---

## 📐 数学定义与推导

设数据集为 $X = \{x_1, x_2, ..., x_n\}$，其平均值为 $\mu$，标准差为 $\sigma$，则偏度定义如下：

### 1. 三阶中心矩标准化公式

$$
\text{Skewness} = \frac{1}{n} \sum_{i=1}^{n} \left( \frac{x_i - \mu}{\sigma} \right)^3
$$

- 使用 **三次方** 是为了保留“符号”（方向性）：
  - 高值在右边 → 正偏（右偏）
  - 低值在左边 → 负偏（左偏）
- 对称分布（三次偏移相互抵消） → Skewness ≈ 0

---

## 📊 偏度的意义

| 偏度值 | 分布形态     | 说明                             |
|--------|--------------|----------------------------------|
| > 0    | 右偏分布     | 数据向右侧（高值）倾斜，尾巴在右 |
| < 0    | 左偏分布     | 数据向左侧（低值）倾斜，尾巴在左 |
| = 0    | 对称分布     | 近似钟形，如正态分布              |

---

## ⚙️ Python 示例（使用 `scipy.stats`）

```python
import scipy.stats as stats

data = [1, 2, 3, 4, 100]  # 含右偏高值
skew_val = stats.skew(data, bias=False)
print("Skewness:", skew_val)


In [2]:
import scipy.stats as stats

data = [1, 2, 3, 4, 100]  # 含右偏高值
skew_val = stats.skew(data, bias=False)
print("Skewness:", skew_val)

Skewness: 2.232395911636458
