# 📘 Johnson SU 分布笔记


## ✨ 什么是 Johnson SU 分布？

**Johnson SU 分布**是一种灵活的概率分布，可以拟合许多非对称、重尾的实际数据分布，尤其适用于右偏或不规则形状的数据。

它是 Johnson 系列分布（1949年）中的一种，属于 "SU" 类型，代表 **Unbounded（无界）**。

---

### 📐 分布形式：

Johnson SU 是通过对正态分布变量 $Z \sim \mathcal{N}(0,1)$ 做变换得到的：

$$
Z = \gamma + \delta \sinh^{-1}\left(\frac{x - \xi}{\lambda}\right)
$$

- $\gamma, \delta$ 控制形状（偏态度、峰度）
- $\xi$ 是位置参数
- $\lambda$ 是尺度参数

---

## ✅ 特性

| 特性             | 说明 |
|------------------|------|
| 非对称性         | 可拟合左右不对称数据 |
| 厚尾（重尾）     | 适用于异常值多的分布 |
| 可近似正态分布   | 特定参数下可退化为正态分布 |
| 灵活性高         | 拟合能力强于正态、对数正态 |

---

## 🧪 拟合方法（用 Scipy）

```python
from scipy.stats import johnsonsu
params = johnsonsu.fit(data)  # MLE 拟合
sns.distplot(data, fit=johnsonsu)
```

- 这会返回 $\gamma, \delta, \xi, \lambda$
- 并画出该分布的拟合曲线


In [None]:

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import johnsonsu, norm, lognorm

# 模拟偏态数据
np.random.seed(0)
data = np.random.lognormal(mean=10, sigma=0.4, size=1000)

# 拟合 JohnsonSU
sns.set_style("whitegrid")
plt.figure(figsize=(14, 4))

plt.subplot(1, 3, 1)
sns.histplot(data, kde=False, stat="density", bins=40, color='skyblue')
sns.lineplot(x=np.linspace(min(data), max(data), 100),
             y=johnsonsu.pdf(np.linspace(min(data), max(data), 100), *johnsonsu.fit(data)),
             label="Johnson SU", color='red')
plt.title("Johnson SU 拟合")

plt.subplot(1, 3, 2)
sns.histplot(data, kde=False, stat="density", bins=40, color='skyblue')
sns.lineplot(x=np.linspace(min(data), max(data), 100),
             y=norm.pdf(np.linspace(min(data), max(data), 100), *norm.fit(data)),
             label="Normal", color='green')
plt.title("正态分布拟合")

plt.subplot(1, 3, 3)
sns.histplot(data, kde=False, stat="density", bins=40, color='skyblue')
sns.lineplot(x=np.linspace(min(data), max(data), 100),
             y=lognorm.pdf(np.linspace(min(data), max(data), 100), *lognorm.fit(data)),
             label="Lognormal", color='orange')
plt.title("对数正态拟合")

plt.tight_layout()
plt.show()
