## 極値分布

極値分布（Extreme Value Distribution）とは、データセットの極端な値（最大値や最小値）を記述するための確率分布です。これは、特に大規模なデータセットにおける異常値や極端な事象の発生確率を評価する際に重要です。

### 極値理論
極値理論は、独立同分布の確率変数列における最大値や最小値の漸近分布を研究する理論です。代表的な極値分布には以下の3種類があります：

1. **Gumbel分布**（Type I極値分布）
2. **Fréchet分布**（Type II極値分布）
3. **Weibull分布**（Type III極値分布）

これらは合わせて一般化された極値分布（Generalized Extreme Value Distribution, GEV）と呼ばれます。

### Gumbel分布
Gumbel分布は、特に最大値の分布をモデル化する際に使用されます。累積分布関数（CDF）は次のように表されます：

$$
F(x) = \exp\left(-\exp\left(-\frac{x - \mu}{\beta}\right)\right)
$$

ここで、$\mu$ は位置パラメータ、$\beta$ は尺度パラメータです。

### Fréchet分布
Fréchet分布は、特に上限が存在しない場合の極値の分布をモデル化する際に使用されます。累積分布関数は次のように表されます：

$$
F(x) = \begin{cases}
0 & \text{if } x \leq 0 \\
\exp\left(-x^{-\alpha}\right) & \text{if } x > 0
\end{cases}
$$

ここで、$\alpha$ は形状パラメータです。

### Weibull分布
Weibull分布は、特に上限が存在する場合の極値の分布をモデル化する際に使用されます。累積分布関数は次のように表されます：

$$
F(x) = \begin{cases}
\exp\left(-(x/\lambda)^\kappa\right) & \text{if } x \geq 0 \\
0 & \text{if } x < 0
\end{cases}
$$

ここで、$\lambda$ は尺度パラメータ、$\kappa$ は形状パラメータです。

### 極値分布のシミュレーション
以下は、Pythonを用いたGumbel分布のシミュレーション例です。

### 結論
極値分布は、データセットの中の極端な値を理解し、モデル化するための強力なツールです。特に、自然災害のリスク評価や金融リスク管理など、極端な事象の影響を評価するために広く使用されます。極値理論を用いることで、これらの稀なイベントの発生確率をより正確に予測することが可能となります。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import gumbel_r

# Gumbel分布のパラメータ
mu = 0
beta = 1

# サンプル数
num_samples = 1000

# Gumbel分布に従う乱数を生成
samples = gumbel_r.rvs(loc=mu, scale=beta, size=num_samples)

# ヒストグラムをプロット
plt.figure(figsize=(10, 6))
plt.hist(samples, bins=30, density=True, alpha=0.6, color='g', edgecolor='black', label='Sample Data')

# 理論的なGumbel分布のPDFをプロット
x = np.linspace(min(samples), max(samples), 1000)
pdf = gumbel_r.pdf(x, loc=mu, scale=beta)
plt.plot(x, pdf, 'r-', label='Gumbel PDF')

plt.xlabel('Value')
plt.ylabel('Density')
plt.legend()
plt.title('Gumbel Distribution Example')
plt.show()