## 超幾何分布の説明と例

### 超幾何分布とは

超幾何分布（ちょうきかぶんぷ、Hypergeometric Distribution）は、有限母集団からの標本抽出に関する確率分布の一つです。特に、リプレースメント（復元抽出）なしで抽出を行う場合に使用されます。具体的には、母集団の中から特定の属性を持つアイテムを含む標本を抽出する際の確率を計算します。

### 定義

超幾何分布は次のように定義されます：

- $N$：母集団のサイズ
- $K$：母集団の中で特定の属性を持つアイテムの数
- $n$：抽出する標本のサイズ
- $k$：標本の中で特定の属性を持つアイテムの数

これらのパラメータに対して、$X$ を「特定の属性を持つアイテムの数」としたとき、確率質量関数（PMF）は以下のようになります：

$$
P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}
$$

ここで、$\binom{a}{b}$ は二項係数を表します。

### 例

あるクラスに30人の生徒がいて、そのうち18人が男子、12人が女子だとします。このクラスからランダムに5人を選ぶとき、ちょうど3人が男子である確率を求めてみましょう。

1. 母集団のサイズ $N = 30$
2. 特定の属性（男子）を持つアイテムの数 $K = 18$
3. 抽出する標本のサイズ $n = 5$
4. 特定の属性を持つアイテムの数 $k = 3$

これを超幾何分布の式に代入します：

$$
P(X = 3) = \frac{\binom{18}{3} \binom{12}{2}}{\binom{30}{5}}
$$

各二項係数を計算します：

- $\binom{18}{3} = \frac{18!}{3!(18-3)!} = 816$
- $\binom{12}{2} = \frac{12!}{2!(12-2)!} = 66$
- $\binom{30}{5} = \frac{30!}{5!(30-5)!} = 142506$

これらを式に代入すると：

$$
P(X = 3) = \frac{816 \times 66}{142506} \approx 0.0378
$$

したがって、このクラスからランダムに5人を選んだとき、ちょうど3人が男子である確率は約0.0378、つまり約3.78%です。

### Pythonでの計算

Pythonでこの確率を計算するためには、`scipy.stats`ライブラリを使用します。以下はその例です：



In [None]:
from scipy.stats import hypergeom

# パラメータの定義
N = 30  # 母集団のサイズ
K = 18  # 特定の属性を持つアイテムの数
n = 5   # 抽出する標本のサイズ
k = 3   # 特定の属性を持つアイテムの数

# 超幾何分布の確率を計算
prob = hypergeom.pmf(k, N, K, n)
print(f"ちょうど3人が男子である確率: {prob:.4f}")

## 超幾何分布の期待値と分散

### 期待値

超幾何分布の期待値（平均）は以下の式で表されます：

$$
E(X) = \frac{nK}{N}
$$

ここで、
- $N$：母集団のサイズ
- $K$：母集団の中で特定の属性を持つアイテムの数
- $n$：抽出する標本のサイズ

### 分散

超幾何分布の分散は以下の式で表されます：

$$
\text{Var}(X) = n \cdot \frac{K}{N} \cdot \frac{N-K}{N} \cdot \frac{N-n}{N-1}
$$

これを使って、前述の例の期待値と分散を計算してみましょう。

### 具体例の計算

クラスに30人の生徒がいて、そのうち18人が男子、12人が女子です。ここからランダムに5人を選ぶとき、男子の数の期待値と分散を計算します。

#### パラメータ
- $N = 30$
- $K = 18$
- $n = 5$

#### 期待値の計算

$$
E(X) = \frac{nK}{N} = \frac{5 \times 18}{30} = 3
$$

期待値は3です。

#### 分散の計算

$$
\text{Var}(X) = 5 \cdot \frac{18}{30} \cdot \frac{12}{30} \cdot \frac{25}{29}
$$

これを計算すると：

$$
\text{Var}(X) = 5 \cdot 0.6 \cdot 0.4 \cdot \frac{25}{29} = 5 \cdot 0.6 \cdot 0.4 \cdot 0.862 = 1.032
$$

分散は約1.032です。

### Pythonでの計算

Pythonで期待値と分散を計算するためには、`scipy.stats`ライブラリを使用します。以下はその例です：




In [1]:
from scipy.stats import hypergeom

# パラメータの定義
N = 30  # 母集団のサイズ
K = 18  # 特定の属性を持つアイテムの数
n = 5   # 抽出する標本のサイズ

# 超幾何分布の期待値と分散を計算
mean = hypergeom.mean(N, K, n)
variance = hypergeom.var(N, K, n)

print(f"期待値: {mean}")
print(f"分散: {variance}")

期待値: 3.0
分散: 1.0344827586206897
