## 多項分布について

### 多項分布とは

多項分布（Multinomial Distribution）は、ある試行を複数回行い、それぞれの試行で複数のカテゴリのいずれかに分類されるとき、各カテゴリに分類される回数を表す確率分布です。これは、二項分布の一般化と見ることができます。

### 定義

多項分布は以下のように定義されます：

- $n$：試行回数
- $k$：カテゴリ数
- $p_i$：カテゴリ$i$に分類される確率（$i = 1, 2, \ldots, k$）
- $X_i$：カテゴリ$i$に分類される回数（$i = 1, 2, \ldots, k$）

これらのパラメータに対して、多項分布の確率質量関数（PMF）は以下のようになります：

$$
P(X_1 = x_1, X_2 = x_2, \ldots, X_k = x_k) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1} p_2^{x_2} \cdots p_k^{x_k}
$$

ここで、$x_1 + x_2 + \cdots + x_k = n$ および $p_1 + p_2 + \cdots + p_k = 1$ である必要があります。

### 期待値と分散

多項分布の各カテゴリ$i$についての期待値と分散は以下のようになります：

- 期待値：
  $$
  E(X_i) = np_i
  $$

- 分散：
  $$
  \text{Var}(X_i) = np_i(1 - p_i)
  $$

- 共分散（カテゴリ$i$と$j$の間）：
  $$
  \text{Cov}(X_i, X_j) = -np_i p_j \quad (i \neq j)
  $$

### 例

サイコロを10回振って、それぞれの面が出る回数をモデル化します。サイコロの各面が出る確率は$1/6$です。

#### パラメータ
- $n = 10$：試行回数
- $k = 6$：カテゴリ数（サイコロの面の数）
- $p_1 = p_2 = p_3 = p_4 = p_5 = p_6 = 1/6$：各面が出る確率

#### 期待値と分散の計算

1. 期待値：
   $$
   E(X_i) = np_i = 10 \times \frac{1}{6} = \frac{10}{6} \approx 1.67
   $$

2. 分散：
   $$
   \text{Var}(X_i) = np_i(1 - p_i) = 10 \times \frac{1}{6} \times \left(1 - \frac{1}{6}\right) = 10 \times \frac{1}{6} \times \frac{5}{6} = \frac{50}{36} \approx 1.39
   $$

3. 共分散：
   $$
   \text{Cov}(X_i, X_j) = -np_i p_j = -10 \times \frac{1}{6} \times \frac{1}{6} = -\frac{10}{36} \approx -0.28 \quad (i \neq j)
   $$

### Pythonでの計算

Pythonで多項分布の確率を計算するためには、`numpy`ライブラリを使用します。以下はその例です：


In [1]:
import numpy as np

# パラメータの定義
n = 10  # 試行回数
p = [1/6] * 6  # 各カテゴリの確率

# 多項分布に従うランダムサンプルを生成
sample = np.random.multinomial(n, p)
print(f"サンプル: {sample}")

# 多項分布の確率を計算
from scipy.stats import multinomial

# カテゴリごとの回数
x = [2, 1, 2, 1, 3, 1]

# 確率を計算
prob = multinomial.pmf(x, n, p)
print(f"確率: {prob:.4f}")

サンプル: [3 5 0 1 1 0]
確率: 0.0025
