## フィッシャー・ネイマンの分解定理について

フィッシャー・ネイマンの分解定理（Fisher-Neyman Factorization Theorem）は、統計量が十分統計量であるかどうかを判断するための重要な定理です。この定理は、確率密度関数（または確率質量関数）が特定の形で因数分解できる場合、その因数分解に基づいて十分統計量を見つけることができることを示しています。

### 定理の内容

確率変数の集合 $X = (X_1, X_2, \ldots, X_n)$ がパラメータ $\theta$ に従う確率分布 $p(X|\theta)$ に従うとします。このとき、統計量 $T(X)$ がパラメータ $\theta$ に関して十分であるための条件は、次のように確率密度関数（または確率質量関数）が因数分解できることです。

$$
p(X|\theta) = h(X) \cdot g(T(X), \theta)
$$

ここで、
- $h(X)$ は $X$ のみに依存する関数
- $g(T(X), \theta)$ は $T(X)$ と $\theta$ に依存する関数

この因数分解の形により、$T(X)$ が $\theta$ に関する情報を全て含んでいることが示されます。

### 具体例

#### 例：正規分布の場合

正規分布 $N(\mu, \sigma^2)$ の場合を考えます。サンプル $X_1, X_2, \ldots, X_n$ が平均 $\mu$、分散 $\sigma^2$ の正規分布に従うとき、十分統計量を見つけるためにフィッシャー・ネイマンの分解定理を適用します。

1. **確率密度関数**：
   正規分布の確率密度関数は次のように書けます。

   $$
   p(X_i | \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(X_i - \mu)^2}{2\sigma^2}\right)
   $$

2. **尤度関数**：
   サンプル全体の尤度関数は次のようになります。

   $$
   L(\mu, \sigma^2 | X) = \prod_{i=1}^n p(X_i | \mu, \sigma^2)
   $$

3. **対数尤度関数**：
   尤度関数の対数を取ると次のようになります。

   $$
   \ln L(\mu, \sigma^2 | X) = -\frac{n}{2} \ln (2\pi\sigma^2) - \frac{1}{2\sigma^2} \sum_{i=1}^n (X_i - \mu)^2
   $$

4. **因数分解**：
   この対数尤度関数をフィッシャー・ネイマンの分解定理に基づいて因数分解すると、次のように書けます。

   $$
   \ln L(\mu, \sigma^2 | X) = -\frac{n}{2} \ln (2\pi\sigma^2) - \frac{1}{2\sigma^2} \left( \sum_{i=1}^n X_i^2 - 2\mu \sum_{i=1}^n X_i + n\mu^2 \right)
   $$

   ここで、$\sum_{i=1}^n X_i$ は $T(X)$ として十分統計量になります。この例では、標本平均 $\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i$ が十分統計量であることが分かります。

### Pythonでの具体例

正規分布のデータに対して、フィッシャー・ネイマンの分解定理を確認するPythonコードの例を示します。



このコードは以下のことを行います：
1. 正規分布からサンプルデータを生成します。
2. 標本平均を計算します。
3. 対数尤度関数を計算します。

### まとめ

- **フィッシャー・ネイマンの分解定理**は、統計量が十分統計量であるかを確認するための方法を提供します。
- **十分統計量の因数分解**によって、パラメータ推定に必要な情報がその統計量に全て含まれていることを示します。
- 正規分布の例では、標本平均が母平均を推定するための十分統計量であることが確認できます。

この定理は、統計解析において非常に重要な役割を果たし、多くの応用において利用されています。

In [1]:
import numpy as np

# データ生成
n = 100
mu = 5
sigma = 2
data = np.random.normal(mu, sigma, n)

# 十分統計量としての標本平均の計算
sample_mean = np.mean(data)

# 尤度関数の対数の計算
log_likelihood = -n/2 * np.log(2 * np.pi * sigma**2) - 1/(2 * sigma**2) * np.sum((data - mu)**2)

print(f"Sample Mean: {sample_mean}")
print(f"Log Likelihood: {log_likelihood}")

Sample Mean: 4.967178022072141
Log Likelihood: -208.62368206623844


もちろんです。フィッシャー・ネイマンの分解定理を二項分布を使って優しく説明します。

### 二項分布の設定

二項分布は、成功確率 $p$ の試行を $n$ 回行い、成功の回数を数える確率分布です。各試行は成功か失敗のどちらかしかない独立な試行です。

二項分布の確率質量関数（PMF）は次のように表されます：

$$
P(X = k | n, p) = \binom{n}{k} p^k (1 - p)^{n - k}
$$

ここで、
- $n$ は試行回数
- $k$ は成功回数
- $p$ は成功確率

### フィッシャー・ネイマンの分解定理

フィッシャー・ネイマンの分解定理を二項分布の文脈で説明します。

#### 定理の要点

確率分布が次の形で因数分解できる場合、その統計量が十分統計量になります：

$$
P(X = k | n, p) = h(X) \cdot g(T(X), p)
$$

ここで、$T(X)$ が十分統計量です。

#### 二項分布での適用

二項分布の確率質量関数に対して、フィッシャー・ネイマンの分解定理を適用してみましょう。

1. **確率質量関数**：

   $$
   P(X = k | n, p) = \binom{n}{k} p^k (1 - p)^{n - k}
   $$

2. **因数分解**：

   この確率質量関数を次の形で因数分解します：

   $$
   P(X = k | n, p) = \binom{n}{k} \cdot p^k (1 - p)^{n - k}
   $$

   ここで、$\binom{n}{k}$ は $k$ と $n$ のみに依存する関数であり、$p^k (1 - p)^{n - k}$ は $k$ と $p$ に依存する関数です。

   つまり、

   $$
   h(X) = \binom{n}{k}
   $$

   $$
   g(T(X), p) = p^k (1 - p)^{n - k}
   $$

   となります。この場合、$T(X) = k$ が十分統計量です。$k$ は成功回数であり、これは成功確率 $p$ に関する情報を全て含んでいます。

### 具体例

簡単な例として、成功確率 $p = 0.3$ で試行回数 $n = 10$ の二項分布を考えます。例えば、成功回数 $k$ が 3 だったとします。

#### Pythonでの実装例

以下は、二項分布の例をPythonで実装し、成功回数を十分統計量として確認するコードです。



このコードは以下のことを行います：
1. 試行回数 $n = 10$、成功確率 $p = 0.3$ の二項分布から成功回数のサンプルを生成します。
2. 成功回数 $k$ を十分統計量として表示します。
3. 成功回数 $k$ に対する確率質量関数の値を計算します。

### まとめ

- **十分統計量**は、サンプルデータが持つ情報を効率的に要約し、パラメータ推定に必要な全ての情報を含む統計量です。
- **フィッシャー・ネイマンの分解定理**は、確率分布が特定の形で因数分解できる場合、その統計量が十分統計量であることを示します。
- 二項分布の場合、成功回数 $k$ が十分統計量であり、成功確率 $p$ を推定するために必要な情報を全て含んでいます。

これで、二項分布を使った十分統計量とフィッシャー・ネイマンの分解定理の説明ができました。分かりやすいと感じていただければ幸いです。

In [None]:
import numpy as np
from scipy.stats import binom

# 二項分布のパラメータ
n = 10
p = 0.3

# 成功回数のサンプルを生成
data = binom.rvs(n, p, size=1)
k = data[0]

# 十分統計量としての成功回数の表示
print(f"Successes (k): {k}")

# 確率質量関数の計算
pmf = binom.pmf(k, n, p)
print(f"PMF: {pmf}")