つまり、標本平均という、一つの数字だけで、母関数を推定に使うことができるということ

## 十分統計量とは

十分統計量（Sufficient Statistic）は、統計学においてデータの要約に関する概念の一つであり、データ全体の情報を効率的に集約してパラメータの推定を行うために使用されます。十分統計量は、母集団のパラメータに関する情報を完全に保持する統計量です。

### 十分統計量の定義

確率変数 $X$ の観測値から得られる統計量 $T(X)$ が、パラメータ $\theta$ の十分統計量であるとは、観測データ $X$ の条件付き分布が $T(X)$ のみに依存し、$\theta$ に依存しない場合を言います。形式的には次のように定義されます：

$$
f_{X|\theta}(X|\theta) = g(T(X)|\theta) h(X)
$$

ここで、
- $f_{X|\theta}(X|\theta)$ は観測データ $X$ の確率密度関数または確率質量関数。
- $g(T(X)|\theta)$ は $T(X)$ のみを通じて $\theta$ に依存する関数。
- $h(X)$ は $\theta$ に依存しない関数。

### 十分統計量の例

#### 1. 正規分布の平均と分散の推定

正規分布 $N(\mu, \sigma^2)$ に従う独立な観測値 $X_1, X_2, \ldots, X_n$ の場合、標本平均 $\bar{X}$ と標本分散 $S^2$ は、それぞれ母集団の平均 $\mu$ と分散 $\sigma^2$ の十分統計量です。

- 標本平均 $\bar{X}$ は $\mu$ の十分統計量：
  $$
  \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i
  $$
- 標本分散 $S^2$ は $\sigma^2$ の十分統計量：
  $$
  S^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2
  $$

#### 2. ベルヌーイ分布の推定

ベルヌーイ分布 $B(\theta)$ に従う独立な観測値 $X_1, X_2, \ldots, X_n$ の場合、観測データの和 $T = \sum_{i=1}^n X_i$ は、母集団の成功確率 $\theta$ の十分統計量です。

### 因子分解定理

因子分解定理（Factorization Theorem）は、統計量が十分統計量であるかどうかを判断するための便利なツールです。この定理によると、統計量 $T(X)$ がパラメータ $\theta$ の十分統計量であるための必要十分条件は、確率密度関数 $f(X|\theta)$ が次の形式で表されることです：

$$
f(X|\theta) = g(T(X)|\theta) h(X)
$$

ここで、$g$ は $T(X)$ と $\theta$ に依存する関数、$h$ は $X$ のみに依存する関数です。

### 十分統計量の重要性

1. **データの要約**：十分統計量は、データの要約として効率的にパラメータの推定を行うために重要です。十分統計量があれば、元のデータ全体を保持しなくても、パラメータ推定に必要な情報を失わずに済みます。
2. **効率性**：十分統計量を用いることで、推定の計算効率が向上し、データの管理が容易になります。
3. **情報の保持**：十分統計量は、元のデータの情報を完全に保持するため、推定の精度を最大限に保ちます。


### まとめ

十分統計量は、データ全体の情報を効率的に要約し、パラメータ推定に必要な情報を完全に保持する統計量です。因子分解定理を用いることで、統計量が十分統計量であるかを判断することができます。十分統計量を利用することで、データ解析の効率性と精度が向上します。

## 十分統計量ではない場合
もちろん、十分統計量ではない例を示すことは、十分統計量の概念をより理解するために有用です。十分統計量でない例として、特定の統計量がパラメータ推定に必要な全ての情報を含んでいない場合を考えます。

### 例：サンプルの最小値

正規分布 $N(\mu, \sigma^2)$ からのサンプル $X_1, X_2, \ldots, X_n$ を考えます。このサンプルの最小値 $X_{\min} = \min(X_1, X_2, \ldots, X_n)$ を統計量とします。

この最小値 $X_{\min}$ は、次の理由から $\mu$ に関する十分統計量ではありません。

1. **情報の不足**：
   最小値 $X_{\min}$ は、サンプルの中で最も小さい値を表しますが、それだけではサンプルの分布全体に関する情報が不足しています。例えば、サンプルの全体的な位置やばらつきに関する情報は最小値には含まれていません。

2. **パラメータ推定の非効率性**：
   最小値を使って $\mu$ を推定しようとすると、極めて不正確な結果になります。なぜなら、最小値は極端な値の影響を強く受けるためです。このような統計量は、元のデータ全体からパラメータを推定するのに十分な情報を持っていないため、パラメータ推定の精度が著しく低下します。

### 具体例

以下に、正規分布からサンプルを生成し、その最小値を計算するPythonコードの例を示します。



このコードは、平均 $\mu = 5$、標準偏差 $\sigma = 2$ の正規分布から生成されたサンプルデータの最小値を計算します。しかし、この最小値は $\mu$ を推定するための十分統計量ではありません。

### 十分統計量ではない理由のまとめ

- **最小値 $X_{\min}$** は、サンプルの中の最小の値を示す統計量ですが、これはサンプル全体の分布に関する情報をほとんど含んでいません。
- **パラメータ推定に必要な情報が不足**しているため、母平均 $\mu$ や母分散 $\sigma^2$ を正確に推定することができません。

このように、十分統計量ではない統計量は、パラメータ推定に必要な全ての情報を含んでいないため、パラメータの推定精度が低くなります。

In [1]:
import numpy as np

# データ生成
n = 100
mu = 5
sigma = 2
data = np.random.normal(mu, sigma, n)

# 統計量としてのサンプル最小値の計算
sample_min = np.min(data)
print(f"Sample Minimum: {sample_min}")

Sample Minimum: 0.16293090231360363
