## ネイマン配分法について

ネイマン配分法（Neyman Allocation）は、層別抽出法（Stratified Sampling）において、各層に対してサンプルサイズを割り当てるための方法です。この方法は、各層の標準偏差と層のサイズに基づいて、全体のサンプルサイズを層に適切に分配します。ネイマン配分法は、全体のサンプルの標準誤差を最小化することを目的としています。

### ネイマン配分法の基本原理

ネイマン配分法では、各層のサンプルサイズを次のように計算します：

$$ n_h = \frac{N_h \sigma_h}{\sum_{k=1}^L N_k \sigma_k} n $$

ここで、
- $n_h$ は層 $h$ のサンプルサイズ
- $N_h$ は層 $h$ の全体のサイズ（母集団サイズ）
- $\sigma_h$ は層 $h$ の標準偏差
- $n$ は全体のサンプルサイズ
- $L$ は層の総数

### ネイマン配分法のメリット

1. **効率性**: ネイマン配分法は、全体の標準誤差を最小化するため、効率的なサンプリングが可能です。
2. **精度向上**: 層ごとの標準偏差を考慮するため、変動の大きい層にはより多くのサンプルが割り当てられ、結果として精度の高い推定が可能となります。

### ネイマン配分法の例

具体的な例を考えてみましょう。例えば、以下のような層別データがあるとします：

| 層 | 母集団サイズ ($N_h$) | 標準偏差 ($\sigma_h$) |
|----|---------------------|---------------------|
| 1  | 100                 | 15                  |
| 2  | 200                 | 10                  |
| 3  | 150                 | 20                  |

全体のサンプルサイズ $n$ を 100 とします。この場合、各層のサンプルサイズ $n_h$ は次のように計算されます：

1. 各層の $N_h \sigma_h$ を計算します。
   - 層1: $100 \times 15 = 1500$
   - 層2: $200 \times 10 = 2000$
   - 層3: $150 \times 20 = 3000$

2. これらの合計を計算します。
   - 合計: $1500 + 2000 + 3000 = 6500$

3. 各層のサンプルサイズ $n_h$ を計算します。
   - 層1: $\frac{1500}{6500} \times 100 \approx 23$
   - 層2: $\frac{2000}{6500} \times 100 \approx 31$
   - 層3: $\frac{3000}{6500} \times 100 \approx 46$

### Pythonコードによる計算例

以下に、上記の計算をPythonで実行するコードを示します。


このコードを実行すると、各層のサンプルサイズが計算されます。

In [None]:
import numpy as np

# 各層の母集団サイズと標準偏差
N_h = np.array([100, 200, 150])
sigma_h = np.array([15, 10, 20])
n = 100  # 全体のサンプルサイズ

# 各層の N_h * sigma_h を計算
Nh_sigmah = N_h * sigma_h

# 全体の N_h * sigma_h の合計
total_Nh_sigmah = np.sum(Nh_sigmah)

# 各層のサンプルサイズ n_h を計算
n_h = (Nh_sigmah / total_Nh_sigmah) * n

# 結果を表示
n_h = np.round(n_h).astype(int)
n_h
