## モーメント法による点推定

モーメント法は、確率分布のパラメータを推定するための方法の一つです。この方法は、母集団のモーメント（平均、分散など）と標本のモーメントが等しいという原理に基づいています。以下に、モーメント法の手順と例を示します。

### モーメント法の手順

1. **母集団のモーメントを設定**:
   確率分布のパラメータを含む母集団のモーメントを数式で表します。例えば、正規分布 $N(\mu, \sigma^2)$ の場合、1次モーメント（平均）と2次モーメント（分散）は次のようになります。
   - 1次モーメント（平均）: $E(X) = \mu$
   - 2次モーメント（分散）: $E(X^2) = \mu^2 + \sigma^2$

2. **標本モーメントを計算**:
   標本データからモーメントを計算します。標本平均 $\overline{X}$ と標本の2次モーメント $\frac{1}{n}\sum_{i=1}^n X_i^2$ を計算します。

3. **母集団モーメントと標本モーメントを等式で結ぶ**:
   母集団のモーメントと標本のモーメントを等式で結び、パラメータを推定します。

### 例: 正規分布 $N(\mu, \sigma^2)$ のモーメント法による推定

1. **母集団のモーメント**:
   - 1次モーメント: $E(X) = \mu$
   - 2次モーメント: $E(X^2) = \mu^2 + \sigma^2$

2. **標本モーメント**:
   標本平均 $\overline{X}$ と標本の2次モーメント $\frac{1}{n}\sum_{i=1}^n X_i^2$ を計算します。

3. **母集団モーメントと標本モーメントを等式で結ぶ**:
   - 1次モーメントの等式: $\overline{X} = \mu$
   - 2次モーメントの等式: $\frac{1}{n}\sum_{i=1}^n X_i^2 = \mu^2 + \sigma^2$

4. **パラメータを推定**:
   1次モーメントの等式から $\mu$ を推定します。
   $\mu \approx \overline{X}$

   次に、2次モーメントの等式から $\sigma^2$ を推定します。
   $\sigma^2 \approx \frac{1}{n}\sum_{i=1}^n X_i^2 - \overline{X}^2$

この方法により、正規分布の平均 $\mu$ と分散 $\sigma^2$ を推定することができます。

### モーメント法の利点と欠点

**利点**:
- 計算が比較的簡単である。
- 標本モーメントが収束する限り、大サンプルでは信頼性が高い。

**欠点**:
- 小サンプルでは推定値が偏ることがある。
- パラメータの数が多い場合、解が複雑になることがある。

モーメント法は、特に基本的な分布や初学者向けの推定方法として有用です。その他の推定方法（例えば最尤法）と併用することで、より信頼性の高い推定が可能となります。


## 最尤法による点推定

最尤法（Maximum Likelihood Estimation, MLE）は、確率分布のパラメータを推定するための一般的かつ強力な方法の一つです。この方法は、観測データが最も尤もらしく生成されるようなパラメータを求めます。

### 最尤法の手順

1. **尤度関数の設定**:
   観測データが与えられたとき、そのデータが観測される確率（尤度）をパラメータの関数として表します。この関数を尤度関数と呼びます。

2. **対数尤度関数の計算**:
   計算を簡単にするために、尤度関数の対数を取った対数尤度関数を用います。対数を取ることで、積の形の尤度関数を和の形に変換できます。

3. **対数尤度関数の最大化**:
   対数尤度関数を最大にするパラメータを求めます。通常、微分を用いて対数尤度関数の最大化を行います。

### 例: 正規分布 $N(\mu, \sigma^2)$ の最尤法による推定

観測データ $X = (X_1, X_2, ..., X_n)$ が正規分布 $N(\mu, \sigma^2)$ に従うと仮定します。

1. **尤度関数の設定**:
   正規分布の確率密度関数は次のようになります。
   $$ f(x|\mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) $$

   尤度関数は、観測データ全体の尤度の積として表されます。
   $$ L(\mu, \sigma^2 | X) = \prod_{i=1}^{n} f(X_i | \mu, \sigma^2) $$
   $$ L(\mu, \sigma^2 | X) = \prod_{i=1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(X_i - \mu)^2}{2\sigma^2}\right) $$

2. **対数尤度関数の計算**:
   対数を取ると、対数尤度関数は次のようになります。
   $$ \ell(\mu, \sigma^2 | X) = \log L(\mu, \sigma^2 | X) $$
   $$ \ell(\mu, \sigma^2 | X) = \sum_{i=1}^{n} \log \left( \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(X_i - \mu)^2}{2\sigma^2}\right) \right) $$
   $$ \ell(\mu, \sigma^2 | X) = -\frac{n}{2} \log (2\pi\sigma^2) - \frac{1}{2\sigma^2} \sum_{i=1}^{n} (X_i - \mu)^2 $$

3. **対数尤度関数の最大化**:
   対数尤度関数を $\mu$ と $\sigma^2$ で微分し、0と置いて最大化します。

   - $\mu$ について微分:
     $$ \frac{\partial \ell}{\partial \mu} = \frac{1}{\sigma^2} \sum_{i=1}^{n} (X_i - \mu) = 0 $$
     $$ \sum_{i=1}^{n} X_i - n\mu = 0 $$
     $$ \hat{\mu} = \frac{1}{n} \sum_{i=1}^{n} X_i $$

   - $\sigma^2$ について微分:
     $$ \frac{\partial \ell}{\partial \sigma^2} = -\frac{n}{2\sigma^2} + \frac{1}{2\sigma^4} \sum_{i=1}^{n} (X_i - \mu)^2 = 0 $$
     $$ -\frac{n\sigma^2}{2} + \frac{\sum_{i=1}^{n} (X_i - \mu)^2}{2\sigma^2} = 0 $$
     $$ \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \mu)^2 $$

したがって、正規分布の平均 $\mu$ と分散 $\sigma^2$ の最尤推定量は次のようになります。
$$ \hat{\mu} = \frac{1}{n} \sum_{i=1}^{n} X_i $$
$$ \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \hat{\mu})^2 $$

### 最尤法の利点と欠点

**利点**:
- 一般に最尤法は効率的であり、大サンプルでは良い推定量を与えます。
- 多くの状況で適用可能であり、理論的な性質が良好です（例: 漸近的に正規分布に従う）。

**欠点**:
- 計算が複雑になる場合がある。
- 小サンプルではバイアスが生じることがある。

最尤法は、統計的推定の基本的な手法であり、多くの実際の問題に適用されます。最尤法の理解は、統計学やデータサイエンスの重要な基盤となります。


# 問題解説

### 問題 11.1

#### 問題の概要:
母集団分布が母数 $\theta$ の指数分布 $f(x|\theta)$ であるとき、次のような標本 $X_1, X_2, ..., X_n$ にもとづく $\theta$ の最尤推定量を求めよ。

#### 解説

指数分布の確率密度関数は次のように表されます。
$$ f(x|\theta) = \frac{1}{\theta} e^{-x/\theta}, \quad x \geq 0 $$

1. **尤度関数の設定**:
   $$ L(\theta | X) = \prod_{i=1}^{n} \frac{1}{\theta} e^{-X_i/\theta} $$
   $$ L(\theta | X) = \frac{1}{\theta^n} e^{-\sum_{i=1}^{n} X_i / \theta} $$

2. **対数尤度関数の計算**:
   $$ \ell(\theta | X) = \log L(\theta | X) $$
   $$ \ell(\theta | X) = -n \log \theta - \frac{\sum_{i=1}^{n} X_i}{\theta} $$

3. **対数尤度関数の最大化**:
   対数尤度関数を $\theta$ で微分し、0と置いて最大化します。
   $$ \frac{\partial \ell}{\partial \theta} = -\frac{n}{\theta} + \frac{\sum_{i=1}^{n} X_i}{\theta^2} = 0 $$
   $$ \hat{\theta} = \frac{1}{n} \sum_{i=1}^{n} X_i $$

したがって、$\theta$ の最尤推定量は次のようになります。
$$ \hat{\theta} = \frac{1}{n} \sum_{i=1}^{n} X_i $$

### 問題 11.2

#### 問題の概要:
母平均 $\mu$ の正規母集団から、大きさ $n$ の標本を2つ抽出するとき、次の条件を満たす信頼区間を求めよ。

1. $X_1, X_2$ の線型（一次）関数、すなわち線型推定量
2. 不偏性

https://contents-open.hatenablog.com/entry/2020/11/24/222321


#### 問題 11.3

#### 問題の概要:
母分散 $\sigma^2 = 4$ の正規母集団から大きさ $n = 5$ の標本を得た。得られた標本の値が 9.75, 7.95, 12.80, 8.25, 9.86 である。母平均 $\mu$ の信頼係数95%の信頼区間を求めよ。

#### 解説

1. **標本平均の計算**:
   $$ \overline{X} = \frac{9.75 + 7.95 + 12.80 + 8.25 + 9.86}{5} = 9.722 $$

2. **標本分散の計算**:
   母分散が既知なので、標本標準誤差は次のようになります。
   $$ SE = \sqrt{\frac{\sigma^2}{n}} = \sqrt{\frac{4}{5}} = 0.894 $$

3. **信頼区間の計算**:
   $$ \overline{X} \pm Z_{\alpha/2} \cdot SE $$
   ここで、$Z_{\alpha/2} = 1.96$ （95%信頼区間の場合）。

   $$ 9.722 \pm 1.96 \cdot 0.894 $$

   $$ 9.722 \pm 1.752 $$

   $$ (7.970, 11.474) $$

したがって、母平均 $\mu$ の95%信頼区間は (7.970, 11.474) です。


### 問題 11.4

#### 問題の概要:
信頼区間の幅: 母分散 $\sigma^2 = 9$ の正規母集団から大きさ $n$ の標本を抽出して、母平均 $\mu$ の信頼係数99%の信頼区間を求めるため、その幅を2以下にするためには $n$ をどれくらいにすればよいか。

#### 解説

1. **信頼区間の幅**:
   信頼区間の幅 $W$ は次のようになります。
   $$ W = 2 \times Z_{\alpha/2} \cdot \sqrt{\frac{\sigma^2}{n}} $$

   ここで、$Z_{\alpha/2} = 2.576$（99%信頼区間の場合）、$\sigma^2 = 9$。

2. **幅を2以下にするための $n$**:
   $$ 2.576 \cdot \sqrt{\frac{9}{n}} \leq 1 $$

   $$ \sqrt{\frac{9}{n}} \leq \frac{1}{2.576} $$

   $$ \frac{9}{n} \leq \left(\frac{1}{2.576}\right)^2 $$

   $$ n \geq \frac{9}{\left(\frac{1}{2.576}\right)^2} $$

   $$ n \geq 42.2 $$

したがって、信頼区間の幅を2以下にするためには、少なくとも43回の測定が必要です。

### 問題 11.5

#### 問題の概要:
次のデータは、20匹のラットを10匹ずつ2群に分け、A群には新しい飼料を与え、B群には市販の飼料を与えた後の血中赤血球数（単位：100万個）を示す。2つの標本平均の差（すなわち、薬の効果）の信頼係数95%の信頼区間を求めよ。

#### データ:
- 投薬群（A群）：7.97, 7.66, 7.59, 8.44, 8.02, 7.99, 8.15, 8.12, 7.98, 8.35
- 対照群（B群）：8.06, 8.27, 8.25, 8.45, 8.29, 8.12, 8.33, 8.39, 8.21, 8.36

#### 解説

1. **標本平均と標本分散の計算**:
   - A群の標本平均 $\overline{X}_A$ と標本分散 $S_A^2$
   - B群の標本平均 $\overline{X}_B$ と標本分散 $S_B^2$

   $$ \overline{X}_A = \frac{7.97 + 7.66 + 7.59 + 8.44 + 8.02 + 7.99 + 8.15 + 8.12 + 7.98 + 8.35}{10} = 8.027 $$

   $$ S_A^2 = \frac{1}{9} \sum_{i=1}^{10} (X_{A,i} - \overline{X}_A)^2 = 0.0658 $$

   $$ \overline{X}_B = \frac{8.06 + 8.27 + 8.25 + 8.45 + 8.29 + 8.12 + 8.33 + 8.39 + 8.21 + 8.36}{10} = 8.273 $$

   $$ S_B^2 = \frac{1}{9} \sum_{i=1}^{10} (X_{B,i} - \overline{X}_B)^2 = 0.0122 $$

2. **標本平均の差の標準誤差**:
   $$ SE = \sqrt{\frac{S_A^2}{10} + \frac{S_B^2}{10}} = \sqrt{\frac{0.0658}{10} + \frac{0.0122}{10}} = 0.0942 $$

3. **信頼区間の計算**:
   $$ (\overline{X}_A - \overline{X}_B) \pm t_{\alpha/2} \cdot SE $$

   ここで、自由度 $df = 18$、信頼区間95%の場合、$t_{0.025} \approx 2.101$。

   $$ (8.027 - 8.273) \pm 2.101 \cdot 0.0942 $$

   $$ -0.246 \pm 0.198 $$

   $$ (-0.444, -0.048) $$

したがって、2つの標本平均の差の信頼係数95%の信頼区間は (-0.444, -0.048) です。

以下は、Jupyter Notebookにコピペできる形式で、これらの問題に対する解説です。

### 問題 11.8

#### 問題の概要:
母数 $p$ の二項母集団 $Bi(1, p)$ から、大きさ $n = 50$ の標本を抽出して、0 が 23、1 が 27 であった。$p$ の信頼係数95%の信頼区間を求めよ。

#### 解説

1. **標本平均の計算**:
   二項分布 $Bi(n, p)$ の場合、標本平均は標本割合 $\hat{p}$ に相当します。
   $$ \hat{p} = \frac{27}{50} = 0.54 $$

2. **標準誤差の計算**:
   $$ SE = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}} = \sqrt{\frac{0.54 \cdot (1 - 0.54)}{50}} = \sqrt{\frac{0.54 \cdot 0.46}{50}} = \sqrt{0.004968} = 0.0705 $$

3. **信頼区間の計算**:
   $$ \hat{p} \pm Z_{\alpha/2} \cdot SE $$
   ここで、$Z_{\alpha/2} = 1.96$ （95%信頼区間の場合）。

   $$ 0.54 \pm 1.96 \cdot 0.0705 $$

   $$ 0.54 \pm 0.1382 $$

   $$ (0.4018, 0.6782) $$

したがって、母数 $p$ の95%信頼区間は (0.4018, 0.6782) です。

### 問題 11.9

#### 問題の概要:
1時間毎の受信電話数を記録したところ、次のデータが得られた。
4, 3, 5, 4, 8, 2, 5, 9, 3, 5
ポアソン母集団 $Po(\lambda)$ を仮定して、$\lambda$ の信頼係数99%の信頼区間を求めよ。

#### 解説

1. **標本平均の計算**:
   ポアソン分布のパラメータ $\lambda$ は平均と等しいので、まず標本平均を計算します。
   $$ \overline{X} = \frac{4 + 3 + 5 + 4 + 8 + 2 + 5 + 9 + 3 + 5}{10} = \frac{48}{10} = 4.8 $$

   したがって、$\hat{\lambda} = 4.8$ です。

2. **信頼区間の計算**:
   ポアソン分布のパラメータ $\lambda$ の信頼区間は、近似的に次のように計算できます。
   $$ \lambda \sim N(\hat{\lambda}, \frac{\hat{\lambda}}{n}) $$

   標本の大きさ $n = 10$ のとき、標準誤差は次のようになります。
   $$ SE = \sqrt{\frac{\hat{\lambda}}{n}} = \sqrt{\frac{4.8}{10}} = \sqrt{0.48} = 0.6928 $$

3. **信頼区間の計算**:
   $$ \hat{\lambda} \pm Z_{\alpha/2} \cdot SE $$
   ここで、$Z_{\alpha/2} = 2.576$ （99%信頼区間の場合）。

   $$ 4.8 \pm 2.576 \cdot 0.6928 $$

   $$ 4.8 \pm 1.783 $$

   $$ (3.017, 6.583) $$

したがって、ポアソン分布のパラメータ $\lambda$ の99%信頼区間は (3.017, 6.583) です。

