## 幾何分布について

### 幾何分布とは

幾何分布（Geometric Distribution）は、ベルヌーイ試行（成功確率が一定の独立した試行）において、初めて成功するまでの試行回数を表す確率分布です。これは離散確率分布の一種です。

### 定義

幾何分布の確率質量関数（PMF）は次のように定義されます：

$$
P(X = k) = (1 - p)^{k-1} p
$$

ここで、
- $p$：各試行における成功の確率
- $k$：初めて成功するまでの試行回数（$k \geq 1$）

### 期待値と分散

幾何分布の期待値（平均）と分散は以下の式で表されます：

- 期待値：
  $$
  E(X) = \frac{1}{p}
  $$
  
- 分散：
  $$
  \text{Var}(X) = \frac{1 - p}{p^2}
  $$

### 例

コインを投げて表が出るまでの回数を考えます。このとき、コインの表が出る確率は $p = 0.5$ です。初めて表が出るまでの回数が幾何分布に従います。

#### 期待値と分散の計算

1. 成功確率 $p = 0.5$
2. 期待値：
   $$
   E(X) = \frac{1}{p} = \frac{1}{0.5} = 2
   $$
   
3. 分散：
   $$
   \text{Var}(X) = \frac{1 - p}{p^2} = \frac{1 - 0.5}{0.5^2} = \frac{0.5}{0.25} = 2
   $$

したがって、初めて表が出るまでの期待回数は2回で、分散も2です。

### Pythonでの計算

Pythonで幾何分布の確率、期待値、分散を計算するためには、`scipy.stats`ライブラリを使用します。以下はその例です：



In [1]:
from scipy.stats import geom

# 成功確率
p = 0.5

# 初めて成功するまでの試行回数が3回である確率を計算
k = 3
prob = geom.pmf(k, p)
print(f"初めて成功するまでの試行回数が3回である確率: {prob:.4f}")

# 幾何分布の期待値と分散を計算
mean = geom.mean(p)
variance = geom.var(p)

print(f"期待値: {mean}")
print(f"分散: {variance}")

初めて成功するまでの試行回数が3回である確率: 0.1250
期待値: 2.0
分散: 2.0


## 幾何分布と二項分布の違い

幾何分布と二項分布はどちらもベルヌーイ試行に基づく離散確率分布ですが、それぞれの定義と用途は異なります。以下にその違いを説明します。

### 二項分布

#### 定義

二項分布（Binomial Distribution）は、固定された回数の試行において、特定の成功回数の確率を求める分布です。

- $n$：試行回数
- $p$：各試行における成功の確率
- $X$：成功回数

二項分布の確率質量関数（PMF）は次のように定義されます：

$$
P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}
$$

ここで、$\binom{n}{k}$は二項係数を表します。

#### 期待値と分散

- 期待値：
  $$
  E(X) = np
  $$

- 分散：
  $$
  \text{Var}(X) = np(1 - p)
  $$

#### 用途

二項分布は「$n$回の試行で成功が$k$回起こる確率」を求める場合に使用されます。

### 幾何分布

#### 定義

幾何分布（Geometric Distribution）は、試行を繰り返して初めて成功するまでの試行回数を表す分布です。

- $p$：各試行における成功の確率
- $X$：初めて成功するまでの試行回数

幾何分布の確率質量関数（PMF）は次のように定義されます：

$$
P(X = k) = (1 - p)^{k-1} p
$$

#### 期待値と分散

- 期待値：
  $$
  E(X) = \frac{1}{p}
  $$

- 分散：
  $$
  \text{Var}(X) = \frac{1 - p}{p^2}
  $$

#### 用途

幾何分布は「初めて成功するまでの試行回数」を求める場合に使用されます。

### 違いのまとめ

1. **試行回数の固定**:
   - 二項分布は試行回数$n$が固定されており、その中で成功回数$k$を求めます。
   - 幾何分布は試行を繰り返し、初めて成功するまでの回数$k$を求めます。

2. **確率の関心**:
   - 二項分布は固定された試行回数の中での成功回数に関心があります。
   - 幾何分布は成功が初めて起こるまでの試行回数に関心があります。

3. **確率質量関数（PMF）**:
   - 二項分布のPMFは$\binom{n}{k} p^k (1 - p)^{n - k}$です。
   - 幾何分布のPMFは$(1 - p)^{k-1} p$です。

### 例

#### 二項分布の例

あるテストで10回の質問があり、各質問に正解する確率が0.7であるとします。10回の質問のうち、ちょうど7回正解する確率を求めます。

- $n = 10$
- $p = 0.7$
- $k = 7$

$$
P(X = 7) = \binom{10}{7} (0.7)^7 (0.3)^3
$$

#### 幾何分布の例

ある製品の製造過程で、製品が合格する確率が0.1であるとします。初めて合格するまでの製造回数を求めます。

- $p = 0.1$
- $X = k$

$$
P(X = k) = (0.9)^{k-1} (0.1)
$$

### Pythonでの計算


In [2]:
from scipy.stats import binom

# パラメータの定義
n = 10
p = 0.7
k = 7

# 二項分布の確率を計算
prob_binom = binom.pmf(k, n, p)
print(f"10回の試行でちょうど7回成功する確率: {prob_binom:.4f}")

from scipy.stats import geom

# パラメータの定義
p = 0.1
k = 5

# 幾何分布の確率を計算
prob_geom = geom.pmf(k, p)
print(f"初めて成功するまでの試行回数が{k}回である確率: {prob_geom:.4f}")

10回の試行でちょうど7回成功する確率: 0.2668
初めて成功するまでの試行回数が5回である確率: 0.0656
