[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/snishiyama/intro-psych-stats-exercises/blob/main/04-ex_binomial.ipynb)

# 第4回演習番外編: 二項分布の関数を作ろう！

第2, 3(, 4)回の演習は元々のプログラミングの習熟度によって大きな差が出るので，他の受講生よりも早く終わって時間を持て余している場合は，この演習に取り組んでみてほしい。本講義の今後にはあまり関係はないが，統計学一般には関わる内容である。



突然ですが問題です。高校数学の範囲かと思うので，解説を読む前に解いてみてください。


# 問1

コインを4回投げたときに，1回は表が上になり，残り3回は裏が上になる確率を求めよ。なお，コインを投げたときに起こる結果（事象）は｛表，裏｝の2種類しかなく，1回の試行で表と裏の出る確率は等しい（同様に確からしい）とする。

In [None]:
# （電卓代わりに）コードを書いて計算する


## 解説

コインを4回投げたときに，表が1回，裏が3回となる試行の組み合わせは以下の4通り

- ｛表，裏，裏，裏｝
- ｛裏，表，裏，裏｝
- ｛裏，裏，表，裏｝
- ｛裏，裏，裏，表｝

表と裏は同様に確からしいので，各試行において表の出る確率は0.5, 裏の出る確率は0.5 なので，

$4 \times 0.5^1 \times 0.5^3$

で求まる。

In [None]:
4 * 0.5 * 0.5 ** 3

# 問2

今度は歪んだコインを投げるとする。各試行で得られる結果（事象）は｛表，裏｝の2種類だが，表の出る確率は30％だという。問1と同様に，このコインを4回投げたときに，表が1回，裏が3回となる確率を求めよ

In [None]:
# （電卓代わりに）コードを書いて計算する


## 解説

コインを4回投げたときに，表が1回，裏が3回となる試行の組み合わせは問1で解説した4通り

各試行において表の出る確率は0.3, 裏の出る確率は0.7 なので，

$4 \times 0.3^1 \times 0.7^3$

で求まる。

In [None]:
4 * 0.3 * 0.7 ** 3

# コイン投げの一般化

問1, 2 のコイン投げを一般化すると，結果（事象）が2つ｛A, B｝で，Aが得られる確率が p であるような試行を n 回繰り返したとき，Aが k 回生じる確率といえる（ただし，0 ≤ p ≤ 1, 0 < n, 0 ≤ k ≤ n）。※ ≤ は ≦ と同じ

ここで，Bについての情報がないように思うが，事象が2つしかないので，Aについての情報からBの情報は自動的に導かれる。具体的には，

各試行においてBが得られる確率は(1 - p)で，試行をn回行ったときにBは (n - k) 回生じる。

問2を当てはめると，

各コイン投げで表が得られる確率が 0.3 なので，裏が出る確率は，1 - 0.3 = 0.7。4回繰り返して，表が1回出たということは，裏は 4 - 1 = 3 回 出る。

したがって，問2の解説部分で書いた数式は，以下のように書き換えられる。

$$
4 \times 0.3^1 \times (1 - 0.3)^{4 - 1}
$$

さて，最初の係数の4 は，表が1回，裏が3回の並び（組み合わせ）の総数である。解説のようにリストアップすることもできるが，これは，高校数学で習ったように，

$$
_{4}C_{1} = \frac{4!}{1!3!} = \frac{4 \times 3 \times 2 \times 1}{1 \times 3 \times 2 \times 1} = 4
$$

で求まる（$x!$ はx の階乗）。つまり，2種類のものが合計 n 個 あり，一方が k 個 ある場合の組み合わせの総数は，

$$
_nC_k = \frac{n!}{k!(n-k)!}
$$

で求まる。

以上をまとめると，「2つの事象｛A, B｝のうち，Aが得られる確率が p であるような試行を n 回繰り返したとき，Aが k 回生じる確率（0 ≤ p ≤ 1, 0 < n, 0 ≤ k ≤ n）」は，以下の式で求められる。

$$
\frac{n!}{k!(n-k)!} \times p^k \times (1-p)^{n-k} 
$$

この式は，**二項分布** と呼ばれる確率分布を表す式で，心理統計学でも用いられることのあるものである。確率分布という用語が出てきたが，その説明はここでは省略する。

少なくともこの演習のために理解しておいてほしいのは，試行回数 n と一方の事象Aの生起確率 p がわかっていれば，Aが得られる回数（1, 2, ... k）の確率はこの式を使って求められるということである。

# 本題

ここからが本題。この演習では，二項分布の関数を自作する。次の4つの関数を順番に作成してほしい。作った関数は，次の関数を作成する際に利用すること。

- 階乗を計算する関数 `factorial(x)` （factorial は階乗のこと）
- 組み合わせ $_nC_k$を計算する関数 `comb(n, k)` （comb は combination の（ここでの）省略形）
- ある p, n, k を指定すると，二項分布に基づく確率を算出する関数 `binomial(p, n, k)` （binomial は"二項" のこと）
- p, nを指定したら，すべての k についての確率を算出し，リストとして返す関数 `binomial_all(p, n)`

それぞれ作成したら，動作確認をすること。

## 必要なPython知識: `range()`

実は今回の実装では，授業で扱っていない`range()` を使う必要がある。

`range(自然数)` は指定した自然数個分の0から始まるリストを作成する（厳密にはリストではないが，現状の理解としてはこれでよい）。 `for 変数名 in ...` の `...` の部分に持ってきて，以下のようなことができる。

In [None]:
goukei = 0
for i in range(10):
    goukei = goukei + i

goukei

重要なことは，`range(x)` でリストを生成すると，そのリストに含まれるのは x - 1 までの整数で， x は含まれないことである。その証拠に，上のコードの `goukei` は，0〜9の合計値である 45 になっている。

もし，`range(x)` を使って1〜10の合計を算出したいなら，以下のような工夫が必要になる。

In [None]:
goukei = 0
for i in range(10):
    goukei = goukei + (i + 1)

goukei

それでは，`range()` をうまく使って演習に取り組んでみよう。

## ステップ1: 階乗

In [None]:
def factorial(x):
    # 以下を埋める
    

In [None]:
# 動作確認（自分で手計算できる範囲で）
factorial(10)

## ステップ2: 組み合わせ

In [None]:
def comb(n, k):
    # 以下を埋める
    

In [None]:
# 動作確認（n をあまりに大きくすると，計算結果がおかしくなることもあるかもしれない）
comb(10, 3)

## ステップ3: 二項分布

In [None]:
def binomial(p, n, k):
    # 以下を埋める
    

In [None]:
# 動作確認
binomial(0.5, 10, 5)

## ステップ4: 二項分布（k = 0, 1, ..., n すべての確率をリストにして返す関数)

In [None]:
def binomial_all(p, n):
    # 以下を埋める

In [None]:
# 動作確認。p や n を色々変えて挙動を確かめよう。
