## <strong>代表的な離散確率分布</strong>
本章ではよく使われる離散型の確率分布に関してPythonを用いてそれぞれ原理の説明と図示をしていきます。

**本章で説明する離散型確率分布**
- ベルヌーイ分布
-二項分布
-幾何分布
-ポアソン分布

## <strong>1. 使用するライブラリをインポートする</strong>
本章では以下のライブラリを使用します。

SciPyのstatsモジュールは統計計算の為に様々なツールがそろったライブラリです。
詳細に関しては[こちら](https://www.scipy.org/index.html)を参照ください。

Google Colaboratoryでは以下すべてのパッケージはデフォルトでインストールされています。

**Numpy** : 確率変数計算

**matplotlib** : 各離散型確率図示の分布の図示

**Scipy** : 統計計算

In [3]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

%matplotlib inline # Jupyter NOtebook上にグラフを記載するための宣言

UsageError: unrecognized arguments: # Jupyter NOtebook上にグラフを記載するための宣言


## <strong>2. 確率分布の性質を確認するための関数を定義する</strong>

期待値/分散について関数を定義します。それぞれの数学的意義は以下を参照ください。
<br><br>
> ### **期待値**

”確率変数を無限回試行して得られた現実値の平均”を期待値と同義と定義する。

数式では以下で表現される。<br><br>
$E(x) = \sum_kx_{k}f(x_{k})$
<br><br>
$x_{k}$ = 確率変数

$f(x_{k})$ = 確率
<br><br>

> ### **分散**

”データのばらつきを示す指標と定義する。

数式では以下で表現される。<br><br>
$V(x) = \sum_k（x_{k}-\mu)^{2}f(x_{k})$
<br><br>
$x_{k}$ = 確率変数<br>
$\mu$ = 平均(確率変数$x_{k}$の期待値)<br>
$f(x_{k})$ = 確率


In [4]:
# グラフの線の種類を指定
linestyles = ['-', '--', ':']

#期待値計算
def E(X, g=lambda x: x):
    x_set, f = X
    return np.sum([g(x_k) * f(x_k) for x_k in x_set])

#分散計算
def V(X, g=lambda x: x):
    x_set, f = X
    mean = E(X, g)
    return np.sum([(g(x_k)-mean)**2 * f(x_k) for x_k in x_set])

#確率変数の性質確認
def check_prob(X):
    x_set, f = X
    prob = np.array([f(x_k) for x_k in x_set])
    assert np.all(prob >= 0), '確率が0以下です'
    prob_sum = np.round(np.sum(prob), 6)
    assert prob_sum == 1, f'確率総和が1ではありません'
    print(f'期待値 : {E(X):.4}')
    print(f'分散 : {(V(X)):.4}')

#確率変数を引数に確率変数の確率関数および期待値を図示
def plot_prob(X):
    x_set, f = X
    prob = np.array([f(x_k) for x_k in x_set])
    
    fig = plt.figure(figsize=(10, 6))
    ax = fig.add_subplot(111)
    ax.bar(x_set, prob, label='prob')
    ax.vlines(E(X), 0, 1, label='mean')
    ax.set_xticks(np.append(x_set, E(X)))
    ax.set_ylim(0, prob.max()*1.2)
    ax.legend()
    
    plt.show()