# 1.1 様々な正規分布

確率分布は，事象がどれほど異なって生じるかを記述するものです．
確率分布の中で，最も有名な分布と言えるガウス分布（Gaussian distribution）または正規分布（normal distribution）を例にとります．

ある変数$x$がガウス分布（正規分布）に従う場合，以下の式によって表されます．

$f ( x | \mu, \sigma ) = \cfrac{1}{\sigma \sqrt{2 \pi}} e^{\frac{- (x - \mu)^{2}}{2 \sigma^{2}}}$

上記の数式において，$\mu$と$\sigma$が分布を特徴づけるパラメータになります．
$\mu$は分布の平均値（mean）で，任意の実数値をとります．ガウス分布（正規分布）においては，平均値は中央値（median）でもあり，最頻値（mode）でもあります．
$\sigma$は標準偏差（standard deviation）で，正の値のみをとります．$\sigma$は分布の広がりを表します．

$\mu$と$\sigma$の組み合わせは無限に存在し，これらの全てはガウス分布（正規分布）族に属します．いかに，いくつかの組み合わせのガウス分布（正規分布）を示すPythonのコードを示します．

In [1]:
import matplotlib.pyplot as plt
import numpy as np
from scipy import stats
import seaborn as sns
plt.style.use('seaborn-darkgrid')

mu_params = [-1, 0, 1]
sd_params = [0.5, 1, 1.5]
x = np.linspace(-7, 7, 100)
f, ax = plt.subplots(len(mu_params), len(sd_params), sharex = True, sharey = True)

for i in range(3):
    for j in range(3):
        mu = mu_params[i]
        sd = sd_params[j]
        y = stats.norm(mu, sd).pdf(x)
        ax[i, j].plot(x, y)
        ax[i, j].plot(0, 0, label = "$\\mu$ = {:3.2f}\n$\\sigma$ = {:3.2f}".format(mu, sd), alpha = 0)
        ax[i, j].legend(fontsize = 8)
        
    ax[2, 1].set_xlabel('$x$', fontsize = 14)
    ax[1, 0].set_ylabel('$pdf(x)$', fontsize = 14)
    plt.tight_layout()
    plt.savefig('img101.png')

上記のコードを実行すると，図（img101.png）が作成されます．

確率分布に由来する$x$のような一つの変数は，確率変数（random variable）と呼ばれます．その変数は任意の値をとることができるというわけではなく，確率分布による制約に支配されます．でたらめさ（randomness）はその変数がどのような値をとるのかを予測できないという事実から生じるのではなく，観測するそれらの値の確率から生じます．

パラメータ$\mu$と$\sigma$を持つガウス分布（正規分布）に従う変数は，一般に次のように表記されます．

$ x \sim N(\mu, \sigma)$

記号は「$\sim$に従って分布する」という意味です．