# Scipyのstatsの使い方
https://docs.scipy.org/doc/scipy/reference/stats.html

In [None]:
# -*- coding: utf-8 -*-
import numpy as np
import scipy.stats as stats

import matplotlib.pyplot as plt
%matplotlib inline

## 正規分布を知る
scipy.stats.norm https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html<br>
$$   
f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}}  \exp\left\{ - \frac{ (x-\mu)^2 }{ 2 \sigma^2} \right\}
$$
この正規分布に従う確率変数のヒストグラム，pdf, cdfをプロットする。

In [None]:
np.random.seed(123)

m, std = 5, 2   # mean,standard deviation
x = np.arange( -5, 15, 0.01)
rvs = stats.norm.rvs(loc=m, scale=std, size=1000)
pdf = stats.norm.pdf(x, loc=m, scale=std)
cdf = stats.norm.cdf(x, loc=m, scale=std)
print('mean=',rvs.mean(),'  std=',rvs.std())

fig, ax = plt.subplots(ncols=2, figsize=(12,4))
ax[0].plot(x, pdf, color='k', label='pdf')
ax[0].hist(rvs, bins=40, density=True, label='rvs', color='lightgray')
ax[0].set_xlabel('x')
ax[0].set_ylabel('probabiity density')
ax[0].legend()
ax[0].grid()

ax[1].plot(x, pdf, color='k', label='pdf')
ax[1].plot(x, cdf, color='r', label='cdf')
ax[1].set_xlabel('x')
ax[1].set_ylabel('probabiity density')
ax[1].legend()
ax[1].grid()

#plt.savefig('fig_NC_Prob_Normal.pdf', bbox_inches='tight')
plt.show()

上の左図：pdfと多数生成した確率変数のヒストグラム，　右図：pdfとcdfのプロット，ある$x$でのcdfの値は確率を意味する。これは，$[-\infty, x]$のpdfの面積と等しい。

メソッドintervalは，指定した確率（alpha）に対応する値の範囲[lower, upper]を返す

In [None]:
lower, upper = stats.norm.interval(alpha=0.95, loc=0, scale=1)
print(lower, upper)

上記のalphaと[lower, upper]の検証を行う。このため，上記のcdfを用いる。<br>
upperの点のcdf値は,[$-\infty$, upper]のpdfの面積，すなわち確率を表す。<br>
lopwerに関しても同様である。よって，下記のようにpa$-$pabは上記のalphaを表す。
すなわち，下記の計算は上記の逆を行っている。

## 他の確率分布

#### 二項分布
成功確率$p=0.5$の硬貨を3回投げるときの確率分布を求める。

In [None]:
n = 3
k = np.arange(0,n+1) #各成功回数
pmf = stats.binom.pmf(k, n, p=0.5)
pmf

サイコロを8回振るとき，2以下の目の出た回数を$X$とするとき，$P(X \ge 3)$の値を求める。

In [None]:
n = 8
k = np.arange(0,n+1) #各成功回数
prob = stats.binom.pmf(k, n, p=2/6)
print(prob)
sol =  1-(prob[0]+prob[1]+prob[2])
print(sol)

#### ポアソン分布
ある都市の交通事故は1日平均2.4件ある。1日に起こる交通事故の件数がポアソン分布に従うと仮定したとき，1日の交通事故が2件以下になる確率を求める。

In [None]:
lamda = 2.4
k = np.arange(0,3)
prob = stats.poisson.pmf(k, lamda)
print(prob)
print(prob.sum())

確率分布は離散確率であるから確率質量関数（pmf）となる。ポアソン分布の例を示す。

In [None]:
fig, ax = plt.subplots(figsize=(8,3))

x = np.arange(0, 11, 1)
for lam in range(1, 6):
    pmf = stats.poisson.pmf(x, lam)
    plt.plot(x, pmf, marker='o', label='lamda='+str(lam))

plt.legend()
plt.grid()

#plt.savefig('fig_NC_Prob_Poisson.png')
plt.show()