<a href="https://colab.research.google.com/github/SY-256/anomaly_detection/blob/main/notebook/chapter4_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Pythonによる確率分布の実装

## 正規分布

In [None]:
# 正規分布の確率密度関数の出力
import numpy as np
from scipy import stats

x = np.linspace(-3.5, 3.5, 200)
MU = 0 # 平均パラメータ
SIGMA = 1 # 標準偏差パラメータ
px = stats.norm.pdf(x, loc=MU, scale=SIGMA) # 確率密度関数を出力

In [None]:
import matplotlib.pyplot as plt
# 正規分布の可視化

# 確率密度関数をプロットする関数
def plot_pdf(x, px, title, params):
    plt.plot(x, px)
    plt.title(f'{title} ({", ".join([f"{k}={v}" for k, v in params.items()])})')
    plt.xlabel("x")
    plt.ylabel("Probability Density")
    plt.show()

plot_pdf(x, px, "Normal Distribution", params={"mu": MU, "sigma": SIGMA})

## 対数正規分布

In [None]:
MU = 0
SIGMA = 1
LOC = 0 # x軸方向のオフセット
# 描画するx軸用のデータ生成（0~5の範囲の実数）
x = np.linspace(0, 5, 200)
# 確率密度関数を出力
px = stats.lognorm.pdf(x, s=SIGMA, scale=np.exp(MU), loc=LOC)

# プロット
plot_pdf(x, px, "Log-Normal Distribution", params={"mu": MU, "sigma": SIGMA, "loc": LOC})

## カイ二乗分布

In [None]:
x = np.linspace(0, 20, 200)

DF = 4 # 自由度パラメータk
# 確率密度関数を出力
px = stats.chi2.pdf(x, df=DF)

# プロット
plot_pdf(x, px, "Chi-Squared Distribution", params={"df": DF})

## スチューデントのt分布

In [None]:
x = np.linspace(-3.5, 3.5, 200)

DF = 2 # 自由度パラメータk
SCALE = 1 # x軸方向の拡大倍率
LOC = 0 # x軸方向のオフセット
# 確率密度関数を出力
px = stats.t.pdf(x, df=DF, scale=SCALE, loc=LOC)

# プロット
plot_pdf(x, px, "Student\'s t Distribution", params={"df": DF, "scale": SCALE, "loc": LOC})

## 二項分布

In [None]:
# 確率質量関数をプロットする関数
def plot_pmf(x, px, title, params):
    plt.stem(x, px, basefmt="grey")
    plt.title(f'{title} ({", ".join([f"{k}={v}" for k, v in params.items()])})')
    plt.xlabel("x")
    plt.ylabel("Probability Mass")
    plt.show()

N = 10 # 試行回数
MU = 0.5 # 発生率パラメータμ
# 描画するx軸用データの生成（0~Nの範囲内の整数）
x = np.arange(N+1)
# 確率質量関数を出力
px = stats.binom.pmf(x, n=N, p=MU)

# プロット
plot_pmf(x, px, "Binomial Distribution", params={"n": N, "p": MU})

## ポアソン分布

In [None]:
MU = 5 # 期待発生回数パラメータμ
x = np.arange(3*MU + 1) # 0~3MUの範囲内でデータ生成
# 確率質量関数を出力
px = stats.poisson.pmf(x, mu=MU)

# プロット
plot_pmf(x, px, "Poisson Distribution", params={"mu": MU})

## 指数分布

In [None]:
x = np.linspace(0, 10, 200) # 0~10の範囲の実数

LAMBDA = 0.5 # 平均間隔パラメータλ
# 確率密度関数を出力
px = stats.expon.pdf(x, scale=1/LAMBDA)

# プロット
plot_pdf(x, px, "Exponential Distribution", params={"lambda": LAMBDA})

## ガンマ分布

In [None]:
x = np.linspace(0, 20, 200)

K = 3 # 形状母数パラメータk
THETA = 2 # 尺度母数パラメータθ
# 確率密度関数を出力
px = stats.gamma.pdf(x, a=K, scale=THETA)

# プロット
plot_pdf(x, px, "Gamma Distribution", params={"k": K, "theta": THETA})