# 正規分布

確率密度関数

$$
f(x)=\dfrac{1}{\sqrt{2x}×xの標準偏差}e^{-\dfrac{1}{2}(\dfrac{x-xの平均}{xの標準偏差})~2}
$$

特徴

- 平均を中心に，左右対称である
- 平均と標準偏差の影響を受ける

「xは平均が〇〇で標準偏差が××の正規分布に従う」

### 正規分布に従うかどうかを調べるためには，Q-Qプロットを使うらしい．

- 点が直線の上に綺麗に並んでいると，正規分布に従っていると判断できる


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
import japanize_matplotlib 
from scipy.stats import norm


In [None]:
# 1. データの準備
np.random.seed(0)

# パターンA: 正規分布に従うデータ
data_normal = np.random.normal(loc=50, scale=10, size=100)

# パターンB: 正規分布ではないデータ
data_uniform = np.random.uniform(low=0, high=100, size=100)

In [None]:
# 2. グラフの描画
plt.figure(figsize=(12, 5))

# 左側: 正規分布データ
plt.subplot(1, 2, 1)
# stats.probplot(データ, dist="norm", plot=plt) で描画できます
stats.probplot(data_normal, dist="norm", plot=plt)
plt.title("パターンA: 正規分布のデータ")
plt.xlabel("理論上の分位数")
plt.ylabel("実際のデータ値")
plt.grid(True)

# 右側: 正規分布ではない
plt.subplot(1, 2, 2)
stats.probplot(data_uniform, dist="norm", plot=plt)
plt.title("パターンB: 正規分布ではないデータ")
plt.xlabel("理論上の分位数")
plt.ylabel("実際のデータ値")
plt.grid(True)

plt.tight_layout()
plt.show()

In [None]:
# 1. データの準備
np.random.seed(42)
data = np.random.normal(loc=50, scale=10, size=1000)  # 平均50, 標準偏差10のデータ

# 2. データからパラメータ（平均と標準偏差）を推定する
mu, std = norm.fit(data)

# 3. グラフの設定
plt.figure(figsize=(10, 6))

# ヒストグラム
plt.hist(data, bins=30, density=True, alpha=0.6, color='skyblue', label='実際のデータ(ヒストグラム)')

# 正規分布曲線（理論値)
# グラフの横軸の範囲を決める（データの最小値〜最大値）
xmin, xmax = plt.xlim()
x = np.linspace(xmin, xmax, 100)

# そのxに対応する確率密度(y)を計算
p = norm.pdf(x, mu, std)

# 曲線をプロット
plt.plot(x, p, 'r', linewidth=2, label=f'正規分布曲線 (平均={mu:.2f}, SD={std:.2f})')

# 4. 装飾
plt.title('データの分布と正規分布曲線の重ね合わせ')
plt.xlabel('値')
plt.ylabel('確率密度')
plt.legend()
plt.grid(True, alpha=0.5)

plt.show()