# 正規分布
正規分布は、最もよく使われるデータ分布です。人工知能でも、様々な場面で正規分布は活躍します。

### 正規分布とは？

正規分布（normal distribution）はガウス分布（Gaussian distribution）とも呼ばれ、自然界や人間の行動・性質など様々な現象に対してよく当てはまるデータの分布です。  
例えば、製品のサイズやヒトの身長、テストの成績などは正規分布におおよそ従います。  
正規分布は、以下のような釣鐘型のグラフで表されます。

<img src="images/normal.png">

このグラフにおいて、横軸はある値を、縦軸はその値の頻度や確率を表します。  
$\mu$は平均値で分布の中央になり、$\sigma$は標準偏差で分布の広がり具合を表します。  

正規分布は、以下の確率密度関数と呼ばれる関数で表されます。  

$$ y=\frac{1}{ \sigma\sqrt{2\pi}}\exp(-\frac{(x-\mu)^2}{2\sigma ^2}) $$ 

少々複雑な式ですが、平均が0、標準偏差が1とすると次の比較的シンプルな形になります。

$$ y=\frac{1}{\sqrt{2\pi}}\exp(-\frac{x^2}{2}) $$ 

### 正規分布の描画
確率密度関数を使って、正規分布を描画しましょう。  

In [None]:
import numpy as np
import matplotlib.pyplot as plt
 
sigma = 1  # 標準偏差
mu = 0  # 平均値

x =np.linspace(-5, 5)
  # 確率密度関数

plt.plot(x, y)
plt.show()

### 乱数による正規分布
Numpyの`random.normal`関数を使って、正規分布に従う乱数を生成します。  
生成したデータは、Matplotlibのhist関数でヒストグラムとして表示します。  

In [None]:
import numpy as np
import matplotlib.pyplot as plt
 
# 正規分布に従う乱数を生成 平均0、標準偏差1、10000個


# ヒストグラム
plt.hist(x, bins=25)  # binsは棒の数
plt.show()

人工知能の一種、ニューラルネトワークは多くの変動するパラメータを持っていますが、これらのパラメータの初期値は、しばしば正規分布に従ってランダムに決定されます。

### 演習:
以下のセルを補完して平均値が0、標準偏差が1の乱数を1000個作成し、ヒストグラムで分布を描画しましょう。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
 
# 平均0、標準偏差1、1000個


# ヒストグラム
plt.hist(x, bins=25)
plt.show()