# 分散と標準偏差
分散と標準偏差は、それぞれデータ特徴を把握するために使用する値の1つです。  
どちらも、データの散らばり具合を表します。

### 分散とは？

分散は、以下の式の$V$で表されます。

$$V=\frac{1}{n}\sum_{k=1}^n (x_k-\mu)^2$$

この式において、$n$は値の数、$x_k$は値、$\mu$は平均値です。  
平均値との差を2乗し、平均をとっています。  

例えば、Aさんの体重が55kg、Bさんは45kg、Cさんは60kg、Dさんが40kgであれば分散は以下ように求めます。

$$\mu = \frac{55+45+60+40}{4}=50(kg)$$

$$V=\frac{(55-50)^2+(45-50)^2+(60-50)^2+(40-50)^2}{4}=62.5(kg^2)$$

次に、Aさんの体重が51kg、Bさんは49kg、Cさんは52kg、Dさんが48kgのケースで分散を求めます。  
このケースでは、全体的に値のばらつきが小さくなっています。  

$$\mu = \frac{51+49+52+48}{4}=50(kg)$$

$$V=\frac{(51-50)^2+(49-50)^2+(52-50)^2+(48-50)^2}{4}=2.5 (kg^2)$$

こちらのケースの方が分散が小さくなりました。

以上のように、分散は値のばらつき具合を表す指標です。

### 分散を実装
NumPyのvar関数で、分散を求めることができます。  

In [None]:
import numpy as np

x = np.array([55, 45, 60, 40])  # 分散をとるデータ



### 標準偏差とは？

標準偏差は、以下のように分散の平方根により求めます。

$$\sigma = \sqrt V=\sqrt{\frac{1}{n}\sum_{k=1}^n (x_k-\mu)^2}$$

例えば、Aさんの体重が55kg、Bさんは45kg、Cさんは60kg、Dさんが40kgであれば標準偏差は以下ように求めます。

$$\mu = \frac{55+45+60+40}{4}=50 (kg)$$

$$\sigma=\sqrt{\frac{(55-50)^2+(45-50)^2+(60-50)^2+(40-50)^2}{4}}\fallingdotseq7.91 (kg
)$$

標準偏差も、分散と同様に値のばらつき具合の指標です。  
標準偏差は単位の次元が元の値と同じなので、値の散らばり具合を直感的に表現する際には標準偏差が適している場合が多いです。

### 標準偏差を実装
標準偏差は、Numpyのstd関数を用いて求めることができます。

In [None]:
import numpy as np

x = np.array([55, 45, 60, 40])  # 標準偏差をとるデータ



### 演習:
以下のセルにおける、配列`x`の分散と標準偏差を求めましょう。

In [None]:
import numpy as np

x = np.array([51, 49, 52, 48])  # 分散と標準偏差をとるデータ

