# 平均値と期待値
平均値と期待値は、それぞれデータ特徴を把握するために使用する値の1つです。  
実は、平均値と期待値は同じものを指しています。

### 平均値とは？

**平均値**は、複数の値を足し合わせて値の数で割って求めます。  
以下は、$n$個の値の平均を求める式です。  

$$ \begin{aligned} \\
\mu &= \frac{x_1 + x_2 + \cdots + x_n}{n} \\
&= \frac{1}{n}\sum_{k=1}^n x_k
\end{aligned} $$

例えば、Aさんの体重が55kg、Bさんは45kg、Cさんは60kg、Dさんが40kgであれば、4人の平均体重は以下の通りになります。

$$\frac{55 + 45 + 60 + 40}{4} = 50(kg)$$

平均値は、複数の値からなるデータを代表する値の1つです。

### 平均値を実装
NumPyのaverage関数で、平均値を求めることができます。  

In [None]:
import numpy as np

x = np.array([55, 45, 60, 40])  # 平均をとるデータ



### 期待値とは？

試行により、次の値のうちいずれかが得られるものとします。

$$x_1,x_2,\cdots ,x_n$$

そして、それぞれの値は次の確率で得られるものとします。

$$P_1,P_2,\cdots ,P_n$$

このとき、以下のように表される値$E$を、**期待値**といいます。

$$E=\sum_{k=1}^n P_kx_k$$

期待値とは、大まかに言って得られる値の「見込み」のことです。  
例えば、くじを引いて80%の確率で100円が、15%の確率で500円が、5%の確率で1000円が当たるとき、期待値は以下の通りになります。

$$ \begin{aligned} \\
E &= 0.8\times 100 + 0.15\times 500 + 0.05\times 1000\\
&= 205
\end{aligned} $$

従って、このくじの期待値は205円であり、くじを引くことで205円程度の収益が見込まれることになります。

### 期待値を実装
期待値は、Numpyのsum関数を用いて実装することができます。

In [None]:
import numpy as np

p = np.array([0.8, 0.15, 0.05])  # 確率
x = np.array([100, 500, 1000])  # 値



### 平均値と期待値の関係

値が重複する場合の平均値は、以下のように表すことができます。

（式 1）
$$ \frac{1}{n}\sum_{k=1}^m n_kx_k $$

この式で、$n_k$は$x_k$の個数で、$m$は値の種類の数です。
$n_k$は以下の関係を満たしています。

$$\sum_{k=1}^m n_k= n$$

（式 1）を次のように変形します。

$$ \sum_{k=1}^m \frac{n_k}{n}x_k $$

ここで、$\frac{n_k}{n}$はその値が選択される確率と考えることができるので、$P_k$とおきます。
このとき、上記の式は次のようになります。

$$ \sum_{k=1}^m P_k x_k $$

期待値の式と同じになりましたね。  
このように、実は平均値と期待値は同じものを意味しています。

人工知能関連の書籍などでは、平均値と期待値が同じ意味で使われることがあるので注意しましょう。

### 演習:
以下のセルで、配列`p`は確率、配列`x`は確率`p`で得られる値とします。  
この場合の期待値を計算しましょう。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

p = np.array([0.75, 0.23, 0.02])  # 確率
x = np.array([100, 500, 10000])  # 値

  # 期待値