# 期待値

結果に数値をとる試行について，繰り返し試行した結果の平均値が収束する値を期待値と言います．  
繰り返しの試行結果を $r_1,r_2,\cdots$ としたとき，期待値は次のようになります．

> $$ \frac{r_1+r_2+\cdots+r_k}{k} \ \xrightarrow{k{\rightarrow}{\infty}} \ \text{期待値} $$

この条件を確率論の言葉によって定義します．

## 確率変数

ある変量 $x$ の取りうる値を $x_1,x_2,\cdots,x_m$ とします．
夫々の値の出る確率 $P_i=P(x_i)$ が与えら有れているものとします．
このとき，この変量に対する試行を $X$ と書き，確率変数と言います．

## 期待値の定義

ある確率変数 $X$ が $x_1,x_2,\cdots,x_m$ の有限個の値をとり得るとします．
そして，$x_i$ が出る確率を $P_i$ とします．
このとき次の式で定義される値 $E(X)$ を期待値と言います．

> $$ E(X) = \sum_{i=1}^{m}x_iP_i $$

確率変数の取りうる値が実数の連続値の場合，期待値は積分を用いた定義となります．  
変数 $x \in \mathbb{R}$ の確率密度関数を $p(x)$ とすると，
$p(x) \ge 0$ であり，$\int_{-\infty}^{\infty}p(x)dx=1$の条件が成り立ちます．
この場合の期待値は次の式になります．

> $$ E(X) = \int_{-\infty}^{\infty}xp(x)dx $$

### 期待値の例：サイコロ

期待値は確率論における平均値と考えられることをサイコロの例で示します．

|index|1|2|3|4|5|6|
|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
|**サイコロの目** $x_i$| $1$ | $2$ | $3$ | $4$ | $5$ | $6$ |
|**確率** $P_i$ |$\frac{1}{6}$|$\frac{1}{6}$|$\frac{1}{6}$|$\frac{1}{6}$|$\frac{1}{6}$|$\frac{1}{6}$|

この期待値を計算すると

$$ 
\begin{eqnarray}
E(X)
&=& 1\times\frac{1}{6}+2\times\frac{1}{6}+3\times\frac{1}{6}+4\times\frac{1}{6}+5\times\frac{1}{6}+6\times\frac{1}{6} \\
&=& \frac{1+2+3+4+5+6}{6} \\
&=& 3.5
\end{eqnarray}
$$

このように期待値の計算式がサイコロの目の平均値に一致します．
実際にサイコロを何度も振ると，出た目の平均値は3.5に近づいていきます．

*****
## 数値の有限の集まりから数値を取り出す期待値

有限個の数値の集まりを$x_1,x_2,\cdots,x_n$とします．
この集まりから1つの数値をランダムに取り出す試行を確率変数$X$で表すことにします．
このとき，確率変数の期待値は母集団の平均値 $\mu$ に一致します．

> $$ E(X) = \mu $$

### 解説

箱の中に $n$個の玉が入っていて，それぞれの玉には数字が記載されています．
ランダムサンプリングによって夫々の玉が取り出される確率は$\frac{1}{n}$です．

玉に記載されている数値は，$x_1,x_2,\cdots,x_m$ の $m$個の値として，数値$x_i$が記載されている玉の個数を $k_i$個とします．
このとき，取り出された数値が$x_i$である確率$P_i$は加法定理によって，$P_i=k_i\frac{1}{n}=\frac{k_i}{n}$です．

箱の中は下図のようになっています．
![玉の集まり](./images/ball_set.jpg)

ここで $n$個の数値を別の変数で $y_1,y_2,\cdots,y_n$ と表すと，
この集まりは $k_1$個の$x_1$，$k_2$個の$x_2$，… $k_m$個の$x_m$ の集まりと対応します．
したがって，次の式が成立します．

$$ \sum_{i=1}^{m}k_ix_i = \sum_{j=1}^{n}y_j $$

したがって，$n$個の数値から $1$個の数値をランダムに取り出すときに出る数値を確率変数$X$とすると，
期待値$E(X)$は次式のように計算できます．

$$ 
\begin{eqnarray}
E(X)
&=& \sum_{i=1}^{m}x_iP_i \\
&=& \sum_{i=1}^{m}x_i\frac{k_i}{n} \\
&=& \frac{1}{n}\sum_{i=1}^{m}k_ix_i \\
&=& \frac{1}{n}\sum_{j=1}^{n}y_i \\
&=& \mu \\
\end{eqnarray}
$$

すなわち，数値を1つ取り出す試行の期待値は母集団の平均値に一致します．

*****
## 期待値の公式

確率変数 $X$ と $Y$ および定数 $c$ について，次の式が成り立ちます．

- $E(c) = c$
- $E(cX) = cE(X)$
- $E(X+Y) = E(X)+E(Y)$


### $E(c)=c$ の証明

常に定数$c$が発生するので，その確率$P_c$は$P_c=1$ となります．
定義により，

$$E(c)= \sum cP_c = c{\cdot}1 = c$$

### $E(cX)=cE(X)$ の証明

確率変数$X$の取りうる値を $x_1,x_2,\cdots,x_n$ とし，
その確率を $P_1,P_2,\cdots,P_n$ とします．

$$ E(cX) = \sum_{i=1}^{n}(cx_i)P_i = c\sum_{i=1}^{n}c_iP_i = cE(X) $$

### $E(X+Y)=E(X)+E(Y)$ の証明

2つの母集団から数値を1つずつランダムに選択したとき，
合計値の期待値が各々の期待値の合計になることを示しています．

確率変数$X$の値の取りうる値を $x_1,x_2,\cdots,x_n$ とし，
確率変数$Y$の値の取りうる値を $y_1,y_2,\cdots,y_m$ とします．

確率変数$X$の値が $x_i$ であり，確率変数$Y$の値が $y_j$ となる確率を $P_{ij}$ とします．
このとき期待値は次の式で表せます．

$$
\begin{eqnarray}
E(X+Y)
&=& \sum_{x_i,y_j}(x_i+y_j)P_{ij} \\
&=& \sum_{i=1}^{n}\sum_{j=1}^{m}(x_iP_{ij}+y_jP_{ij}) \\
&=& \sum_{i=1}^{n}x_i\sum_{j=1}^{m}P_{ij} + \sum_{j=1}^{m}y_j\sum_{i=1}^{n}P_{ij} \\
\end{eqnarray}
$$

ここで，$\sum_{j=1}^{m}P_{ij}=P(x_i)$，および $\sum_{i=1}^{n}P_{ij}=P(y_j)$ が成り立つので，

$$ 
\begin{eqnarray}
E(X+Y)
&=& \sum_{i=1}^{n}x_iP(x_i) + \sum_{j=1}^{m}y_jP(y_j) \\
&=& E(X) + E(Y) \\
\end{eqnarray}
$$

*****
## 分散

確率変数 $X$ の期待値を $\mu$ としたとき，

> $$ V(X) = E\left((X-\mu)^2\right) $$

を確率変数 $X$ の分散といいます．

*****
## 分散の公式

確率変数 $X$ と $Y$ および定数 $c$ について，次の式が成り立ちます．

- $V(c)=0$
- $V(X+c)=V(X)$
- $V(cX)=c^2V(X)$
- $V(X+Y)=V(X)+V(Y)+2\text{Cov}(X,Y)$

ここで，$\text{Cov}(X,Y)=E\left((X-\mu_x)(Y-\mu_y)\right)$ です．
この値を $X$ と $Y$ の共分散と言います．

### $V(c)=0$ の証明

確率変数が常に定数 $c$ になるため，期待値は $\mu=c$ となります．
したがって定義により，

$$ 
V(c) = E\left((c-\mu)^2\right) = E\left((c-c)^2\right) = E(0) = 0
$$

となります．

### $V(X+c)=V(X)$ の証明

確率変数 $X$ の期待値を $\mu$ とすると，$X+c$ の期待値は $\mu+c$ となります．
したがって，定義により，

$$ 
V(X+c) = E\left(\{(X+c)-(\mu+c)\}^2\right) = E\left((X-\mu)^2\right) = V(X)
$$

となります．

### $V(cX)=c^2V(X)$ の証明

確率変数 $X$ の期待値を $\mu$ とすると，$cX$ の期待値は $c\mu$ となります．
したがって，定義により，

$$ 
V(cX) = E\left(\{cX-c\mu\}^2\right) = E\left(c^2(X-\mu)^2\right) = c^2E\left((X-\mu)^2\right) = c^2V(X)
$$

となります．

### $V(X+Y)=V(X)+V(Y)+2E\left((X-\mu_x)(Y-\mu_y)\right)$ の証明

確率変数 $X$ の期待値を $\mu_x$ とし，確率変数 $Y$ の期待値を $\mu_y$ とします．
定義に従って，$V(X+Y)$ を計算します．

$$
\begin{eqnarray}
V(X+Y)
&=& E\left(\{(X+Y)-(\mu_x+\mu_y)\}^2\right) \\
&=& E\left(\{(X-\mu_x)+(Y-\mu_y)\}^2\right) \\
&=& E\left( \{(X-\mu_x)^2 + (Y-\mu_y)^2 + 2(X-\mu_x)(Y-\mu_y)\} \right) \\
&=& E\left((X-\mu_x)^2\right) + E\left((Y-\mu_y)^2\right) + 2E\left((X-\mu_x)(Y-\mu_y)\right) \\
&=& V(X)+V(Y)+\text{Cov}(X,Y) \\
\end{eqnarray}
$$

*****
## 独立事象の共分散

確率変数 $X$ と $Y$ が独立の場合，共分散の値はゼロになります．

> $$ \text{Cov}(X,Y) = 0 $$

確率変数 $X$ と $Y$ が独立であるという事は，$X=x_i \land Y=y_j$となる確率がそれぞれの確率の積で表せることでした．
すなわち，次の式が成り立ちます．

$$ P(X=x_i \land Y=y_j) = P(X=x_i)P(Y=y_j) $$

この場合の共分散を計算します．

$$
\begin{eqnarray}
\text{Cov}(X,Y)
&=& E\left( (X-\mu_x)(Y-\mu_y) \right) \\
&=& \sum_{i,j}^{}(x_i-\mu_x)(y_j-\mu_y)P(x_i{\land}y_j) \\
&=& \sum_{i=1}^{n}\sum_{j=1}^{m}(x_i-\mu_x)(y_j-\mu_y)P(x_i)P(y_j) \\
&=& \left\{\sum_{i=1}^{n}(x_i-\mu_x)P(x_i)\right\} \left\{\sum_{j=1}^{m}(y_j-\mu_y)P(y_j)\right\} \\
&=& \left\{\sum_{i=1}^{n}x_iP(x_i)-\mu_x\sum_{i=1}^{n}P(x_i)\right\} 
\left\{\sum_{j=1}^{m}y_jP(y_j)-\mu_y\sum_{j=1}^{m}P(y_j)\right\} \\
&=& (\mu_x-\mu_x)(\mu_y-\mu_y) \\
&=& 0
\end{eqnarray}
$$

*****