# 事象と確率について

事象$A$の確率を$P(A)$もしくは$Pr(A)$とあらわす。  
$A$の余事象とは「Aが起きない確率」のことをあらわす。  
事象$A,B$に対して「$A,B$の両方が起きること」を$A,B$の積事象、「$A,B$の少なくとも一方が起きること」を$A,B$の和事象という。  
$A,B$が背反でない場合には、$P(A \cap B)=P(A)+P(B)-P(A \cup B)$が成立する。これを**包除原理**という。

# 条件付き確率とベイズの定理について

$A$が起きたという条件のもとで$B$が起きる条件付き確率$P(B|A)$を
$$  
P(B|A) = \frac{P(A \cap B)}{P(A)}
$$
と定義する。ただし$P(A)>0$とする。分母を払うと
$$
P(A \cap B)=P(A) \times P(B|A)
$$
と書けるが、これは$P(A \cap B)$をまず$A$が起きる確率を考え、次に$A$が起きたもとで$B$がさらに起きる確率を掛ける、ということを意味する。  
また、事象A,Bが**独立**であることを$P(A \cap B) = P(A) \times P(B)$が成立することと定義する。  

条件付き確率において$A$と$B$の順序を変えると、$P(A \cap B)=P(B) \times P(A|B)$と書けるが、これは以下の**ベイズの定理**に対応している。  
$P(A) \times P(B|A) = P(B) \times P(A|B)$より
$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)} = \frac{P(B|A)P(A)}{P(B|A)P(A) + P(B|A^c)P(A^c)}
$$
と書くことができる。また$P(A)$を$A$の**事前確率**、$P(A|B)$を**事後確率**という。

# 期待値と分散について

サイコロの目や明日の気温などランダムに変動する変数を**確率変数**とよぶ。  
確率変数を$X$、$X$の取りうる値を$x$とするとき、$X$が値$x$をとる確率$P(X=x)$を
$$
p(x) = P(X=x)
$$
と表し**確率関数**と呼ぶ。  
$X$の**期待値**(あるいは平均値)$E[X]$は
$$
\mu = E[X] = \sum_{x} x p(x)
$$
で定義される。ただし右辺の和はとりうるすべての値$x$に関する和である。  
$X$の関数$g(X)$の期待値は
$$
E[g(X)] = \sum_{x} g(x) p(x)
$$
で定義される。特に$g(x) = (x - \mu)^2$を偏差の2乗として、$X$の**分散**は
$$
\sigma^2 = V[X] = E[(X - \mu)^2] = \sum_{x} (x - \mu)^2 p(x)
$$
である。$(X-\mu)^2 = X^2-2X\mu+\mu^2$と展開してから$p(x)$をかけて和をとれば
$$
V[X] = E[X^2] - \mu^2
$$
が成り立つことがわかる。

In [1]:
# 期待値と分散を計算
import statistics

x = [1,2,3,4,5,6] # 確率変数
p_x = [1/6, 1/6, 1/6, 1/6, 1/6, 1/6] # 確率関数
e_x =  0

for i in range(len(x)):
   e_x += x[i]*p_x[i]
print("期待値：{}".format(e_x))

# 分散
x_mean = statistics.mean(x)
v_x = 0

for i in range(len(x)):
   v_x += ((x[i]-x_mean)**2)*p_x[i]
print("分散：{:.3f}".format(v_x))

# 分散は以下の式でも求めることができる
# V[x]=E[X**2]-E[X]**2
e_x2 = 0
for i in range(len(x)):
   e_x2 += x[i]*x[i]*p_x[i]
v_x = e_x2 - x_mean**2
print("分散2：{:.3f}".format(v_x))

期待値：3.5
分散：2.917
分散2：2.917


分散と分散2出値が一致することが確認できる