In [1]:
#  独立同一分布
# →互いに独立で同じ確率分布に従う多次元確率変数
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

np.random.seed(0)
%precision 3
%matplotlib inline

In [16]:
# 離散型確率変数に対するいくつかの関数を用意しておく
linestyles = ['-', '--', ':', '-.']

def E(XY, g):
    x_set, y_set, f_XY = XY
    return np.sum([g(x_i, y_j) * f_XY(x_i, y_j)
                  for x_i in x_set for y_j in y_set])

def Cov(XY):
    x_set, y_set, f_XY =XY
    mean_X = E(XY, lambda x, y: x)
    mean_Y = E(XY, lambda x, y: y)
    return np.sum([(x_i-mean_X) * (y_j-mean_Y) * f_XY(x_i, y_j)
                  for x_i in x_set for y_j in y_set])

def f_X(X):
    return np.sum([f_XY(x, y_k) for y_k in y_set])

def f_Y(y):
    return np.sum([f_XY(x_k, y) for x_k in x_set])

In [17]:
# n個の確率変数が互いに独立 = 同時確率が周辺確率の積と等しい
# 相関係数も複数の確率変数の関係性を表す指標である。
# しかし、無相関なとき = 互いに独立 は必ずしも成り立たない
# 逆に、互いに独立 = 無相関 は成り立つ
# つまり、独立の方が無相関より、より強い概念である

# 独立な確率変数としていかさまサイコロを考える
x_set = np.array([1, 2, 3, 4, 5, 6])
y_set = np.array([1, 2, 3, 4, 5, 6])

def f_XY(x, y):
    if x in x_set and y in y_set:
        return x*y / 441
    else:
        return 0
    
XY = [x_set, y_set, f_XY]

In [18]:
# この2次元確率変数X、Yは独立なので、無相関になっているはず
Cov(XY)

-8.326672684688674e-17