# Independtly and identically distributed
- 서로 독립이고 각각 동일한 확률 분포를 따르는 다차원 확률변수
- 동일한 조건 아래에서 수행되는 실험이나 관측을 여러번 반복하여 데이터를 얻는 것

In [3]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

np.random.seed(0)
%precision 3
%matplotlib inline

In [4]:
linestyles = ['-', '--', ':', '-.']

def E(XY, g):
    x_set, y_set, f_XY = XY
    return np.sum([g(x_i, y_j) * f_XY(x_i, y_j)
                   for x_i in x_set for y_j in y_set])

def Cov(XY):
    x_set, y_set, f_XY = XY
    mean_X = E(XY, lambda x, y: x)
    mean_Y = E(XY, lambda x, y: y)
    return np.sum([(x_i-mean_X) * (y_j-mean_Y) * f_XY(x_i, y_j)
                    for x_i in x_set for y_j in y_set])

def f_X(x):
    return np.sum([f_XY(x, y_k) for y_k in y_set])

def f_Y(y):
    return np.sum([f_XY(x_k, y) for x_k in x_set])

# 9.1 Independence

### 9.1.2 Independence and 무상관성 
- 독립 -> 무상관 ( 100 % ) 독립이 조금 더 강한 개념이다
- 무상관 -> 독립 ( 100 % x )

##
두 확률 변수 사이에 선형 관계가 없더라도 서로 영향을 끼치는 경우가 있다 ⭐️

In [5]:
x_set = np.array([1,2,3,4,5,6])
y_set = np.array([1, 2, 3, 4, 5, 6])

def f_XY(x, y):
    if x in x_set and y in y_set :
        return x * y / 441
    else :
        return 0

XY = [x_set, y_set, f_XY]

In [None]:
Cov(XY) # no related 

-0.000

In [8]:
x_set = np.array([0, 1])
y_set = np.array([-1, 0, 1])

def f_XY(x, y) :
    if (x, y) in [(0, 0), (1, 1), (1, -1)]:
        return 1 / 3
    else :
        return 0
    
XY = [x_set, y_set, f_XY]

In [None]:
Cov(XY) # no related 

0.000

In [12]:
f_X(0) * f_Y(0), f_XY(0, 0)

# not equal -> not strong independence

(0.111, 0.333)

## 9.2 Distribution of sum
- 서로 독립이고 동일한 확률 분포를 따르는 확률변수 X1, X2, ...의 합이 따르는 확률 분포를 말함

- 기댓값은 선형성이 성립한다. 선형성을 n차원으로 확장 하면 E(X1,+ X2+ ... Xn) = E(X1) + E(X2)